intel
diff --git a/‎README.md
+29-17 b/‎README.md
+29-17
diff --git a/‎docker/Dockerfile.prebuilt
+4-4 b/‎docker/Dockerfile.prebuilt
+4-4
diff --git a/‎docs/_static/htmls/tbl_deepspeed.html
+124 b/‎docs/_static/htmls/tbl_deepspeed.html
+124
@@ -16,23 +16,35 @@ In the current technological landscape, Generative AI (GenAI) workloads and mode
 
 ### Optimized Model List
 
-| MODEL FAMILY | Verified <MODEL ID> (Huggingface hub)| FP32/BF16 | Weight only quantzation INT8 | Weight only quantization INT4| Static quantization INT8 |
-|---|:---:|:---:|:---:|:---:|:---:|
-|LLAMA| "meta-llama/Llama-2-7b-hf", "meta-llama/Llama-2-13b-hf", "meta-llama/Llama-2-70b-hf" | ✅ | ✅ | ✅ | ✅ | 
-|GPT-J| "EleutherAI/gpt-j-6b" | ✅ | ✅ | ✅ | ✅ | 
-|GPT-NEOX| "EleutherAI/gpt-neox-20b", "databricks/dolly-v2-12b" | ✅ | ✅ | ✅ | ✅ | 
-|FALCON|"tiiuae/falcon-40b" | ✅ | ✅ |  ✅ | ✅ | 
-|OPT|"facebook/opt-30b", "facebook/opt-1.3b"| ✅ | ✅ |  ✅ | ✅ | 
-|Bloom|"bigscience/bloom", "bigscience/bloom-1b7"| ✅ | ✅ |  ✅ | ✅ |
-|CodeGen|"Salesforce/codegen-2B-multi"| ✅ | ✅ |  ✅ | ✅ |
-|Baichuan|"baichuan-inc/Baichuan2-13B-Chat", "baichuan-inc/Baichuan2-7B-Chat", "baichuan-inc/Baichuan-13B-Chat"| ✅ | ✅ |  ✅ | ✅ |
-|ChatGLM|"THUDM/chatglm3-6b", "THUDM/chatglm2-6b"| ✅ | ✅ |  ✅ | ✅ |
-|GPTBigCode|"bigcode/starcoder"| ✅ | ✅ |  ✅ | ✅ |
-|T5|"google/flan-t5-xl"| ✅ | ✅ |  ✅ | ✅ |
-|Mistral|"mistralai/Mistral-7B-v0.1"| ✅ | ✅ |  ✅ | ✅ |
-|MPT|"mosaicml/mpt-7b"| ✅ | ✅ |  ✅ | ✅ |
-
-*Note*: The above verified models (including other models in the same model family, like "codellama/CodeLlama-7b-hf" from LLAMA family) are well supported with all optimizations like indirect access KV cache, fused ROPE, and prepacked TPP Linear (fp32/bf16). For other LLM model families, we are working in progress to cover those optimizations, which will expand the model list above.
+| MODEL FAMILY | MODEL NAME (Huggingface hub) | FP32 | BF16 | Static quantization INT8 | Weight only quantization INT8 | Weight only quantization INT4 |
+|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
+|LLAMA| meta-llama/Llama-2-7b-hf | 🟩 | 🟩 | 🟩 | 🟩 | 🟨 |
+|LLAMA| meta-llama/Llama-2-13b-hf | 🟩 | 🟩 | 🟩 | 🟩 | 🟨 |
+|LLAMA| meta-llama/Llama-2-70b-hf | 🟩 | 🟩 | 🟩 | 🟩 | 🟨 |
+|GPT-J| EleutherAI/gpt-j-6b | 🟩 | 🟩 | 🟩 | 🟩 | 🟩 |
+|GPT-NEOX| EleutherAI/gpt-neox-20b | 🟩 | 🟨 | 🟨 | 🟩 | 🟨 |
+|DOLLY| databricks/dolly-v2-12b | 🟩 | 🟨 | 🟨 | 🟩 | 🟨 |
+|FALCON| tiiuae/falcon-40b | 🟩 | 🟩 | 🟩 | 🟩 | 🟩 |
+|OPT| facebook/opt-30b | 🟩 | 🟩 | 🟩 | 🟩 | 🟨 |
+|OPT| facebook/opt-1.3b | 🟩 | 🟩 | 🟩 | 🟩 | 🟨 |
+|Bloom| bigscience/bloom-1b7 | 🟩 | 🟨 | 🟩 | 🟩  | 🟨 |
+|CodeGen| Salesforce/codegen-2B-multi | 🟩 | 🟩 | 🟨 | 🟩 | 🟩 |
+|Baichuan| baichuan-inc/Baichuan2-7B-Chat | 🟩 | 🟩 | 🟩 | 🟩 |    |
+|Baichuan| baichuan-inc/Baichuan2-13B-Chat | 🟩 | 🟩 | 🟩 | 🟩 |    |
+|Baichuan| baichuan-inc/Baichuan-13B-Chat | 🟩 | 🟨 | 🟩 | 🟩 |    |
+|ChatGLM| THUDM/chatglm3-6b | 🟩 | 🟩 | 🟨 | 🟩 |    |
+|ChatGLM| THUDM/chatglm2-6b | 🟩 | 🟩 | 🟨 | 🟩 |    |
+|GPTBigCode| bigcode/starcoder | 🟩 | 🟩 | 🟨 | 🟩 | 🟨 |
+|T5| google/flan-t5-xl | 🟩 | 🟩 | 🟨 | 🟩 |    |
+|Mistral| mistralai/Mistral-7B-v0.1 | 🟩 | 🟩 | 🟨 | 🟩 | 🟨 |
+|MPT| mosaicml/mpt-7b | 🟩 | 🟩 | 🟨 | 🟩 | 🟩 |
+
+- 🟩 signifies that the model can perform well and with good accuracy (<1% difference as compared with FP32).
+
+- 🟨 signifies that the model can perform well while accuracy may not been in a perfect state (>1% difference as compared with FP32).
+
+*Note*: The above verified models (including other models in the same model family, like "codellama/CodeLlama-7b-hf" from LLAMA family) are well supported with all optimizations like indirect access KV cache, fused ROPE, and prepacked TPP Linear (fp32/bf16).
+We are working in progress to better support the models in the tables with various data types. In addition, more models will be optimized in the future.
 
 ## Support
 
 
@@ -27,10 +27,10 @@ RUN ${PYTHON} -m pip --no-cache-dir install --upgrade \
 # Some TF tools expect a "python" binary
 RUN ln -s $(which ${PYTHON}) /usr/local/bin/python
 
-ARG IPEX_VERSION=2.1.100
-ARG PYTORCH_VERSION=2.1.1
-ARG TORCHAUDIO_VERSION=2.1.1
-ARG TORCHVISION_VERSION=0.16.1
+ARG IPEX_VERSION=2.2.0
+ARG PYTORCH_VERSION=2.2.0
+ARG TORCHAUDIO_VERSION=2.2.0
+ARG TORCHVISION_VERSION=0.17.0
 ARG TORCH_CPU_URL=https://download.pytorch.org/whl/cpu/torch_stable.html
 
 RUN \
 
@@ -0,0 +1,124 @@
+<table class="docutils align-default">
+  <thead>
+    <tr class="row-odd">
+      <th class="head" style="text-align: center; vertical-align: middle;">MODEL<br />FAMILY</th>
+      <th class="head" style="text-align: center; vertical-align: middle;">MODEL NAME<br />(Huggingface hub)</th>
+      <th class="head" style="text-align: center; vertical-align: middle;">BF16</th>
+      <th class="head" style="text-align: center; vertical-align: middle;">Weight-Only<br />Quantization<br />INT8</th>
+    </tr>
+  </thead>
+  <tbody>
+    <tr class="row-even">
+      <td><p>LLAMA</p></td>
+      <td><p>meta-llama/Llama-2-7b-hf</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>LLAMA</p></td>
+      <td><p>meta-llama/Llama-2-13b-hf</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>LLAMA</p></td>
+      <td><p>meta-llama/Llama-2-70b-hf</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>GPT-J</p></td>
+      <td><p>EleutherAI/gpt-j-6b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>GPT-NEOX</p></td>
+      <td><p>EleutherAI/gpt-neox-20b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>DOLLY</p></td>
+      <td><p>databricks/dolly-v2-12b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>FALCON</p></td>
+      <td><p>tiiuae/falcon-40b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>OPT</p></td>
+      <td><p>facebook/opt-30b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>OPT</p></td>
+      <td><p>facebook/opt-1.3b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>Bloom</p></td>
+      <td><p>bigscience/bloom-1b7</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>CodeGen</p></td>
+      <td><p>Salesforce/codegen-2B-multi</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>Baichuan</p></td>
+      <td><p>baichuan-inc/Baichuan2-7B-Chat</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>Baichuan</p></td>
+      <td><p>baichuan-inc/Baichuan2-13B-Chat</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>Baichuan</p></td>
+      <td><p>baichuan-inc/Baichuan-13B-Chat</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟨</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>GPTBigCode</p></td>
+      <td><p>bigcode/starcoder</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>T5</p></td>
+      <td><p>google/flan-t5-xl</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-even">
+      <td><p>Mistral</p></td>
+      <td><p>mistralai/Mistral-7B-v0.1</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+    <tr class="row-odd">
+      <td><p>MPT</p></td>
+      <td><p>mosaicml/mpt-7b</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+      <td><p style="text-align: center; vertical-align: middle;">🟩</p></td>
+    </tr>
+  </tbody>
+</table>
+<ul class="simple">
+  <li><p>🟩 signifies that the model can perform well and with good accuracy (&lt;1% difference as compared with FP32).</p></li>
+  <li><p>🟨 signifies that the model can perform well while accuracy may not been in a perfect state (&gt;1% difference as compared with FP32).</p></li>
+</ul>