Update README with new model stats

kevinwuTT · kevinwuTT · commit 08898b3be17b · 2024-08-12T22:12:53.000Z
diff --git a/README.md b/README.md
@@ -8,17 +8,17 @@ This project allows to run PyTorch code on [Tenstorrent](https://tenstorrent.com
 
 The table below summarizes the results of running various ML models through our TTNN compiler. For each model, we track whether the run was successful, the number of operations before and after conversion, the number of `to_device` and `from_device` operations, performance metrics, and accuracy.
 
-| Model                               | Run Success   | Torch Ops Before (Unique Ops)   | Torch Ops Remain (Unique Ops)   | To/From Device Ops   |   Original Run Time (ms) | Compiled Run Time (ms)   | Accuracy (%)   |
-|:------------------------------------|:--------------|:--------------------------------|:--------------------------------|:---------------------|-------------------------:|:-------------------------|:---------------|
-| [Mnist (Eval)](tests/models/mnist)  | ✘             | 14 (8)                          | 5 (4)                           | 16                   |                    36.12 | N/A                      | N/A            |
-| [Mnist (Train)](tests/models/mnist) | ✅            | 14 (8)                          | 7 (5)                           | 14                   |                   114.49 | 2742.8                   | 81.75          |
-| [ResNet18](tests/models/resnet)     | ✅            | 70 (9)                          | 42 (4)                          | 47                   |                  2094.6  | 10950.18                 | 99.99          |
-| [Bloom](tests/models/bloom)         | ✘             | 1407 (29)                       | N/A                             | N/A                  |                  9127.68 | N/A                      | N/A            |
-| [YOLOS](tests/models/yolos)         | ✘             | 964 (28)                        | N/A                             | N/A                  |                  1353.22 | N/A                      | N/A            |
-| [Llama](tests/models/llama)         | ✘             | 3 (3)                           | 1 (1)                           | 5                    |                 52926.3  | N/A                      | N/A            |
-| [BERT](tests/models/bert)           | ✅            | 1393 (21)                       | 537 (4)                         | 1607                 |                 65342    | 61028.65                 | 98.64          |
-| [Falcon](tests/models/falcon)       | ✘             | 3 (3)                           | 1 (1)                           | 5                    |                 47738.8  | N/A                      | N/A            |
-| [GPT-2](tests/models/gpt2)          | ✘             | 748 (31)                        | N/A                             | N/A                  |                  2287.61 | N/A                      | N/A            |
+| Model                               | Run Success   | Torch Ops Before (Unique Ops)   | Torch Ops Remain (Unique Ops)   |   To/From Device Ops |   Original Run Time (ms) | Compiled Run Time (ms)   | Accuracy (%)   |
+|:------------------------------------|:--------------|:--------------------------------|:--------------------------------|---------------------:|-------------------------:|:-------------------------|:---------------|
+| [Mnist (Eval)](tests/models/mnist)  | ✅            | 14 (8)                          | 5 (4)                           |                   16 |                    36.62 | 477.12                   | 98.33          |
+| [Mnist (Train)](tests/models/mnist) | ✅            | 14 (8)                          | 7 (5)                           |                   14 |                   117.66 | 2571.71                  | 68.54          |
+| [ResNet18](tests/models/resnet)     | ✅            | 70 (9)                          | 42 (4)                          |                   47 |                  2025.6  | 10350.92                 | 99.99          |
+| [Bloom](tests/models/bloom)         | ✅            | 1407 (29)                       | 627 (12)                        |                 1375 |                 28876.2  | 65763.95                 | 45.77          |
+| [YOLOS](tests/models/yolos)         | ✅            | 964 (28)                        | 409 (11)                        |                  919 |                  1516.37 | 45219.57                 | 71.71          |
+| [Llama](tests/models/llama)         | ✅            | 5 (4)                           | 3 (2)                           |                    3 |                168160    | 186989.25                | 34.41          |
+| [BERT](tests/models/bert)           | ✅            | 1393 (21)                       | 564 (7)                         |                 1488 |                 64262    | 57553.72                 | 98.64          |
+| [Falcon](tests/models/falcon)       | ✘             | 3 (3)                           | 2 (2)                           |                    5 |                 39306.6  | N/A                      | N/A            |
+| [GPT-2](tests/models/gpt2)          | ✘             | 748 (31)                        | 330 (15)                        |                  530 |                  5889.45 | N/A                      | N/A            |
 
 ### Explanation of Metrics
 
@@ -47,7 +47,7 @@ The table below summarizes the results of running various ML models through our
 | aten.max_pool2d_with_indices.default | ✘        |       1 |
 | aten.relu.default                    | ✅       |       3 |
 | aten.t.default                       | ✅       |       2 |
-| aten.view.default                    | ✘        |       1 |
+| aten.view.default                    | ✅       |       1 |
 #### Mnist (Train)
 | aten ops                             | status   |   count |
 |:-------------------------------------|:---------|--------:|
@@ -58,7 +58,7 @@ The table below summarizes the results of running various ML models through our
 | aten.native_dropout.default          | ✘        |       2 |
 | aten.relu.default                    | ✅       |       3 |
 | aten.t.default                       | ✅       |       2 |
-| aten.view.default                    | ✘        |       1 |
+| aten.view.default                    | ✅       |       1 |
 #### ResNet18
 | aten ops                                          | status   |   count |
 |:--------------------------------------------------|:---------|--------:|
@@ -70,43 +70,141 @@ The table below summarizes the results of running various ML models through our
 | aten.mean.dim                                     | ✅       |       1 |
 | aten.relu.default                                 | ✅       |      17 |
 | aten.t.default                                    | ✅       |       1 |
-| aten.view.default                                 | ✘        |       1 |
+| aten.view.default                                 | ✅       |       1 |
+#### Bloom
+| aten ops                       | status   |   count |
+|:-------------------------------|:---------|--------:|
+| aten._softmax.default          | ✅       |      24 |
+| aten._to_copy.default          | ✘        |      54 |
+| aten._unsafe_view.default      | ✘        |      24 |
+| aten.add.Tensor                | ✅       |      96 |
+| aten.addmm.default             | ✅       |      96 |
+| aten.arange.start              | ✘        |       1 |
+| aten.baddbmm.default           | ✅       |      24 |
+| aten.bmm.default               | ✅       |      24 |
+| aten.clone.default             | ✅       |      96 |
+| aten.cumsum.default            | ✘        |       1 |
+| aten.embedding.default         | ✅       |       1 |
+| aten.expand.default            | ✅       |       2 |
+| aten.full.default              | ✅       |       1 |
+| aten.lift_fresh_copy.default   | ✘        |       1 |
+| aten.masked_fill.Scalar        | ✘        |      26 |
+| aten.mm.default                | ✅       |       1 |
+| aten.mul.Tensor                | ✅       |     146 |
+| aten.native_layer_norm.default | ✅       |      50 |
+| aten.permute.default           | ✅       |      48 |
+| aten.pow.Tensor_Tensor         | ✘        |       1 |
+| aten.rsub.Scalar               | ✘        |       1 |
+| aten.select.int                | ✘        |      72 |
+| aten.slice.Tensor              | ✘        |      78 |
+| aten.sub.Tensor                | ✅       |       1 |
+| aten.t.default                 | ✅       |      97 |
+| aten.tanh.default              | ✅       |      24 |
+| aten.transpose.int             | ✅       |      48 |
+| aten.unsqueeze.default         | ✘        |       6 |
+| aten.view.default              | ✅       |     363 |
+#### YOLOS
+| aten ops                       | status   |   count |
+|:-------------------------------|:---------|--------:|
+| aten._softmax.default          | ✅       |      12 |
+| aten._to_copy.default          | ✘        |       2 |
+| aten._unsafe_index.Tensor      | ✘        |      16 |
+| aten.add.Tensor                | ✅       |      71 |
+| aten.addmm.default             | ✅       |      78 |
+| aten.arange.default            | ✘        |       4 |
+| aten.bmm.default               | ✅       |      24 |
+| aten.cat.default               | ✘        |       2 |
+| aten.clamp.default             | ✅       |      32 |
+| aten.clone.default             | ✅       |      50 |
+| aten.convolution.default       | ✘        |       1 |
+| aten.div.Tensor                | ✘        |      12 |
+| aten.expand.default            | ✅       |      50 |
+| aten.floor.default             | ✘        |       2 |
+| aten.gelu.default              | ✅       |      12 |
+| aten.mul.Tensor                | ✅       |      82 |
+| aten.native_layer_norm.default | ✅       |      25 |
+| aten.permute.default           | ✅       |      48 |
+| aten.relu.default              | ✅       |       4 |
+| aten.rsub.Scalar               | ✘        |      10 |
+| aten.select.int                | ✘        |       1 |
+| aten.sigmoid.default           | ✅       |       1 |
+| aten.slice.Tensor              | ✘        |      12 |
+| aten.sub.Tensor                | ✅       |      36 |
+| aten.t.default                 | ✅       |      78 |
+| aten.transpose.int             | ✅       |      15 |
+| aten.unsqueeze.default         | ✅       |       1 |
+| aten.view.default              | ✅       |     283 |
 #### Llama
-| aten ops               | status   |   count |
-|:-----------------------|:---------|--------:|
-| aten.arange.start      | ✘        |       1 |
-| aten.embedding.default | ✅       |       1 |
-| aten.unsqueeze.default | ✅       |       1 |
+| aten ops              | status   |   count |
+|:----------------------|:---------|--------:|
+| aten._to_copy.default | ✘        |       1 |
+| aten.mm.default       | ✅       |       1 |
+| aten.t.default        | ✅       |       1 |
+| aten.view.default     | ✅       |       2 |
 #### BERT
 | aten ops                       | status   |   count |
 |:-------------------------------|:---------|--------:|
 | aten._softmax.default          | ✅       |      24 |
-| aten._to_copy.default          | ✅       |       1 |
+| aten._to_copy.default          | ✘        |       1 |
 | aten.add.Tensor                | ✅       |      74 |
 | aten.addmm.default             | ✅       |     145 |
 | aten.bmm.default               | ✅       |      48 |
 | aten.clone.default             | ✅       |      99 |
-| aten.div.Tensor                | ✅       |      24 |
+| aten.div.Tensor                | ✘        |      24 |
 | aten.embedding.default         | ✅       |       3 |
 | aten.expand.default            | ✅       |      96 |
 | aten.gelu.default              | ✅       |      24 |
 | aten.mul.Tensor                | ✅       |       1 |
 | aten.native_layer_norm.default | ✅       |      49 |
 | aten.permute.default           | ✅       |      96 |
-| aten.rsub.Scalar               | ✅       |       1 |
+| aten.rsub.Scalar               | ✘        |       1 |
 | aten.slice.Tensor              | ✘        |       4 |
 | aten.split.Tensor              | ✘        |       1 |
 | aten.squeeze.dim               | ✘        |       2 |
 | aten.t.default                 | ✅       |     145 |
 | aten.transpose.int             | ✅       |      24 |
 | aten.unsqueeze.default         | ✅       |       2 |
-| aten.view.default              | ✘        |     530 |
+| aten.view.default              | ✅       |     530 |
 #### Falcon
 | aten ops               | status   |   count |
 |:-----------------------|:---------|--------:|
 | aten.arange.start      | ✘        |       1 |
 | aten.embedding.default | ✅       |       1 |
 | aten.unsqueeze.default | ✅       |       1 |
+#### GPT-2
+| aten ops                       | status   |   count |
+|:-------------------------------|:---------|--------:|
+| aten._softmax.default          | ✅       |      12 |
+| aten._to_copy.default          | ✘        |       2 |
+| aten.add.Tensor                | ✅       |      61 |
+| aten.addmm.default             | ✅       |      48 |
+| aten.arange.default            | ✘        |       1 |
+| aten.arange.start              | ✘        |       1 |
+| aten.argmax.default            | ✘        |       1 |
+| aten.bmm.default               | ✅       |      24 |
+| aten.clone.default             | ✅       |      49 |
+| aten.div.Tensor                | ✘        |      12 |
+| aten.embedding.default         | ✅       |       2 |
+| aten.eq.Scalar                 | ✘        |       1 |
+| aten.expand.default            | ✅       |      48 |
+| aten.full.default              | ✘        |      24 |
+| aten.index.Tensor              | ✘        |       1 |
+| aten.mm.default                | ✅       |       1 |
+| aten.mul.Tensor                | ✅       |      49 |
+| aten.native_layer_norm.default | ✅       |      25 |
+| aten.permute.default           | ✅       |      48 |
+| aten.pow.Tensor_Scalar         | ✅       |      12 |
+| aten.remainder.Scalar          | ✘        |       1 |
+| aten.rsub.Scalar               | ✘        |       1 |
+| aten.slice.Tensor              | ✘        |      50 |
+| aten.split.Tensor              | ✘        |      12 |
+| aten.sub.Tensor                | ✘        |       1 |
+| aten.t.default                 | ✅       |       1 |
+| aten.tanh.default              | ✅       |      12 |
+| aten.transpose.int             | ✅       |      12 |
+| aten.unsqueeze.default         | ✅       |       3 |
+| aten.view.default              | ✅       |     221 |
+| aten.where.self                | ✘        |      12 |
 
 
 ## Quickstart