Update notebook

nikita-malininn · nikita-malininn · commit 515cbf855f8e · 2025-02-03T15:11:45.000+01:00
diff --git a/notebooks/outetts-text-to-speech/outetts-text-to-speech.ipynb b/notebooks/outetts-text-to-speech/outetts-text-to-speech.ipynb
@@ -366,23 +366,9 @@
     ")\n",
     "open(\"skip_kernel_extension.py\", \"w\").write(r.text)\n",
     "\n",
-    "ov_quantized_model = None\n",
-    "quantized_ov_pipe = None\n",
-    "\n",
     "%load_ext skip_kernel_extension"
    ]
   },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "%%skip not $to_quantize.value\n",
-    "\n",
-    "hf_model = OVHFModel(model_dir, device.value).model"
-   ]
-  },
   {
    "cell_type": "markdown",
    "metadata": {},
@@ -447,9 +433,25 @@
     "\n",
     "    return inputs\n",
     "\n",
-    "\n",
+    "hf_model = OVHFModel(model_dir, device.value).model\n",
     "dataset = nncf.Dataset(libritts, partial(transform_fn, interface=interface))\n",
-    "quantized_model = nncf.quantize(hf_model.model, dataset, preset=nncf.QuantizationPreset.MIXED, model_type=nncf.ModelType.TRANSFORMER, ignored_scope=nncf.IgnoredScope(patterns=[\"__module.model.layers.*.self_attn/aten::scaled_dot_product_attention/ScaledDotProductAttention\"]))"
+    "\n",
+    "quantized_model = nncf.quantize(\n",
+    "    hf_model.model,\n",
+    "    dataset,\n",
+    "    preset=nncf.QuantizationPreset.MIXED,\n",
+    "    model_type=nncf.ModelType.TRANSFORMER,\n",
+    "    ignored_scope=nncf.IgnoredScope(\n",
+    "        patterns=[\n",
+    "            \"__module.model.layers.*.self_attn/aten::scaled_dot_product_attention/ScaledDotProductAttention\"\n",
+    "        ]\n",
+    "    )\n",
+    ")\n",
+    "\n",
+    "hf_model.model = quantized_model\n",
+    "int8_path = Path(f\"{model_dir}_int8_ignored\")\n",
+    "hf_model.save_pretrained(int8_path)\n",
+    "interface.prompt_processor.tokenizer.save_pretrained(int8_path)"
    ]
   },
   {
@@ -472,12 +474,6 @@
    "source": [
     "%%skip not $to_quantize.value\n",
     "\n",
-    "hf_model.model = quantized_model\n",
-    "# int8_path = Path(f\"{model_dir}_compressed\")\n",
-    "int8_path = Path(f\"{model_dir}_int8\")\n",
-    "hf_model.save_pretrained(int8_path)\n",
-    "interface.prompt_processor.tokenizer.save_pretrained(int8_path)\n",
-    "\n",
     "interface_int8 = InterfaceOV(int8_path, device.value)"
    ]
   },