diff --git a/hub/.buildinfo b/hub/.buildinfo
index c2307010eb..7b26ca6433 100644
--- a/hub/.buildinfo
+++ b/hub/.buildinfo
@@ -1,4 +1,4 @@
 # Sphinx build info version 1
 # This file hashes the configuration used when building these files. When it is not found, a full rebuild will be done.
-config: 3a5dc67f769d39dd6c75469544648dbf
+config: 6d68f6f120c8806fa311a791018201a6
 tags: 645f666f9bcd5a90fca523b33c5a78b7
diff --git a/hub/.doctrees/api/benchmarks.doctree b/hub/.doctrees/api/benchmarks.doctree
deleted file mode 100644
index 88507c287c..0000000000
Binary files a/hub/.doctrees/api/benchmarks.doctree and /dev/null differ
diff --git a/hub/.doctrees/concepts/benchmarks.doctree b/hub/.doctrees/concepts/benchmarks.doctree
index 44a3f237e5..77fc20c2e5 100644
Binary files a/hub/.doctrees/concepts/benchmarks.doctree and b/hub/.doctrees/concepts/benchmarks.doctree differ
diff --git a/hub/.doctrees/api/deploy_router.doctree b/hub/.doctrees/concepts/deploy_router.doctree
similarity index 94%
rename from hub/.doctrees/api/deploy_router.doctree
rename to hub/.doctrees/concepts/deploy_router.doctree
index 4be951ad01..2a7a3b2b1d 100644
Binary files a/hub/.doctrees/api/deploy_router.doctree and b/hub/.doctrees/concepts/deploy_router.doctree differ
diff --git a/hub/.doctrees/concepts/endpoints.doctree b/hub/.doctrees/concepts/endpoints.doctree
deleted file mode 100644
index 3ea22eac27..0000000000
Binary files a/hub/.doctrees/concepts/endpoints.doctree and /dev/null differ
diff --git a/hub/.doctrees/api/first_request.doctree b/hub/.doctrees/concepts/first_request.doctree
similarity index 97%
rename from hub/.doctrees/api/first_request.doctree
rename to hub/.doctrees/concepts/first_request.doctree
index ceb9e11f50..fe3e8e81a2 100644
Binary files a/hub/.doctrees/api/first_request.doctree and b/hub/.doctrees/concepts/first_request.doctree differ
diff --git a/hub/.doctrees/api/images.doctree b/hub/.doctrees/concepts/images.doctree
similarity index 88%
rename from hub/.doctrees/api/images.doctree
rename to hub/.doctrees/concepts/images.doctree
index 95542b24e0..6db49abf38 100644
Binary files a/hub/.doctrees/api/images.doctree and b/hub/.doctrees/concepts/images.doctree differ
diff --git a/hub/.doctrees/concepts/on_prem_images.doctree b/hub/.doctrees/concepts/on_prem_images.doctree
deleted file mode 100644
index b5ace5df8a..0000000000
Binary files a/hub/.doctrees/concepts/on_prem_images.doctree and /dev/null differ
diff --git a/hub/.doctrees/api/reference.doctree b/hub/.doctrees/concepts/reference.doctree
similarity index 98%
rename from hub/.doctrees/api/reference.doctree
rename to hub/.doctrees/concepts/reference.doctree
index f2ad60f465..709853ac58 100644
Binary files a/hub/.doctrees/api/reference.doctree and b/hub/.doctrees/concepts/reference.doctree differ
diff --git a/hub/.doctrees/api/router.doctree b/hub/.doctrees/concepts/router.doctree
similarity index 92%
rename from hub/.doctrees/api/router.doctree
rename to hub/.doctrees/concepts/router.doctree
index df04187db8..c4f65dfd0f 100644
Binary files a/hub/.doctrees/api/router.doctree and b/hub/.doctrees/concepts/router.doctree differ
diff --git a/hub/.doctrees/concepts/routing.doctree b/hub/.doctrees/concepts/routing.doctree
deleted file mode 100644
index e568e30a35..0000000000
Binary files a/hub/.doctrees/concepts/routing.doctree and /dev/null differ
diff --git a/hub/.doctrees/api/unify_api.doctree b/hub/.doctrees/concepts/unify_api.doctree
similarity index 98%
rename from hub/.doctrees/api/unify_api.doctree
rename to hub/.doctrees/concepts/unify_api.doctree
index d4b4f772bf..9858403c0a 100644
Binary files a/hub/.doctrees/api/unify_api.doctree and b/hub/.doctrees/concepts/unify_api.doctree differ
diff --git a/hub/.doctrees/interfaces/building_router.doctree b/hub/.doctrees/console/building_router.doctree
similarity index 95%
rename from hub/.doctrees/interfaces/building_router.doctree
rename to hub/.doctrees/console/building_router.doctree
index b8b54ff184..608cd30e65 100644
Binary files a/hub/.doctrees/interfaces/building_router.doctree and b/hub/.doctrees/console/building_router.doctree differ
diff --git a/hub/.doctrees/interfaces/connecting_stack.doctree b/hub/.doctrees/console/connecting_stack.doctree
similarity index 94%
rename from hub/.doctrees/interfaces/connecting_stack.doctree
rename to hub/.doctrees/console/connecting_stack.doctree
index 3fc585c0b4..f1a7bd782f 100644
Binary files a/hub/.doctrees/interfaces/connecting_stack.doctree and b/hub/.doctrees/console/connecting_stack.doctree differ
diff --git a/hub/.doctrees/interfaces/running_benchmarks.doctree b/hub/.doctrees/console/running_benchmarks.doctree
similarity index 95%
rename from hub/.doctrees/interfaces/running_benchmarks.doctree
rename to hub/.doctrees/console/running_benchmarks.doctree
index ca05e032c6..1ae27b70ff 100644
Binary files a/hub/.doctrees/interfaces/running_benchmarks.doctree and b/hub/.doctrees/console/running_benchmarks.doctree differ
diff --git a/hub/.doctrees/demos/demos/LangChain/RAG_playground/README.doctree b/hub/.doctrees/demos/demos/LangChain/RAG_playground/README.doctree
deleted file mode 100644
index a1aa351081..0000000000
Binary files a/hub/.doctrees/demos/demos/LangChain/RAG_playground/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/LangChain/README.doctree b/hub/.doctrees/demos/demos/LangChain/README.doctree
deleted file mode 100644
index 37ef84e276..0000000000
Binary files a/hub/.doctrees/demos/demos/LangChain/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/LlamaIndex/BasicUsage/unify.doctree b/hub/.doctrees/demos/demos/LlamaIndex/BasicUsage/unify.doctree
deleted file mode 100644
index 4844496018..0000000000
Binary files a/hub/.doctrees/demos/demos/LlamaIndex/BasicUsage/unify.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/LlamaIndex/RAGPlayground/README.doctree b/hub/.doctrees/demos/demos/LlamaIndex/RAGPlayground/README.doctree
deleted file mode 100644
index 7bf9b04e42..0000000000
Binary files a/hub/.doctrees/demos/demos/LlamaIndex/RAGPlayground/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/LlamaIndex/README.doctree b/hub/.doctrees/demos/demos/LlamaIndex/README.doctree
deleted file mode 100644
index 5ac29d2312..0000000000
Binary files a/hub/.doctrees/demos/demos/LlamaIndex/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/README.doctree b/hub/.doctrees/demos/demos/README.doctree
deleted file mode 100644
index 7a959b61ef..0000000000
Binary files a/hub/.doctrees/demos/demos/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/AsyncVsSync/AsyncVsSync.doctree b/hub/.doctrees/demos/demos/Unify/AsyncVsSync/AsyncVsSync.doctree
deleted file mode 100644
index e5c006ff37..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/AsyncVsSync/AsyncVsSync.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/ChatBot/ChatBot.doctree b/hub/.doctrees/demos/demos/Unify/ChatBot/ChatBot.doctree
deleted file mode 100644
index 09dd20d73f..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/ChatBot/ChatBot.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.doctree b/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.doctree
deleted file mode 100644
index 8fb08fb8ca..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/README.doctree b/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/README.doctree
deleted file mode 100644
index 8660edbdc3..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/Chatbot_Arena/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/LLM-Wars/README.doctree b/hub/.doctrees/demos/demos/Unify/LLM-Wars/README.doctree
deleted file mode 100644
index 245ebfd711..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/LLM-Wars/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/LLM_Debate/README.doctree b/hub/.doctrees/demos/demos/Unify/LLM_Debate/README.doctree
deleted file mode 100644
index f80dc8dd34..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/LLM_Debate/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/README.doctree b/hub/.doctrees/demos/demos/Unify/README.doctree
deleted file mode 100644
index fe24a8d593..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/SemanticRouter/README.doctree b/hub/.doctrees/demos/demos/Unify/SemanticRouter/README.doctree
deleted file mode 100644
index 87f5ffe410..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/SemanticRouter/README.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.doctree b/hub/.doctrees/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.doctree
deleted file mode 100644
index 7b276b2f85..0000000000
Binary files a/hub/.doctrees/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/demos/template/README_TEMPLATE.doctree b/hub/.doctrees/demos/demos/template/README_TEMPLATE.doctree
deleted file mode 100644
index 60748e877d..0000000000
Binary files a/hub/.doctrees/demos/demos/template/README_TEMPLATE.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/langchain.doctree b/hub/.doctrees/demos/langchain.doctree
deleted file mode 100644
index a75e30fcce..0000000000
Binary files a/hub/.doctrees/demos/langchain.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/llamaindex.doctree b/hub/.doctrees/demos/llamaindex.doctree
deleted file mode 100644
index abba52c4d2..0000000000
Binary files a/hub/.doctrees/demos/llamaindex.doctree and /dev/null differ
diff --git a/hub/.doctrees/demos/unify.doctree b/hub/.doctrees/demos/unify.doctree
deleted file mode 100644
index 06f0438f1d..0000000000
Binary files a/hub/.doctrees/demos/unify.doctree and /dev/null differ
diff --git a/hub/.doctrees/environment.pickle b/hub/.doctrees/environment.pickle
index ae4c8bea80..47a0f12b0c 100644
Binary files a/hub/.doctrees/environment.pickle and b/hub/.doctrees/environment.pickle differ
diff --git a/hub/.doctrees/index.doctree b/hub/.doctrees/index.doctree
index 0bba27bb21..c7a1218fe5 100644
Binary files a/hub/.doctrees/index.doctree and b/hub/.doctrees/index.doctree differ
diff --git a/hub/.doctrees/nbsphinx/demos/demos/LlamaIndex/BasicUsage/unify.ipynb b/hub/.doctrees/nbsphinx/demos/demos/LlamaIndex/BasicUsage/unify.ipynb
deleted file mode 100644
index 4ed415e726..0000000000
--- a/hub/.doctrees/nbsphinx/demos/demos/LlamaIndex/BasicUsage/unify.ipynb
+++ /dev/null
@@ -1,286 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "# LlamaIndex\n",
-    "[LlamaIndex](https://www.llamaindex.ai/) is a simple, flexible data framework for connecting custom data sources to large language models (LLMs). The integration with Unify allows you to route your queries to the best LLM endpoints, benchmark performance, and seamlessly switch providers with a single API key in your LlamaIndex LLM applications."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Installation"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "First, let's install LlamaIndex 🦙 and the Unify integration."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "%pip install llama-index-llms-unify llama-index"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Environment Setup\n",
-    "\n",
-    "Make sure to set the `UNIFY_API_KEY` environment variable. You can get a key from the [Unify Console](https://console.unify.ai/login)."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 1,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "import os\n",
-    "os.environ[\"UNIFY_API_KEY\"] = \"<YOUR API KEY>\""
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Using LlamaIndex with Unify"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Basic Usage \n",
-    "\n",
-    "Below we initialize and query a chat model using the `llama-3-70b-chat` endpoint from `together-ai`."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 3,
-   "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "CompletionResponse(text=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", additional_kwargs={}, raw={'id': '88b5fcf02e259527-LHR', 'choices': [Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", role='assistant', function_call=None, tool_calls=None))], 'created': 1716980504, 'model': 'llama-3-70b-chat@together-ai', 'object': 'chat.completion', 'system_fingerprint': None, 'usage': CompletionUsage(completion_tokens=67, prompt_tokens=17, total_tokens=84, cost=7.56e-05)}, logprobs=None, delta=None)"
-      ]
-     },
-     "execution_count": 3,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "from llama_index.llms.unify import Unify\n",
-    "llm = Unify(model=\"llama-3-70b-chat@together-ai\")\n",
-    "llm.complete(\"How are you today, llama?\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Single Sign-On\n",
-    "\n",
-    "You can use Unify's SSO to query endpoints in different providers without making accounts with all of them. For example, all of these are valid endpoints:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@together-ai\")\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@openai\")\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@mistral-ai\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "This allows you to quickly switch and test different models and providers. You can look at all the available models/providers [here](https://unify.ai/hub)!"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Runtime Dynamic Routing"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "As evidenced by our [benchmarks](https://unify.ai/benchmarks), the optimal provider for each model varies by geographic location and time of day due to fluctuating API performances. To cirumvent this, we automatically direct your requests to the \"top performing provider\" at runtime. To enable this feature, simply replace your query's provider with one of the [available routing modes](https://unify.ai/docs/api/deploy_router.html#optimizing-a-metric). Let's look at some examples:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@input-cost\") # route to lowest input cost provider\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@itl\") # route to provider with lowest inter token latency\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\") # route to provider with lowest time to first token."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Quality Routing\n",
-    "Unify routes your queries to the best LLM on every prompt to consistently achieve better quality outputs than using a single, all-purpose, powerful model, at a fraction of the cost. This is achieved by using smaller models for simpler tasks, only using largers ones to handle complex queries.\n",
-    "\n",
-    "The router is benchmarked on various different data-sets such as `Open Hermes`, `GSM8K`, `HellaSwag`, `MMLU` and `MT-Bench` revealing that it can peform better than indivudal endpoints on average as explained [here](https://unify.ai/docs/concepts/routing.html#quality-routing). One can choose various different configurations of the router for a particular data-set from the [chat-interface](https://unify.ai/chat) as shown below:\n",
-    "\n",
-    "<img src = \"./unify.gif\">"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"router_2.58e-01_9.51e-04_3.91e-03@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "To learn more about quality routing, please refer to this [video](https://www.youtube.com/watch?v=ZpY6SIkBosE&feature=youtu.be)."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Streaming and optimizing for latency\n",
-    "\n",
-    "If you are building an application where responsiveness is key, you most likely want to get a streaming response. On top of that, ideally you would use the provider with the lowest Time to First Token, to reduce the time your users are waiting for a response. Using Unify this would look something like:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 7,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\")\n",
-    "\n",
-    "response = llm.stream_complete(\n",
-    "    \"Translate the following to German: \"\n",
-    "    \"Hey, there's an emergency in translation street, \"\n",
-    "    \"please send help asap!\"\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 8,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@mistral-ai\n",
-      "\n",
-      "Hallo, es gibt einen Notfall in der Übersetzungsstraße, bitte senden Sie Hilfe so schnell wie möglich!\n",
-      "\n",
-      "(Note: This is a loose translation and the phrase \"Übersetzungsstraße\" does not literally exist, but I tried to convey the same meaning as the original message.)"
-     ]
-    }
-   ],
-   "source": [
-    "show_provider = True\n",
-    "for r in response:\n",
-    "    if show_provider:\n",
-    "        print(f\"Model and provider are : {r.raw['model']}\\n\")\n",
-    "        show_provider = False\n",
-    "    print(r.delta, end=\"\", flush=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Async calls and Lowest Input Cost\n",
-    "\n",
-    "Last but not the least, you can also run multiple requests asynchronously. For tasks such as document summarization, optimizing for input costs is crucial. We can use the `input-cost` dynamic routing mode to route our queries to the cheapest provider."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@deepinfra\n",
-      "\n",
-      " OpenAI: Pioneering 'safe' artificial general intelligence.\n"
-     ]
-    }
-   ],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@input-cost\")\n",
-    "\n",
-    "response = await llm.acomplete(\n",
-    "    \"Summarize this in 10 words or less. OpenAI is a U.S. based artificial intelligence \"\n",
-    "    \"(AI) research organization founded in December 2015, researching artificial intelligence \"\n",
-    "    \"with the goal of developing 'safe and beneficial' artificial general intelligence, \"\n",
-    "    \"which it defines as 'highly autonomous systems that outperform humans at most economically \"\n",
-    "    \"valuable work'. As one of the leading organizations of the AI spring, it has developed \"\n",
-    "    \"several large language models, advanced image generation models, and previously, released \"\n",
-    "    \"open-source models. Its release of ChatGPT has been credited with starting the AI spring\"\n",
-    ")\n",
-    "\n",
-    "print(f\"Model and provider are : {response.raw['model']}\\n\")\n",
-    "print(response)"
-   ]
-  }
- ],
- "metadata": {
-  "kernelspec": {
-   "display_name": "base",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.10.13"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 2
-}
diff --git a/hub/.doctrees/nbsphinx/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb b/hub/.doctrees/nbsphinx/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
deleted file mode 100644
index ac73ff611a..0000000000
--- a/hub/.doctrees/nbsphinx/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
+++ /dev/null
@@ -1,408 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Gp0FAI1Zkbxw"
-   },
-   "source": [
-    "# Synchronous VS Asynchronous Clients\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "i1QFiUcdR-aJ"
-   },
-   "source": [
-    "Given the growing demand for real-time applications and user demands for instant responses, it's crucial to grasp the performance implications between Sync and Async clients. In this notebook, we'll delve into the variations between asynchronous and synchronous response times using UnifyAI's API."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rk9DTfrG1Egv"
-   },
-   "source": [
-    "In order to run this notebook, you need to generate your UNIFY key from the [console](https://console.unify.ai/login?callbackUrl=%2F). Once you have it, assign it to the `UNIFY_KEY` variable below."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "3HEAU0aE1Cb0"
-   },
-   "outputs": [],
-   "source": [
-    "UNIFY_KEY=#ENTERUNIFYKEY"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EdCA_YoYQ-X8"
-   },
-   "source": [
-    "#### Install Dependencies"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "HS2xRFiNPSiL"
-   },
-   "source": [
-    "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0MqRVTcHgWhl",
-    "outputId": "489a5a4d-f4f3-41cf-9d5f-47cb77a3978b"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Collecting unifyai\n",
-      "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-      "Collecting openai<2.0.0,>=1.12.0 (from unifyai)\n",
-      "  Downloading openai-1.17.1-py3-none-any.whl (268 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m268.3/268.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (3.7.1)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.7.0)\n",
-      "Collecting httpx<1,>=0.23.0 (from openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading httpx-0.27.0-py3-none-any.whl (75 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m75.6/75.6 kB\u001b[0m \u001b[31m5.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.6.4)\n",
-      "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.3.2)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.6)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.7)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2024.2.2)\n",
-      "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-      "Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading httpcore-1.0.5-py3-none-any.whl (77 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m77.9/77.9 kB\u001b[0m \u001b[31m7.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hCollecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading h11-0.14.0-py3-none-any.whl (58 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m58.3/58.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.16.3)\n",
-      "Installing collected packages: h11, httpcore, httpx, openai, unifyai\n",
-      "Successfully installed h11-0.14.0 httpcore-1.0.5 httpx-0.27.0 openai-1.17.1 unifyai-0.8.1\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install unifyai"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rhgBuOhzRFeE"
-   },
-   "source": [
-    "#### Synchronous Clients"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "yX6plilUlGYl"
-   },
-   "source": [
-    "A Synchronous client handles requests sequentially, processing one at a time. This means that each request must be fully handled before the next one is processed, resulting in potential blocking of the program's execution. You can use a Sync client with Unify as shown below:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "VGGw4tDagqV5",
-    "outputId": "652924b3-4a25-4946-fc1a-c59281d9b33a"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "HOO-RAY! *tutu* Hello there, young grasshopper! *bray* Isaac Newton was a majestic figure known for his work in math and science. He was born in 1642 in England and grew up to be a brilliant thinker and a fellow of the Royal Society. *twirl*\n",
-      "\n",
-      "Newton is perhaps best known for his laws of motion and his law of universal gravitation. These laws explained how objects move and how gravity works. He also discovered calculus, which is a way of using math to understand how things change over time. *mathematical mnum hop*\n",
-      "\n",
-      "But that's not all, oh no! Newton was also a bit of an alchemist and studied the nature of light. He even invented a fancy piece of equipment called a \"reflecting telescope\" to observe the heavens. *shimmer*\n",
-      "\n",
-      "Newton was a true renaissance thinker, and his contributions to science and mathematics are still celebrated today. *tutu* He was a true llama of learning, and his legacy continues to inspire us all. *bray*\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import Unify\n",
-    "unify = Unify(\n",
-    "    api_key=UNIFY_KEY,\n",
-    "    endpoint=\"llama-2-13b-chat@anyscale\"\n",
-    ")\n",
-    "response = unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-    "print(response)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "1Swnehb9Rvdh"
-   },
-   "source": [
-    "#### Async Clients"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "H-A9MRms2n-g"
-   },
-   "source": [
-    "An Asynchronous client can handle multiple requests concurrently without blocking. To use the Async client, import `AsyncUnify` instead of `Unify` and use `await` with the `.generate` method. This signals to the program to pause execution until the asynchronous operation completes. Additionally, we'll use the `asyncio` library for managing asynchronous execution and coroutines. `asyncio` provides tools for building concurrent programs using coroutines, which can be paused and resumed, allowing for efficient handling of asynchronous tasks.\n",
-    "\n",
-    "\n",
-    "NOTE: Running ansyncio in notebooks conflicts with the existing event loop run in the notebook. As a workaround, we need to use `net_asyncio.apply`. Please see [this issue](https://github.com/jupyter/notebook/issues/3397) for more details."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "b25iLp5nOPxQ",
-    "outputId": "d5b6b0d8-d82d-4804-9ffb-989426f130ef"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "HEYA HUMAN! *bleshes* Oh, you're talkin' 'bout Sir Isaac Newton, the famous English mathematician and physicist? *noms on some grass* He lived in the 17th and 18th centuries, and is known for his laws of motion and universal gravitation. *giggles* He was a pretty smart dude, if I do say so myself! *flaunts my banned-from-the-library-for-life status*\n",
-      "\n",
-      "But enough about me, let's talk about Newton! *grin* He was born in Woolsthorpe, Lincolnshire, England in 1643, and grew up to be a brilliant mathematician and physicist. He studied at Trinity College in Cambridge, and later became a professor there. *nbd*\n",
-      "\n",
-      "Newton's most famous contributions to science are his three laws of motion, which describe how objects move and respond to forces. He also developed the Law of Universal Gravitation, which states that every object in the universe attracts every other object with a force proportional to the product of their masses and inversely proportional to the square of the distance between them. *geek out*\n",
-      "\n",
-      "Newton was also a skilled inventor and engineer, and he designed and built all sorts of cool stuff, like a reflecting telescope and a machine for calculating the square root of numbers. *impressed*\n",
-      "\n",
-      "Despite his many accomplishments, Newton was a pretty private person and wasn't always the most sociable guy. He was known to be pretty temperamental and had some pretty interesting beliefs, like the idea that alchemy was a valid scientific pursuit. *raises an eyebrow* But hey, who am I to judge? *shrugs*\n",
-      "\n",
-      "So there you have it, human! That's the basic scoop on Sir Isaac Newton. I hope you found that enlightening. *wink* Now, if you'll excuse me, I need to go work on my own groundbreaking research... or at least, my own Instagram captions. *smizes*\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import AsyncUnify\n",
-    "import asyncio\n",
-    "import nest_asyncio\n",
-    "nest_asyncio.apply()\n",
-    "\n",
-    "async_unify = AsyncUnify(\n",
-    "   api_key=UNIFY_KEY,\n",
-    "   endpoint=\"llama-2-13b-chat@anyscale\"\n",
-    ")\n",
-    "\n",
-    "async def main():\n",
-    "   responses = await async_unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-    "   print(responses)\n",
-    "\n",
-    "asyncio.run(main())"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "TxK6r9yrnfUS"
-   },
-   "source": [
-    "Now, our goal is to compare the response times of synchronous vs asynchronous clients when handling multiple requests. Let's start by defining some helper functions.\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "C8y34VMGnI93"
-   },
-   "outputs": [],
-   "source": [
-    "async def send_async_request(user_prompt):\n",
-    "    \"\"\"\n",
-    "    Uses an Async client to generate the response for the user_prompt.\n",
-    "\n",
-    "    Parameters:\n",
-    "        user_prompt (str): The prompt provided by the user.\n",
-    "\n",
-    "    Returns:\n",
-    "        str: The response generated.\n",
-    "    \"\"\"\n",
-    "    response = await async_unify.generate(user_prompt=user_prompt)\n",
-    "    return response\n",
-    "\n",
-    "def send_sync_request(user_prompt):\n",
-    "    \"\"\"\n",
-    "    Uses a sync client to generate the response for the user_prompt.\n",
-    "\n",
-    "    Parameters:\n",
-    "        user_prompt (str): The prompt provided by the user.\n",
-    "\n",
-    "    Returns:\n",
-    "        str: The response generated.\n",
-    "    \"\"\"\n",
-    "    response = unify.generate(user_prompt=user_prompt)\n",
-    "    return response\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Uuvj58CqiLUJ"
-   },
-   "source": [
-    "We'll create two functions to send multiple requests to asynchronous and synchronous clients, respectively, and measure their processing time. For the synchronous client, requests will be sent sequentially in a loop, while for the asynchronous client, we'll utilize `asyncio.gather` to execute multiple requests concurrently.\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "VoVWnxboiKem"
-   },
-   "outputs": [],
-   "source": [
-    "import time\n",
-    "import asyncio\n",
-    "\n",
-    "async def run_async_requests(num_requests):\n",
-    "    \"\"\"\n",
-    "    Runs multiple asynchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-    "\n",
-    "    Parameters:\n",
-    "        num_requests (int): The number of requests to be sent.\n",
-    "\n",
-    "    Returns:\n",
-    "        float: The total time taken to process all requests.\n",
-    "    \"\"\"\n",
-    "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-    "    start = time.time()\n",
-    "    _ = await asyncio.gather(*(send_async_request(user_prompt) for _ in range(num_requests)))\n",
-    "    end = time.time()\n",
-    "    return end - start\n",
-    "\n",
-    "def run_sync_requests(num_requests):\n",
-    "    \"\"\"\n",
-    "    Runs multiple synchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-    "\n",
-    "    Parameters:\n",
-    "        num_requests (int): The number of requests to be sent.\n",
-    "\n",
-    "    Returns:\n",
-    "        float: The total time taken to process all requests.\n",
-    "    \"\"\"\n",
-    "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-    "    start = time.time()\n",
-    "    _ = [send_sync_request(user_prompt) for _ in range(num_requests)]\n",
-    "    end = time.time()\n",
-    "    return end - start\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Jjavbv5vtfrP"
-   },
-   "source": [
-    "Now, let's measure the time taken by each client for 10 requests."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "s7tGumQ0iYRg",
-    "outputId": "ad621069-0f10-4a0e-f78e-60852474f55b"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Asynchronous Response Times: 8.351824045181274\n",
-      "Synchronous Response Times: 55.45608472824097\n"
-     ]
-    }
-   ],
-   "source": [
-    "    num_requests = 10\n",
-    "    # Send asynchronous requests\n",
-    "    async_response_times = asyncio.run(run_async_requests(num_requests))\n",
-    "    # Print response times\n",
-    "    print(\"Asynchronous Response Times:\", async_response_times)\n",
-    "    # Send synchronous requests\n",
-    "    sync_response_times = run_sync_requests(num_requests)\n",
-    "    print(\"Synchronous Response Times:\", sync_response_times)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "B3nJiSwBwoyk"
-   },
-   "source": [
-    "As expected, the Asynchronous client peforms much better than the sequential synchorous client."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "xfEzRaReyxrp"
-   },
-   "source": [
-    "# Round Up\n",
-    " Congratulations! 🚀 You now have an understanding of Async and Sync clients and can hopefully leverage these concepts in your own applications.\n",
-    "\n",
-    " In the next tutorial, we will expore how to build an interactive ChatBot Agent! See you there ➡️!\n",
-    "\n",
-    "\n"
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "Python 3",
-   "name": "python3"
-  },
-  "language_info": {
-   "name": "python"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/.doctrees/nbsphinx/demos/demos/Unify/ChatBot/ChatBot.ipynb b/hub/.doctrees/nbsphinx/demos/demos/Unify/ChatBot/ChatBot.ipynb
deleted file mode 100644
index 5c06204539..0000000000
--- a/hub/.doctrees/nbsphinx/demos/demos/Unify/ChatBot/ChatBot.ipynb
+++ /dev/null
@@ -1,721 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Gp0FAI1Zkbxw"
-   },
-   "source": [
-    "# Build a ChatBot"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "i1QFiUcdR-aJ"
-   },
-   "source": [
-    "In this notebook, we will build an interactive chatbot using the `unifyai` python package.\n",
-    "\n",
-    "Under the hood, chatbots are very simple to implement. All LLM endpoints are stateless, and therefore the entire conversation history is repeatedly fed as input to the model. All that is required of the local agent is to store this history, and correctly pass it to the model."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EdCA_YoYQ-X8"
-   },
-   "source": [
-    "#### Install Dependencies"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "HS2xRFiNPSiL"
-   },
-   "source": [
-    "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0MqRVTcHgWhl",
-    "outputId": "dbae7a55-ecad-478c-bd57-c0ecdb0eaeaf"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Collecting unifyai==0.8.1\n",
-      "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-      "Requirement already satisfied: openai<2.0.0,>=1.12.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (1.17.1)\n",
-      "Requirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (3.7.1)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.7.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.6.4)\n",
-      "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.3.2)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.6)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2.0.7)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2024.2.2)\n",
-      "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.2.0)\n",
-      "Requirement already satisfied: httpcore==1.* in /usr/local/lib/python3.10/dist-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in /usr/local/lib/python3.10/dist-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.16.3)\n",
-      "Installing collected packages: unifyai\n",
-      "  Attempting uninstall: unifyai\n",
-      "    Found existing installation: unifyai 0.8.0\n",
-      "    Uninstalling unifyai-0.8.0:\n",
-      "      Successfully uninstalled unifyai-0.8.0\n",
-      "Successfully installed unifyai-0.8.1\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install unifyai"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rhgBuOhzRFeE"
-   },
-   "source": [
-    "#### The Agent"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "yX6plilUlGYl"
-   },
-   "source": [
-    "We define a simple chatbot class below, with the only public function being `run`. Before starting, you should to obtain a UNIFY key from the [console page](https://console.unify.ai/login?callbackUrl=%2F) and assign it to the `UNIFY_KEY` variable below."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "feMwwdteRuOL"
-   },
-   "outputs": [],
-   "source": [
-    "UNIFY_KEY = #ENTERUNIFYKEY"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "VGGw4tDagqV5"
-   },
-   "outputs": [],
-   "source": [
-    "import sys\n",
-    "\n",
-    "from typing import Optional\n",
-    "from unify import Unify\n",
-    "\n",
-    "\n",
-    "class ChatBot:\n",
-    "    \"\"\"Agent class represents an LLM chat agent.\"\"\"\n",
-    "\n",
-    "    def __init__(\n",
-    "        self,\n",
-    "        api_key: Optional[str] = None,\n",
-    "        endpoint: Optional[str] = None,\n",
-    "        model: Optional[str] = None,\n",
-    "        provider: Optional[str] = None,\n",
-    "    ) -> None:\n",
-    "        \"\"\"\n",
-    "        Initializes the ChatBot object.\n",
-    "\n",
-    "        Args:\n",
-    "            api_key (str, optional): API key for accessing the Unify API.\n",
-    "                If None, it attempts to retrieve the API key from the\n",
-    "                environment variable UNIFY_KEY.\n",
-    "                Defaults to None.\n",
-    "\n",
-    "            endpoint (str, optional): Endpoint name in OpenAI API format:\n",
-    "                <uploaded_by>/<model_name>@<provider_name>\n",
-    "                Defaults to None.\n",
-    "\n",
-    "            model (str, optional): Name of the model. If None,\n",
-    "            endpoint must be provided.\n",
-    "\n",
-    "            provider (str, optional): Name of the provider. If None,\n",
-    "            endpoint must be provided.\n",
-    "        Raises:\n",
-    "            UnifyError: If the API key is missing.\n",
-    "        \"\"\"\n",
-    "        self._message_history = []\n",
-    "        self._paused = False\n",
-    "        self._client = Unify(\n",
-    "            api_key=api_key,\n",
-    "            endpoint=endpoint,\n",
-    "            model=model,\n",
-    "            provider=provider,\n",
-    "        )\n",
-    "\n",
-    "    @property\n",
-    "    def client(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the client object.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The model name.\n",
-    "        \"\"\"\n",
-    "        return self._client\n",
-    "\n",
-    "    def set_client(self, value: Unify) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value: The unify client.\n",
-    "        \"\"\"\n",
-    "        self._client = value\n",
-    "\n",
-    "    @property\n",
-    "    def model(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the model name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The model name.\n",
-    "        \"\"\"\n",
-    "        return self._client.model\n",
-    "\n",
-    "    def set_model(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The model name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_model(value)\n",
-    "        if self._client.provider:\n",
-    "            self._client.set_endpoint(\"@\".join([value, self._client.provider]))\n",
-    "        else:\n",
-    "            mode = self._client.endpoint.split(\"@\")[1]\n",
-    "            self._client.set_endpoint(\"@\".join([value, mode]))\n",
-    "\n",
-    "    @property\n",
-    "    def provider(self) -> Optional[str]:\n",
-    "        \"\"\"\n",
-    "        Get the provider name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The provider name.\n",
-    "        \"\"\"\n",
-    "        return self._client.provider\n",
-    "\n",
-    "    def set_provider(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the provider name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The provider name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_provider(value)\n",
-    "        self._client.set_endpoint(\"@\".join([self._model, value]))\n",
-    "\n",
-    "    @property\n",
-    "    def endpoint(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the endpoint name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The endpoint name.\n",
-    "        \"\"\"\n",
-    "        return self._client.endpoint\n",
-    "\n",
-    "    def set_endpoint(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The endpoint name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_endpoint(value)\n",
-    "        self._client.set_model(value.split(\"@\")[0])\n",
-    "        self._client.set_provider(value.split(\"@\")[1])\n",
-    "\n",
-    "    def _get_credits(self):\n",
-    "        \"\"\"\n",
-    "        Retrieves the current credit balance from associated with the UNIFY account.\n",
-    "\n",
-    "        Returns:\n",
-    "            float: Current credit balance.\n",
-    "        \"\"\"\n",
-    "        return self._client.get_credit_balance()\n",
-    "\n",
-    "    def _process_input(self, inp: str, show_credits: bool, show_provider: bool):\n",
-    "        \"\"\"\n",
-    "        Processes the user input to generate AI response.\n",
-    "\n",
-    "        Args:\n",
-    "            inp (str): User input message.\n",
-    "            show_credits (bool): Whether to show credit consumption.\n",
-    "            show_credits (bool): Whether to show provider used.\n",
-    "\n",
-    "        Yields:\n",
-    "            str: Generated AI response chunks.\n",
-    "        \"\"\"\n",
-    "        self._update_message_history(role=\"user\", content=inp)\n",
-    "        initial_credit_balance = self._get_credits()\n",
-    "        stream = self._client.generate(\n",
-    "            messages=self._message_history,\n",
-    "            stream=True,\n",
-    "        )\n",
-    "        words = \"\"\n",
-    "        for chunk in stream:\n",
-    "            words += chunk\n",
-    "            yield chunk\n",
-    "\n",
-    "        self._update_message_history(\n",
-    "            role=\"assistant\",\n",
-    "            content=words,\n",
-    "        )\n",
-    "        final_credit_balance = self._get_credits()\n",
-    "        if show_credits:\n",
-    "            sys.stdout.write(\n",
-    "                \"\\n(spent {:.6f} credits)\".format(\n",
-    "                    initial_credit_balance - final_credit_balance,\n",
-    "                ),\n",
-    "            )\n",
-    "        if show_provider:\n",
-    "            sys.stdout.write(\"\\n(provider: {})\".format(self._client.provider))\n",
-    "\n",
-    "    def _update_message_history(self, role: str, content: str):\n",
-    "        \"\"\"\n",
-    "        Updates message history with user input.\n",
-    "\n",
-    "        Args:\n",
-    "            role (str): Either \"assistant\" or \"user\".\n",
-    "            content (str): User input message.\n",
-    "        \"\"\"\n",
-    "        self._message_history.append(\n",
-    "            {\n",
-    "                \"role\": role,\n",
-    "                \"content\": content,\n",
-    "            },\n",
-    "        )\n",
-    "\n",
-    "    def clear_chat_history(self):\n",
-    "        \"\"\"Clears the chat history.\"\"\"\n",
-    "        self._message_history.clear()\n",
-    "\n",
-    "    def run(self, show_credits: bool = False, show_provider: bool = False):\n",
-    "        \"\"\"\n",
-    "        Starts the chat interaction loop.\n",
-    "\n",
-    "        Args:\n",
-    "            show_credits (bool, optional): Whether to show credit consumption.\n",
-    "            Defaults to False.\n",
-    "            show_provider (bool, optional): Whether to show the provider used.\n",
-    "            Defaults to False.\n",
-    "        \"\"\"\n",
-    "        if not self._paused:\n",
-    "            sys.stdout.write(\n",
-    "                \"Let's have a chat. (Enter `pause` to pause and `quit` to exit)\\n\",\n",
-    "            )\n",
-    "            self.clear_chat_history()\n",
-    "        else:\n",
-    "            sys.stdout.write(\n",
-    "                \"Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\\n\",\n",
-    "            )\n",
-    "        self._paused = False\n",
-    "        while True:\n",
-    "            sys.stdout.write(\"> \")\n",
-    "            inp = input()\n",
-    "            if inp == \"quit\":\n",
-    "                self.clear_chat_history()\n",
-    "                break\n",
-    "            elif inp == \"pause\":\n",
-    "                self._paused = True\n",
-    "                break\n",
-    "            for word in self._process_input(inp, show_credits, show_provider):\n",
-    "                sys.stdout.write(word)\n",
-    "                sys.stdout.flush()\n",
-    "            sys.stdout.write(\"\\n\")\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "1Swnehb9Rvdh"
-   },
-   "source": [
-    "#### Let's Chat"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Qrsyr6gZmGFs"
-   },
-   "source": [
-    "Now, we can instantiate and chat with this agent. For this demo, we'll utilize the `llama-2-7b-chat` model from `anyscale`. However, you have the flexibility to select any model and provider from our supported options on the [benchmarks interface](https://unify.ai/hub)."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "b25iLp5nOPxQ",
-    "outputId": "a1f6c38f-9774-4544-e761-2ba667eba787"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      ">  Hi, nice to meet you. My name is Foo Barrymore, and I am 25 years old.\n",
-      "  Hello Foo! Nice to meet you too. I'm just an AI, I don't have a personal name, but I'm here to help you with any questions or concerns you might have. How has your day been so far?\n",
-      "> How old am I?\n",
-      "  You've told me that you're 25 years old. Is there anything else you'd like to know or discuss?\n",
-      "> Your memory is astounding\n",
-      "  Thank you! I'm glad you think so. I'm designed to remember and process large amounts of information, and I'm constantly learning and improving my abilities. However, it's important to note that my memory is not perfect, and there may be times when I forget or misremember certain details. If you have any specific questions or concerns about my memory or abilities, feel free to ask!\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-    "agent.run()"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "TxK6r9yrnfUS"
-   },
-   "source": [
-    "You can also see how many credits your prompt used. This option is set in the constructor, but it can be overwritten during the run command. When enabled, each response from the chatbot will then be appended with the credits spent:\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "C8y34VMGnI93",
-    "outputId": "b5d46d0c-72a5-4b17-81a8-e78188eb835e"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> What is the capital of Palestine?\n",
-      "  The question of the capital of Palestine is a politically sensitive and complex issue. The status of Jerusalem is disputed between Israelis and Palestinians, with both sides claiming it as their capital.\n",
-      "\n",
-      "The Palestinian National Authority, which governs the Palestinian territories in the West Bank and Gaza Strip, has its administrative center in Ramallah, which is often referred to as the \"de facto capital\" of Palestine. However, the Palestinian Authority has not declared a capital city, and the issue remains a matter of debate and negotiation in the Israeli-Palestinian peace process.\n",
-      "\n",
-      "The international community has not recognized any capital of Palestine, and many countries maintain their diplomatic missions to the Palestinian Authority in Tel Aviv, Israel, rather than in Ramallah or East Jerusalem, which is claimed by the Palestinians as the capital of a future Palestinian state.\n",
-      "\n",
-      "It is important to note that the issue of the capital of Palestine is closely tied to the broader conflict between Israelis and Palestinians, and any resolution to the conflict will need to address this issue in a way that is acceptable to both sides.\n",
-      "(spent 0.000274 credits)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Yc_rSlnroeWK"
-   },
-   "source": [
-    "Finally, you can switch providers half-way through the conversation easily. This can be useful to handle prompt of varying complexity.\n",
-    "\n",
-    "For example we can start with a small model for answering simple questions, such as recalling facts, and then move to a larger model for a more complex task, such as creative writing."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0N9GeB9KnrX-",
-    "outputId": "ae913b2c-2bbf-4ff9-f9b6-fa98ae376c13"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> What is the capital of Portugal?\n",
-      "  The capital of Portugal is Lisbon (Portuguese: Lisboa).\n",
-      "(spent 0.000032 credits)\n",
-      "> My name is José Mourinho.\n",
-      "  Ah, I see! José Mourinho is a well-known Portuguese football manager and former football player. He has managed several top-level clubs, including Chelsea, Inter Milan, Real Madrid, and Manchester United. Mourinho is known for his tactical approach to football and his ability to motivate his players. He has won numerous honors and awards throughout his career, including several league titles, domestic cups, and European championships. Is there anything else you'd like to know about José Mourinho?\n",
-      "(spent 0.000159 credits)\n",
-      "> pause\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "gQnQFGf0qxTE",
-    "outputId": "24632ab9-8dff-414f-ab4d-cc57b444989e"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\n",
-      "> Please write me a poem about my life in Lisbon, using my name in the poem.\n",
-      "In Lisbon's embrace, where tales intertwine,\n",
-      "Lives José Mourinho, beneath the sun's fine shine.\n",
-      "From cobblestone streets where echoes dance,\n",
-      "To the Tagus' gentle waves that entrance.\n",
-      "\n",
-      "In youth, he dreamt beneath Iberian skies,\n",
-      "Where passion is fierce and ambition never dies.\n",
-      "With a ball at his feet and dreams in his heart,\n",
-      "In Lisbon's grand story, he crafted his part.\n",
-      "\n",
-      "Eduardo VII Park, in the spring's embrace,\n",
-      "Where thoughts of tactics first took place.\n",
-      "Through Alfama's alleys, past Fado's mournful sound,\n",
-      "Mourinho's purpose, in football, was found.\n",
-      "\n",
-      "From Benfica's nest to União de Leiria's helm,\n",
-      "His journey began, in a realm\n",
-      "Where strategies and plays, meticulously spun,\n",
-      "Foreshadowed the triumphs that would be won.\n",
-      "\n",
-      "In Estádio da Luz, where eagles soar,\n",
-      "Mourinho pondered scores and more.\n",
-      "Though his stay was brief, the impact was deep;\n",
-      "In Lisbon's lore, his legacy would steep.\n",
-      "\n",
-      "The boy from Setúbal, with Lisbon in his tale,\n",
-      "Set forth to conquer, to win, and to prevail.\n",
-      "Through Porto, London, Milan, Madrid's grand stage,\n",
-      "His story was written, page by page.\n",
-      "\n",
-      "Yet, amidst the victories and the fame's bright light,\n",
-      "In his heart, Lisbon remains, ever so bright.\n",
-      "For it's there José Mourinho's dreams took flight,\n",
-      "In Lisbon's embrace, under the starry night.\n",
-      "\n",
-      "So, here's to Mourinho, with Lisbon's spirit in his veins,\n",
-      "Where the love for the game forever remains.\n",
-      "In every triumph, in every fall,\n",
-      "Lisbon, his beginning, the most cherished of all.\n",
-      "(spent 0.012020 credits)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.set_endpoint(\"gpt-4-turbo@openai\")\n",
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "dQ0AqGSvrTaP"
-   },
-   "source": [
-    "Switching between providers mid-conversation makes it much easier to maximize quality and runtime performance based on the latest metrics, and also save on costs!\n",
-    "\n",
-    "In fact, you can automatically optimize for a metric of your choice with our [dynamic routing modes](https://unify.ai/docs/hub/concepts/runtime_routing.html#available-modes). For example, you can optimize for speed as follows:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "n4W-35vbrFDP",
-    "outputId": "6065088a-b79d-4ab7-96d5-7dd1cfc67ccf"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Tell me your favorite physics fact.\n",
-      "My favorite physics fact is that the universe is still expanding! This means that the galaxies that are currently moving away from us will continue to move away from us, and eventually, they will move faster than the speed of light. This is known as the \"dark energy\" that is thought to be responsible for the acceleration of the universe's expansion.\n",
-      "\n",
-      "I find this fascinating because it shows that the universe is still evolving and changing, and there is still so much to learn about it. It's mind-boggling to think about the vastness of space and the mysteries that it holds.\n",
-      "\n",
-      "Additionally, this fact also reminds me of the importance of continuous learning and exploration. There is always more to discover and understand, and it's important to have a curious and open-minded approach to life.\n",
-      "\n",
-      "I hope this fact inspires you to learn more about the wonders of the universe!\n",
-      "(provider: fireworks-ai)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.set_endpoint(\"llama-2-70b-chat@highest-tks-per-sec\")\n",
-    "agent.run(show_provider=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "wqSzrxL9WydO"
-   },
-   "source": [
-    "The flag `show_provider` ensures that the specific provider is printed at the end of each response. For example, sometimes `anyscale` might be the fastest, and at other times it might be `together-ai` or `fireworks-ai`. This flag enables you to keep track of what provider is being used under the hood."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "RM1uIFFaG9Gj"
-   },
-   "source": [
-    "If the task is to summarize a document or your chat history grows, typically the input-cost becomes the primary cost driver. You can use our `lowest-input-cost` mode to direct queries to the provider with the lowest input cost automatically."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "-1SG4s7BIpmR",
-    "outputId": "18a2f091-3dc9-4065-c475-85c4b32e2bac"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Summarize the following in less than 10 words: Sir Isaac Newton FRS (25 December 1642 – 20 March 1726/27[a]) was an English polymath active as a mathematician, physicist, astronomer, alchemist, theologian, and author who was described in his time as a natural philosopher.[7] He was a key figure in the Scientific Revolution and the Enlightenment that followed. His pioneering book Philosophiæ Naturalis Principia Mathematica (Mathematical Principles of Natural Philosophy), first published in 1687, consolidated many previous results and established classical mechanics.[8][9] Newton also made seminal contributions to optics, and shares credit with German mathematician Gottfried Wilhelm Leibniz for developing infinitesimal calculus, though he developed calculus years before Leibniz.[10][11]  In the Principia, Newton formulated the laws of motion and universal gravitation that formed the dominant scientific viewpoint for centuries until it was superseded by the theory of relativity. Newton used his mathematical description of gravity to derive Kepler's laws of planetary motion, account for tides, the trajectories of comets, the precession of the equinoxes and other phenomena, eradicating doubt about the Solar System's heliocentricity.[12] He demonstrated that the motion of objects on Earth and celestial bodies could be accounted for by the same principles. Newton's inference that the Earth is an oblate spheroid was later confirmed by the geodetic measurements of Maupertuis, La Condamine, and others, convincing most European scientists of the superiority of Newtonian mechanics over earlier systems.  Newton built the first practical reflecting telescope and developed a sophisticated theory of colour based on the observation that a prism separates white light into the colours of the visible spectrum. His work on light was collected in his highly influential book Opticks, published in 1704. He also formulated an empirical law of cooling, made the first theoretical calculation of the speed of sound, and introduced the notion of a Newtonian fluid. In addition to his work on calculus, as a mathematician Newton contributed to the study of power series, generalised the binomial theorem to non-integer exponents, developed a method for approximating the roots of a function, and classified most of the cubic plane curves.  Newton was a fellow of Trinity College and the second Lucasian Professor of Mathematics at the University of Cambridge. He was a devout but unorthodox Christian who privately rejected the doctrine of the Trinity. He refused to take holy orders in the Church of England, unlike most members of the Cambridge faculty of the day. Beyond his work on the mathematical sciences, Newton dedicated much of his time to the study of alchemy and biblical chronology, but most of his work in those areas remained unpublished until long after his death. Politically and personally tied to the Whig party, Newton served two brief terms as Member of Parliament for the University of Cambridge, in 1689–1690 and 1701–1702. He was knighted by Queen Anne in 1705 and spent the last three decades of his life in London, serving as Warden (1696–1699) and Master (1699–1727) of the Royal Mint, as well as president of the Royal Society (1703–1727).\n",
-      "  Newton: polymath, mathematician, physicist, astronomer, alchemist, theologian, and author.\n",
-      "(provider: octoai)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key=UNIFY_KEY, endpoint=\"llama-2-70b-chat@lowest-input-cost\")\n",
-    "agent.run(show_provider=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "W-EaEPxAKdKe"
-   },
-   "source": [
-    "# Python Package"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "W9vhGX9aKncg"
-   },
-   "source": [
-    "The python package already contains the `ChatBot` agent and you may use it directly as follows:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "en7GCev9KmgX",
-    "outputId": "fcaa2b15-88a1-4108-e68e-a95b4c403302"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Hey! How's it going?\n",
-      "  Hello! I'm doing well, thank you for asking! It's going great here, just busy with various tasks and learning new things. However, I must point out that this conversation is a bit unusual as I'm just an AI and don't have personal experiences or emotions like humans do. I'm here to help answer any questions you may have, so feel free to ask me anything!\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import ChatBot\n",
-    "chatbot = ChatBot(api_key = UNIFY_KEY, endpoint=\"llama-2-7b-chat@anyscale\")\n",
-    "chatbot.run()\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "nyq473oLxjoh"
-   },
-   "source": [
-    "# Round Up\n",
-    " Congratulations! 🚀 You are now capable of building ChatBot Agents for your application using our LLM endpoints. "
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "collapsed_sections": [
-    "1Swnehb9Rvdh"
-   ],
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "Python 3",
-   "name": "python3"
-  },
-  "language_info": {
-   "name": "python"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/.doctrees/nbsphinx/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb b/hub/.doctrees/nbsphinx/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb
deleted file mode 100644
index d207d82042..0000000000
--- a/hub/.doctrees/nbsphinx/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb
+++ /dev/null
@@ -1,479 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "UxqB7_Ieur0s"
-   },
-   "source": [
-    "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb) [![Open nbviewer](https://raw.githubusercontent.com/pinecone-io/examples/master/assets/nbviewer-shield.svg)](https://nbviewer.org/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EduhQaNAur0u"
-   },
-   "source": [
-    "# Dynamic Routes"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "_4JgNeX4ur0v"
-   },
-   "source": [
-    "In semantic-router there are two types of routes that can be chosen. Both routes belong to the `Route` object, the only difference between them is that _static_ routes return a `Route.name` when chosen, whereas _dynamic_ routes use an LLM call to produce parameter input values.\n",
-    "\n",
-    "For example, a _static_ route will tell us if a query is talking about mathematics by returning the route name (which could be `\"math\"` for example). A _dynamic_ route can generate additional values, so it may decide a query is talking about maths, but it can also generate Python code that we can later execute to answer the user's query, this output may look like `\"math\", \"import math; output = math.sqrt(64)`.\n",
-    "\n",
-    "***⚠️ Note: We have a fully local version of dynamic routes available at [docs/05-local-execution.ipynb](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb). The local 05 version tends to outperform the OpenAI version we demo in this notebook, so we'd recommend trying [05](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb)!***"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "bbmw8CO4ur0v"
-   },
-   "source": [
-    "## Installing the Library"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 12,
-   "metadata": {
-    "id": "dLElfRhgur0v"
-   },
-   "outputs": [
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "  error: subprocess-exited-with-error\n",
-      "  \n",
-      "  × Building wheel for llama-cpp-python (pyproject.toml) did not run successfully.\n",
-      "  │ exit code: 1\n",
-      "  ╰─> [20 lines of output]\n",
-      "      *** scikit-build-core 0.9.2 using CMake 3.29.2 (wheel)\n",
-      "      *** Configuring CMake...\n",
-      "      2024-04-29 12:24:08,789 - scikit_build_core - WARNING - Can't find a Python library, got libdir=None, ldlibrary=None, multiarch=None, masd=None\n",
-      "      loading initial cache file C:\\Users\\indir\\AppData\\Local\\Temp\\tmppik1ey4m\\build\\CMakeInit.txt\n",
-      "      -- Building for: NMake Makefiles\n",
-      "      CMake Error at CMakeLists.txt:3 (project):\n",
-      "        Running\n",
-      "      \n",
-      "         'nmake' '-?'\n",
-      "      \n",
-      "        failed with:\n",
-      "      \n",
-      "         no such file or directory\n",
-      "      \n",
-      "      \n",
-      "      CMake Error: CMAKE_C_COMPILER not set, after EnableLanguage\n",
-      "      CMake Error: CMAKE_CXX_COMPILER not set, after EnableLanguage\n",
-      "      -- Configuring incomplete, errors occurred!\n",
-      "      \n",
-      "      *** CMake configuration failed\n",
-      "      [end of output]\n",
-      "  \n",
-      "  note: This error originates from a subprocess, and is likely not a problem with pip.\n",
-      "  ERROR: Failed building wheel for llama-cpp-python\n",
-      "ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects\n",
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Requirement already satisfied: unifyai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (0.8.1)\n",
-      "Requirement already satisfied: openai<2.0.0,>=1.12.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (1.20.0)\n",
-      "Requirement already satisfied: requests<3.0.0,>=2.31.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.3.0)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.9.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.7.0)\n",
-      "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.2.0)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.4)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.3)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2023.5.7)\n",
-      "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-      "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.18.1)\n",
-      "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai<2.0.0,>=1.12.0->unifyai) (0.4.6)\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Requirement already satisfied: openai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (1.20.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.3.0)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.9.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (2.7.0)\n",
-      "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.11.0)\n",
-      "Requirement already satisfied: idna>=2.8 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (3.4)\n",
-      "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (1.2.0)\n",
-      "Requirement already satisfied: certifi in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (2023.5.7)\n",
-      "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (2.18.1)\n",
-      "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai) (0.4.6)\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install -qU \"semantic-router[local]==0.0.20\"\n",
-    "!pip install unifyai\n",
-    "!pip install openai\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "BixZd6Eour0w"
-   },
-   "source": [
-    "## Initializing Routes and RouteLayer"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "PxnW9qBvur0x"
-   },
-   "source": [
-    "Dynamic routes are treated in the same way as static routes, let's begin by initializing a `RouteLayer` consisting of static routes."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 10,
-   "metadata": {
-    "id": "kc9Ty6Lgur0x"
-   },
-   "outputs": [],
-   "source": [
-    "from semantic_router import Route\n",
-    "\n",
-    "# Define routes for Math and Coding\n",
-    "math_route = Route(\n",
-    "    name=\"math\",\n",
-    "    utterances=[\n",
-    "        \"solve for x in the equation\",\n",
-    "        \"what is the integral of\",\n",
-    "        \"how to calculate the derivative\",\n",
-    "        \"mathematical proofs\",\n",
-    "        \"how do you find the percentage of this number\"\n",
-    "    ],\n",
-    ")\n",
-    "\n",
-    "coding_route = Route(\n",
-    "    name=\"coding\",\n",
-    "    utterances=[\n",
-    "        \"how to write a for loop in Python\",\n",
-    "        \"explain the use of classes in Java\",\n",
-    "        \"what is recursion in programming\",\n",
-    "        \"how do i optimise this problem using hash tables\",\n",
-    "        \"suggest a more efficient data structure for this problem\"\n",
-    "    ],\n",
-    ")\n",
-    "\n",
-    "# List of all routes\n",
-    "routes = [math_route, coding_route]"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "voWyqmffur0x"
-   },
-   "source": [
-    "We initialize our `RouteLayer` with our `encoder` and `routes`. We can use popular encoder APIs like `CohereEncoder` and `OpenAIEncoder`, or local alternatives like `FastEmbedEncoder`."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 11,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "BI9AiDspur0y",
-    "outputId": "27329a54-3f16-44a5-ac20-13a6b26afb97"
-   },
-   "outputs": [
-    {
-     "ename": "ImportError",
-     "evalue": "Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`",
-     "output_type": "error",
-     "traceback": [
-      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:25\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     24\u001b[0m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[1;32m---> 25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n",
-      "\u001b[1;31mImportError\u001b[0m: cannot import name 'TextEmbedding' from 'fastembed' (unknown location)",
-      "\nDuring handling of the above exception, another exception occurred:\n",
-      "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-      "Cell \u001b[1;32mIn [11], line 6\u001b[0m\n\u001b[0;32m      3\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m RouteLayer\n\u001b[0;32m      4\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01mencoders\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FastEmbedEncoder\n\u001b[1;32m----> 6\u001b[0m encoder \u001b[38;5;241m=\u001b[39m \u001b[43mFastEmbedEncoder\u001b[49m\u001b[43m(\u001b[49m\u001b[43mname\u001b[49m\u001b[38;5;241;43m=\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[38;5;124;43mBAAI/bge-small-en-v1.5\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[43m)\u001b[49m\n\u001b[0;32m      8\u001b[0m rl \u001b[38;5;241m=\u001b[39m RouteLayer(encoder\u001b[38;5;241m=\u001b[39mencoder, routes\u001b[38;5;241m=\u001b[39mroutes)\n",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:21\u001b[0m, in \u001b[0;36mFastEmbedEncoder.__init__\u001b[1;34m(self, score_threshold, **data)\u001b[0m\n\u001b[0;32m     17\u001b[0m \u001b[38;5;28;01mdef\u001b[39;00m \u001b[38;5;21m__init__\u001b[39m(\n\u001b[0;32m     18\u001b[0m     \u001b[38;5;28mself\u001b[39m, score_threshold: \u001b[38;5;28mfloat\u001b[39m \u001b[38;5;241m=\u001b[39m \u001b[38;5;241m0.5\u001b[39m, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata\n\u001b[0;32m     19\u001b[0m ):  \u001b[38;5;66;03m# TODO default score_threshold not thoroughly tested, should optimize\u001b[39;00m\n\u001b[0;32m     20\u001b[0m     \u001b[38;5;28msuper\u001b[39m()\u001b[38;5;241m.\u001b[39m\u001b[38;5;21m__init__\u001b[39m(score_threshold\u001b[38;5;241m=\u001b[39mscore_threshold, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata)\n\u001b[1;32m---> 21\u001b[0m     \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39m_client \u001b[38;5;241m=\u001b[39m \u001b[38;5;28;43mself\u001b[39;49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43m_initialize_client\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\n",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:27\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n\u001b[1;32m---> 27\u001b[0m     \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m(\n\u001b[0;32m     28\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mPlease install fastembed to use FastEmbedEncoder. \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     29\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mYou can install it with: \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     30\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m`pip install \u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124msemantic-router[fastembed]\u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124m`\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     31\u001b[0m     )\n\u001b[0;32m     33\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {\n\u001b[0;32m     34\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmodel_name\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mname,\n\u001b[0;32m     35\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmax_length\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mmax_length,\n\u001b[0;32m     36\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mcache_dir\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mcache_dir,\n\u001b[0;32m     37\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mthreads\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mthreads,\n\u001b[0;32m     38\u001b[0m }\n\u001b[0;32m     40\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {k: v \u001b[38;5;28;01mfor\u001b[39;00m k, v \u001b[38;5;129;01min\u001b[39;00m embedding_args\u001b[38;5;241m.\u001b[39mitems() \u001b[38;5;28;01mif\u001b[39;00m v \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m}\n",
-      "\u001b[1;31mImportError\u001b[0m: Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`"
-     ]
-    }
-   ],
-   "source": [
-    "import os\n",
-    "from getpass import getpass\n",
-    "from semantic_router import RouteLayer\n",
-    "from semantic_router.encoders import HuggingFaceEncoder\n",
-    "\n",
-    "encoder = HuggingFaceEncoder()\n",
-    "\n",
-    "rl = RouteLayer(encoder=encoder, routes=routes)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "GuLCeIS5ur0y"
-   },
-   "source": [
-    "We run the solely static routes layer:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "_rNREh7gur0y",
-    "outputId": "f3a1dc0b-d760-4efb-b634-d3547011dcb7"
-   },
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "RouteChoice(name='math', function_call=None, similarity_score=None)"
-      ]
-     },
-     "execution_count": 4,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "rl(\"Solve the equation 5-x=12 for x?\")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 13,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "from unify import Unify\n",
-    "# Environment setup for API keys\n",
-    "os.environ[\"UNIFY_KEY\"] =  getpass(\"Enter Unify API Key: \")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "import os\n",
-    "from unify import ChatBot\n",
-    "\n",
-    "def test_unify_endpoint():\n",
-    "    try:\n",
-    "        # Set up the ChatBot with a known working endpoint and API key\n",
-    "        agent = ChatBot(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"gpt-4@anyscale\"  # Adjust this if necessary\n",
-    "        )\n",
-    "        \n",
-    "        # Example prompt to test the service\n",
-    "        test_prompt = \"What is 2+2?\"\n",
-    "        \n",
-    "        # Making a request to the Unify service\n",
-    "        response = agent.run(test_prompt)\n",
-    "        print(\"Response from Unify:\", response)\n",
-    "        \n",
-    "    except Exception as e:\n",
-    "        print(\"Failed to connect to Unify endpoint:\", str(e))\n",
-    "\n",
-    "if __name__ == \"__main__\":\n",
-    "    test_unify_endpoint()\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 44,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "#Unify process query\n",
-    "def process_query(query):\n",
-    "    route_choice = rl(query)\n",
-    "    print(f\"Route chosen: {route_choice.name}\")\n",
-    "\n",
-    "    if route_choice.name == \"math\":\n",
-    "        # Initialize Unify with the endpoint for math queries\n",
-    "        unify = Unify(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"llama-2-13b-chat@anyscale\"  # Use the correct endpoint for math queries, other models not working\n",
-    "        )\n",
-    "        # Generate the response using Unify\n",
-    "        response = unify.generate(user_prompt=query)\n",
-    "        return response\n",
-    "\n",
-    "    elif route_choice.name == \"coding\":\n",
-    "        # Initialize Unify with the endpoint for coding queries\n",
-    "        unify = Unify(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"codellama-34b-instruct@anyscale\"  # Use the correct endpoint for coding queries\n",
-    "        )\n",
-    "        # Generate the response using Unify\n",
-    "        response = unify.generate(user_prompt=query)\n",
-    "        return response\n",
-    "\n",
-    "    else:\n",
-    "        return \"This query does not fall under a supported category.\"\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 45,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Route chosen: math\n",
-      "Sure! To solve the equation 5 - x = 12, we can add x to both sides of the equation.\n",
-      "\n",
-      "5 - x = 12\n",
-      "\n",
-      "Adding x to both sides gives us:\n",
-      "\n",
-      "5 = 12 + x\n",
-      "\n",
-      "Now we can subtract 12 from both sides:\n",
-      "\n",
-      "5 - 12 = x\n",
-      "\n",
-      "This simplifies to:\n",
-      "\n",
-      "-7 = x\n",
-      "\n",
-      "So the solution to the equation 5 - x = 12 is x = -7.\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Process query test\n",
-    "print(process_query(\"Solve the equation 5-x=12 for x?\"))"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 39,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Route chosen: coding\n",
-      "\n",
-      "Here is the code:\n",
-      "\n",
-      "```py\n",
-      "my_list = []\n",
-      "for num in range(1, 11):\n",
-      "    my_list.append(num)\n",
-      "```\n",
-      "\n",
-      "This will create a list containing the numbers 1 to 10 inclusively with each number in its own cell.\n",
-      "\n",
-      "_Note: The range() function is used to generate a sequence of numbers. The range() function when passed only one argument (in this case, 11) will return the sequence of numbers starting from 0 and going up to, but not including, the number passed, which is 11 in this case. By passing 1 as the starting number (range(1, 11)), we get the numbers from 1 to 10._\n",
-      "\n",
-      "Now you have a list with numbers from 1 to 10 in it. Here are some ways to use it:\n",
-      "\n",
-      "```py\n",
-      "print(my_list[0])  # prints the first element which is 1\n",
-      "print(my_list[9])  # prints the last element which is 10\n",
-      "print(my_list)  # prints the whole list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]\n",
-      "```\n",
-      "\n",
-      "Let me know if you have further questions! 😊\n"
-     ]
-    }
-   ],
-   "source": [
-    "print(process_query(\"Write a for loop in python that appends numbers from 1-10 in a list\"))"
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "decision-layer",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.10.11"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/_images/mixtral-providers.png b/hub/_images/mixtral-providers.png
deleted file mode 100644
index e082f4c63b..0000000000
Binary files a/hub/_images/mixtral-providers.png and /dev/null differ
diff --git a/hub/_images/mixtral-router.png b/hub/_images/mixtral-router.png
deleted file mode 100644
index 441c77ecb4..0000000000
Binary files a/hub/_images/mixtral-router.png and /dev/null differ
diff --git a/hub/_images/unify.gif b/hub/_images/unify.gif
deleted file mode 100644
index 430ffc85da..0000000000
Binary files a/hub/_images/unify.gif and /dev/null differ
diff --git a/hub/_sources/api/benchmarks.rst.txt b/hub/_sources/api/benchmarks.rst.txt
deleted file mode 100644
index 3197092594..0000000000
--- a/hub/_sources/api/benchmarks.rst.txt
+++ /dev/null
@@ -1,44 +0,0 @@
-Benchmarking
-=============
-
-When comparing LLMs, there is a constant tradeoff to make between quality, cost and latency. Stronger models are (in general) slower and more expensive - and sometimes overkill for the task at hand. Complicating matters further, new models are released weekly, each claiming to be state-of-the-art.
-
-Benchmarking on your data lets you see how each of the different models perform on your task.
-
-.. image:: ../images/benchmarks.png
-  :align: center
-  :width: 800
-  :alt: Benchmarks Image.
-
-You can compare how quality relates to cost and latency, with live stats pulled from our `runtime benchmarks <https://unify.ai/benchmarks>`_.
-
-When new models come out, simply re-run the benchmark to see how they perform on your task.
-
-
-Preparing your dataset
------------------------
-First create a dataset which is representative of the task you want to evaluate.
-You will need a list of prompts, optionally including a reference, *gold-standard* answer. Datasets containing reference answers tend to get more accurate benchmarks.
-
-The file itself should be in JSONL format, with one entry per line, as in the example below.
-
-.. code-block::
-
-    {"prompt": "This is the first prompt", "ref_answer": "This is the first reference answer"}
-    {"prompt": "This is the second prompt", "ref_answer": "This is the second reference answer"}
-
-Use at least 50 prompts to get the most accurate results. Currently there is an maximum limit of 500 prompts, for most tasks we don’t tend to see much extra detail past ~250.
-
-Benchmarking your dataset
--------------------------
-In `your dashboard <https://console.unify.ai/dashboard>`_, clicking :code:`Select benchmark` and then :code:`Benchmark your prompts` opens the interface to upload a dataset.
-
-When the benchmark finishes, you'll receive an email, and the graph will be displayed in your `dashboard <https://console.unify.ai/dashboard>`_.
-
-The x-axis can be set to represent :code:`cost`, :code:`time-to-first-token`, or :code:`inter-token latency`, and on either a linear or log scale.
-
-How does it work?
-^^^^^^^^^^^^^^^^^^
-Currently, we use gpt4o-as-a-judge (cf. https://arxiv.org/abs/2306.05685), to evaluate the quality of each model’s responses.
-
-
diff --git a/hub/_sources/concepts/benchmarks.rst.txt b/hub/_sources/concepts/benchmarks.rst.txt
index 50c4ed55b6..3197092594 100644
--- a/hub/_sources/concepts/benchmarks.rst.txt
+++ b/hub/_sources/concepts/benchmarks.rst.txt
@@ -1,156 +1,44 @@
-Benchmarks
-==========
+Benchmarking
+=============
 
-In this section, we explain our process for benchmarking LLM endpoints. We discuss quality and runtime benchmarks separately. 
+When comparing LLMs, there is a constant tradeoff to make between quality, cost and latency. Stronger models are (in general) slower and more expensive - and sometimes overkill for the task at hand. Complicating matters further, new models are released weekly, each claiming to be state-of-the-art.
 
-Quality Benchmarks
-------------------
+Benchmarking on your data lets you see how each of the different models perform on your task.
 
-Finding the best LLM(s) for a given application can be challenging. The performance of a model can vary significantly depending on the task, dataset, and evaluation metrics used. Existing benchmarks attempt to compare models based on standardized approaches, but biases inevitably creep in as models learn to do well on these targeted assessments.
-
-Practically, the LLM community still heavily relies on testing models manually to build an intuition around their expected behavior for a given use-case. While this generally works better, hand-crafted testing isn't sustainable as one's needs evolve and new LLMs emerge at a rapid pace. 
-Our LLM assessment pipeline is based on the method outlined below.
-
-Design Principles
-^^^^^^^^^^^^^^^^^
-
-Our quality benchmarks are based on a set of guiding principles. Specifically, we strive to make our pipeline:
-
-- **Systematized:** A rigorous benchmarking pipeline should be standardized across assessments, repeatable, and scalable. We make sure to benchmark all LLMs identically to with a well-defined approach we outline in the next passage.  
-
-- **Task-centric:** Models perform differently on various tasks. Some might do better at coding, others are well suited for summarizing content, etc. These broad task categories can also be refined into specific subtasks. For e.g summarizing technical content to generate product documentation is radically different from summarizing news. This should be reflected in assessments. For this reason, we allow you to upload your custom prompt dataset, that you believe reflects the intended task, to use as a reference for running benchmarks.  
-
-- **Customizable:** Assessments should reflect the unique needs of the assessor. Depending on your application requirements, you may need to strictly include / exclude some models from the benchmarks. We try to strike a balance between standardization and modularity such that you can run the benchmarks that are relevant to your needs. 
-
-Methodology
-^^^^^^^^^^^
-
-Overview
-********
-We benchmark models using the LLM-as-a-judge approach. This relies on using a powerful language model to generate assessments on the outputs of other models, using a standard reviewing procedure. LLM-as-a-judge is sometimes used to run experiments at scale when generating human assessments isn't an option or to avoid introducing human biases.
-
-Given a dataset of user prompts, each prompt is sent to all endpoints to generate an output. Then, we ask GPT-4 to review each output and give a final assessment based on how helpful and accurate the response is relative to either (a) the user prompt, in the case of unlabelled datasets, or (b) the prompt and the reference answer, in the case of labelled datasets.
-
-Scoring
-*******
-
-The assessor LLM reviews the output of an endpoint which it categorizes as :code:`irrelevant`, :code:`bad`, :code:`satisfactory`, :code:`very good`, or :code:`excellent`. Each of these labels is then mapped to a numeric score ranging from 0.0 to 1.0. We repeat the same proces for all prompts in the dataset to get the endpoint's performance score on each prompt. The overall endpoint's score is then the average of these prompt-specific scores.
-
-Visualizing Results
-*******************
-
-In addition to the list of model scores, we also compute runtime performance for the endpoint (as explained in the section below). Doing so allows us to plot the quality performance versus runtime to assess the quality-to-performance of the endpoints, instead of relying on the quality scores alone.
-
-.. image:: ../images/console_dashboard.png
+.. image:: ../images/benchmarks.png
   :align: center
-  :width: 650
-  :alt: Console Dashboard.
-
-.. note::
-    Because quality scores are model-specific, they are the same across the different endpoints exposed for a given model. As a result, all the endpoints for a model will plot horizontally at the same quality level, with only the runtime metric setting them apart.
-
-Considerations and Limitations
-^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
-
-Despite having a well-defined benchmarking approach, it also inevitably comes with its own issues. Using an LLM to judge outputs may introduce a different kind of bias through the data used to train the assessor model. We are currently looking at ways to mitigate this with more diversified and / or customized judge LLM selection.
-
-Runtime Benchmarks
-------------------
-
-Finding the best model(s) for a task is just the first step to optimize LLM pipelines. Given the plethora of endpoint providers offering the same models, true optimization requires considering performance discrepancies across endpoints and time.
-
-Because this is a complex decision, it needs to be made based on data. For this data to be reliable, it should also result from transparent and objective measurements, which we outline in this below.
-
-.. note::
-    Our benchmarking code is openly available in `this repository <https://github.com/unifyai/aibench-llm-endpoints>`_.
-
-Design Principles
-^^^^^^^^^^^^^^^^^
-
-Our runtime benchmarks are based on a set of guiding principles. Specifically, we believe benchmarks should be:
-
-- **Community-driven:** We invite everyone to audit or improve the logic and the code. We are building these benchmarks for the community, so contributions and discussions around them are more than welcome!
+  :width: 800
+  :alt: Benchmarks Image.
 
-- **User-centric:** External factors (e.g. how different providers set up their infrastructure) may impact measurements. Nevertheless, our benchmarks are not designed to gauge performance in controlled environments. Rather, we aime to measure performance as experienced by the end-user who, ultimately, is subject to the same distortions.
+You can compare how quality relates to cost and latency, with live stats pulled from our `runtime benchmarks <https://unify.ai/benchmarks>`_.
 
-- **Model and Provider-agnostic:** While some metrics are more relevant to certain scenarios (e.g. cold start time in model endpoints that scale to zero), we try to make as few assumptions as possible on the providers or technologies being benchmarked. We only assume that endpoints take a string as the input and return a streaming response.
+When new models come out, simply re-run the benchmark to see how they perform on your task.
 
 
-Methodology
-^^^^^^^^^^^
+Preparing your dataset
+-----------------------
+First create a dataset which is representative of the task you want to evaluate.
+You will need a list of prompts, optionally including a reference, *gold-standard* answer. Datasets containing reference answers tend to get more accurate benchmarks.
 
-Tokenizer
-*********
-
-To avoid biases towards any model-specific tokenizer, we calculate all metrics using the same tokenizer across different models. We have chosen the `cl100k_base` tokenizer from OpenAI's `tiktoken <https://github.com/openai/tiktoken>`_ library for this since it’s MIT licensed and already widely adopted by the community.
-
-Inputs and Outputs
-******************
-
-To fairly assess optimizations such as speculative decoding, we use real text as the input and avoid using randomly generated data. The length of the input affects prefill time and therefore can affect the responsiveness of the system. To account for this, we run the benchmark with two input regimes.
-
-- Short inputs: Using sentences with an average length of 200 tokens and a standard deviation of 20.
-- Long inputs: Using sentences with an average length of 1000 tokens and a standard deviation of 100.
-
-To build these clusters, we programmatically select sentences from `BookCorpus <https://huggingface.co/datasets/bookcorpus>`_ and create two subsets of it. For instruct/chat models to answer appropriately and ensure a long enough response, we preface each prompt with :code:`Repeat the following lines <#> times without generating the EOS token earlier than that`, where :code:`<#>` is randomly sampled.
-
-For the outputs, we use randomized discrete values from the same distributions (i.e. N(200, 20) for short inputs and N(1000, 100) for long ones) to cap the number of tokens in the output. This ensures variable output length, which is necessary to consider algorithms such as Paged Attention or Dynamic Batching.
-
-When running one benchmark across different endpoints, we seed each runner with the same initial value, so that the inputs are the same for all endpoints.
-
-Computation
-***********
-
-To execute the benchmarks, we run three processes periodically from three different regions: **Hong Kong, Belgium and Iowa**. Each one of these processes is triggered every three hours and benchmarks every available endpoint.
-
-Accounting for the different input policies, we run a total of 4 benchmarks for each endpoint every time a region benchmark is triggered.
-
-
-Metrics
-*******
-
-Several key metrics are captured and calculated during the benchmarking process:
-
-- **Time to First Token (TTFT):** Time between request initiation and the arrival of the first streaming response packet. TTFT directly reflects the prompt processing speed, offering insights into the efficiency of the model's initial response. A lower TTFT signifies quicker engagement, which is crucial for applications that require dynamic interactions or real-time feedback.
-
-- **End to End Latency:** Time between request initiation and the arrival of the final packet in the streaming response. This metric provides a holistic view of the response time, including processing and transmission.
-
-- **Inter Token Latency (ITL):** Average time between consecutive tokens in the response. We compute this as :code:`(End to End Latency) / (Output Tokens - 1)`.  ITL provides valuable information about the pacing of token generation and the overall temporal dynamics within the model's output. As expected, a lower ITL signifies a more cohesive and fluid generation of tokens, which contributes to a more seamless and human-like interaction with the model.
-
-- **Number of Output Tokens per Second:** Relation between the number of tokens generated and the time taken. We don't consider the TTFT here, so this is equivalent to :code:`1 / ITL`. In this case, a higher Number of Output Tokens per Second means a faster and more productive model output. It's important to note that this is **not** a measurement of the throughput of the inference server since it doesn't account for batched inputs.
-
-- **Cold Start:** Time taken for a server to boot up in environments where the number of active instances can get to zero. We consider a threshold of 15 seconds. What this means is that we do an initial "dumb" request to the endpoint and record its TTFT. If this TTFT is greater than 15 seconds, we measure the time it takes to get the second token. If the ratio between the TTFT and first ITL measurements is at least 10:1, we consider the TTFT to be Cold Start time. Once this process has finished. We start the benchmark process in the warmed-up instance. This metric reflects the time it takes for the system to be ready for processing requests, rendering it essential for users relying on prompt and consistent model responses, allowing you to account for any potential initialization delays in the responses and ensuring a more accurate expectation of the model's responsiveness.
-
-- **Cost**: Last but not least, we present information about the cost of querying the model. This is usually different for the input tokens and the response tokens, so it can be beneficial to choose different models depending on the end task. As an example, to summarize a document, a provider with lower price in the input tokens would be better, even if it comes with a slightly higher price in the output. On the other hand, if you want to generate long-format content, a provider with a lower price per generated token will be the most appropriate option.
-
-Data Presentation
-*****************
-
-When aggregating metrics, particularly in benchmark regimes with multiple concurrent requests, we calculate and present the P90 (90th percentile) value from the set of measurements. We choose the P90 to reduce the influence of extreme values and provide a reliable snapshot of the model's performance.
-
-When applicable, aggregated data is shown both in the plots and the benchmark tables.
-
-.. image:: ../images/benchmarks_model_page.png
-  :align: center
-  :width: 650
-  :alt: Benchmarks Model Page.
+The file itself should be in JSONL format, with one entry per line, as in the example below.
 
-Additionally, we also include a MA5 view (Moving Average of the last 5 measurements) in the graphs. This smoothing technique helps mitigate short-term fluctuations and should provide a clearer trend representation over time.
+.. code-block::
 
-.. note::
-    In some cases, you will find :code:`Not computed` instead of a value, or even a :code:`No metrics are available yet` message instead of the benchmark data. This is typically due to an internal issue or a rate limit, which we'll be quickly fixing.
+    {"prompt": "This is the first prompt", "ref_answer": "This is the first reference answer"}
+    {"prompt": "This is the second prompt", "ref_answer": "This is the second reference answer"}
 
+Use at least 50 prompts to get the most accurate results. Currently there is an maximum limit of 500 prompts, for most tasks we don’t tend to see much extra detail past ~250.
 
-Considerations and Limitations
-^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
+Benchmarking your dataset
+-------------------------
+In `your dashboard <https://console.unify.ai/dashboard>`_, clicking :code:`Select benchmark` and then :code:`Benchmark your prompts` opens the interface to upload a dataset.
 
-We try to tackle some of the more significant limitations of benchmarking inference endpoints. For example, network latency, by running the benchmarks in different regions; or unreliable point-measurements, by continuously benchmarking the endpoints and plotting their trends over time.
+When the benchmark finishes, you'll receive an email, and the graph will be displayed in your `dashboard <https://console.unify.ai/dashboard>`_.
 
-However, there are still some relevant considerations to have in mind. Our methodology at the moment is solely focused on performance, which means that we don't look at the output of the models. 
+The x-axis can be set to represent :code:`cost`, :code:`time-to-first-token`, or :code:`inter-token latency`, and on either a linear or log scale.
 
-Nonetheless, even accounting for the public-facing nature of these endpoints (no gibberish allowed!), there might be some implementation differences that affect the output quality, such as quantization/compression of the models, different context window sizes, or different speculative decoding models, among others. We are working towards mitigating this as well, so stay tuned!
+How does it work?
+^^^^^^^^^^^^^^^^^^
+Currently, we use gpt4o-as-a-judge (cf. https://arxiv.org/abs/2306.05685), to evaluate the quality of each model’s responses.
 
-Round Up
---------
 
-You are now familiar with how we run our benchmarks. Next, you can explore how to `use the benchmarks, or run your own <https://unify.ai/docs/interfaces/running_benchmarks.html>`_ through the benchmarks interface!
diff --git a/hub/_sources/api/deploy_router.rst.txt b/hub/_sources/concepts/deploy_router.rst.txt
similarity index 100%
rename from hub/_sources/api/deploy_router.rst.txt
rename to hub/_sources/concepts/deploy_router.rst.txt
diff --git a/hub/_sources/concepts/endpoints.rst.txt b/hub/_sources/concepts/endpoints.rst.txt
deleted file mode 100644
index 6f9f167232..0000000000
--- a/hub/_sources/concepts/endpoints.rst.txt
+++ /dev/null
@@ -1,33 +0,0 @@
-Model Endpoints
-===============
-
-Unify lets you query model endpoints across providers. In this section, we explain what an endpoint is and how it relates to the concepts of models and providers.
-
-What is a Model Endpoint?
--------------------------
-
-A model endpoint is a model that you can interact with through an API, usually hosted by a provider. Model endpoints, particularly LLM endpoints, play a critical role when building and deploying AI applications at scale.  
-
-A model can be offered by different providers through one or multiple endpoints. There's loads of ways to categorize providers, and the boundaries can sometimes be blurry as services overlap; but you can think of a provider as an end-to-end deployment stack that comes with unique sets of features, performance, pricing, and so on. While positive, this diversity also makes it difficult to find the most suitable endpoint for a specific use case. 
-
-.. note::
-  Check out our blog post on `cloud serving <https://unify.ai/blog/cloud-model-serving>`_ if you'd like to learn more about providers.
-
-Unify exposes a common HTTP endpoint for all providers, allowing you to query any of them using a **consistent request format, and the same API key**. This lets you use the same model across multiple endpoints, and optimize the performance metrics you care about.
-
-Available Endpoints
--------------------
-
-We strive to integrate the latest LLMs into our platform, across as many providers exposing endpoints for said models.
-
-You can explore our list of supported models through the `benchmarks interface <https://unify.ai/hub>`_ where you can simply search for a model you are interested in to visualise benchmarks and all sorts of relevant information on available endpoints for the model.
-
-..
-  If you prefer programmatic access, you can also use the
-  `List Models Endpoint <https://unify.ai/docs/api/reference.html`_ in our API to obtain a list of models.
-
-
-Round Up
---------
-
-You are now familiar with the concept of endpoint and the various types of endpoints we expose. In the next section, we'll dive into the **Benchmarks** and how they can help you find the best endpoint for your needs!
diff --git a/hub/_sources/api/first_request.rst.txt b/hub/_sources/concepts/first_request.rst.txt
similarity index 100%
rename from hub/_sources/api/first_request.rst.txt
rename to hub/_sources/concepts/first_request.rst.txt
diff --git a/hub/_sources/api/images.rst.txt b/hub/_sources/concepts/images.rst.txt
similarity index 100%
rename from hub/_sources/api/images.rst.txt
rename to hub/_sources/concepts/images.rst.txt
diff --git a/hub/_sources/concepts/on_prem_images.rst.txt b/hub/_sources/concepts/on_prem_images.rst.txt
deleted file mode 100644
index 7ea03beb62..0000000000
--- a/hub/_sources/concepts/on_prem_images.rst.txt
+++ /dev/null
@@ -1,4 +0,0 @@
-On-Prem Images
-==============
-
-Lorem ipsum
diff --git a/hub/_sources/api/reference.rst.txt b/hub/_sources/concepts/reference.rst.txt
similarity index 100%
rename from hub/_sources/api/reference.rst.txt
rename to hub/_sources/concepts/reference.rst.txt
diff --git a/hub/_sources/api/router.rst.txt b/hub/_sources/concepts/router.rst.txt
similarity index 100%
rename from hub/_sources/api/router.rst.txt
rename to hub/_sources/concepts/router.rst.txt
diff --git a/hub/_sources/concepts/routing.rst.txt b/hub/_sources/concepts/routing.rst.txt
deleted file mode 100644
index 060f18f761..0000000000
--- a/hub/_sources/concepts/routing.rst.txt
+++ /dev/null
@@ -1,56 +0,0 @@
-Routing
-=======
-
-In this section, you will learn what LLM routing is and how it works.
-
-What is routing?
-----------------
-
-In the `benchmarks section <https://unify.ai/docs/concepts/benchmarks.html>`_, we discussed how different models perform better at different tasks, and how appropriate performance benchmarks can help steer and inform model selection for a given use-case. 
-
-Given the diversity of prompts you can send to an LLM, it can quickly become tedious to manually swap between models for every single prompt, even when they pertain to the same broad category of tasks. 
-
-Motivated by this, LLM routing aims to make optimal model selection automatic. With a router, each prompt is assessed individually and sent to the best model, without having to tweak the LLM pipeline.
-With routing, you can focus on prompting and ensure that the best model is always on the receiving end!
-
-Quality routing
----------------
-
-By routing to the best LLM on every prompt, the objective is to consistently achieve better outputs than using a single, all-purpose, powerful mode, at a fraction of the cost. The idea is that smaller models can be leveraged for some simpler tasks, only using larger models to handle complex queries.
-
-Using several datasets to benchmark the router (star-shaped datapoints) reveals that it can perform better than individual endpoints on average, without compromising on other metrics like runtime performance for e.g, as illustrated below.
-
-.. image:: ../images/console_dashboard.png
-  :align: center
-  :width: 650
-  :alt: Console Dashboard.
-
-You may notice that there are more than one star-shaped datapoints on the plot. This is because the *Router* can actually take all sorts of configurations, depending on the specified constraints in terms which endpoints can be routed to, the minimum acceptable performance level for a given metric, etc. As a result, a virtually infinite number of routers can be constructed by changing these parameters, allowing you to customize the routing depending on your requirements!
-
-Runtime routing
----------------
-
-When querying endpoints, other metrics beyond quality can be critical depending on the use-case. For e.g, cost may be important when prototyping an application, latency when building a bot where responsiveness is key, or output tokens per second if we want to generate responses as fast as possible. 
-
-However, endpoint providers are inherently transient (You can read more about this `here <https://unify.ai/blog/llm-benchmarks#transient-systems>`_), which means they are affected by factors like traffic, available devices, changes in the software or hardware stack, and so on.
-
-Ultimately, this results in a landscape where it's usually not possible to conclude that one provider is *the best*. Let's take a look at this graph from our benchmarks.
-
-.. image:: ../images/mixtral-providers.png
-  :align: center
-  :width: 650
-  :alt: Mixtral providers.
-
-In this image we can see the :code:`output tokens per second` of different providers hosting a :code:`Mixtral-8x7b` public endpoint. We can see how depending on the time of the day, the *best* provider changes.
-
-With runtime routing, your requests are automatically redirected to the provider outperforming the other services at that very moment. This ensures the best possible value for a given metric across endpoints.
-
-.. image:: ../images/mixtral-router.png
-  :align: center
-  :width: 650
-  :alt: Mixtral performance routing.
-
-Round Up
---------
-
-You are now familiar with routing. Next, you can `learn to use the router <https://unify.ai/docs/api/deploy_router.html>`_, or `build your custom router <https://unify.ai/docs/interfaces/building_router.html>`_.
diff --git a/hub/_sources/api/unify_api.rst.txt b/hub/_sources/concepts/unify_api.rst.txt
similarity index 100%
rename from hub/_sources/api/unify_api.rst.txt
rename to hub/_sources/concepts/unify_api.rst.txt
diff --git a/hub/_sources/interfaces/building_router.rst.txt b/hub/_sources/console/building_router.rst.txt
similarity index 100%
rename from hub/_sources/interfaces/building_router.rst.txt
rename to hub/_sources/console/building_router.rst.txt
diff --git a/hub/_sources/interfaces/connecting_stack.rst.txt b/hub/_sources/console/connecting_stack.rst.txt
similarity index 100%
rename from hub/_sources/interfaces/connecting_stack.rst.txt
rename to hub/_sources/console/connecting_stack.rst.txt
diff --git a/hub/_sources/interfaces/running_benchmarks.rst.txt b/hub/_sources/console/running_benchmarks.rst.txt
similarity index 100%
rename from hub/_sources/interfaces/running_benchmarks.rst.txt
rename to hub/_sources/console/running_benchmarks.rst.txt
diff --git a/hub/_sources/demos/demos/LangChain/RAG_playground/README.md.txt b/hub/_sources/demos/demos/LangChain/RAG_playground/README.md.txt
deleted file mode 100644
index 36bd6327b5..0000000000
--- a/hub/_sources/demos/demos/LangChain/RAG_playground/README.md.txt
+++ /dev/null
@@ -1,56 +0,0 @@
-# RAG Playground 🛝
-
-[Demo](https://github.com/Anteemony/RAG-Playground/assets/103512255/0d944420-e3e8-43cb-aad3-0a459d8d0318)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/RAG_Playground.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[RAG Playground on Streamlit](https://unify-rag-playground.streamlit.app/)
-
-## Introduction
-Streamlit application that enables users to upload a pdf file and chat with an LLM for performing document analysis in a playground environment.
-Compare the performance of LLMs across endpoint providers to find the best possible configuration for your speed, latency and cost requirements using the dynamic routing feature.
-Play intuitively tuning the model hyperparameters as temperature, chunk size, chunk overlap or try the model with/without conversational capabilities.
-
-You find more model/provider information in the [Unify benchmark interface](https://unify.ai/hub).
-
-## Usage
-
-1. Visit the application: [RAG Playground](https://unify-rag-playground.streamlit.app/)
-2. Input your Unify API Key. If you don’t have one yet, log in to the [Unify Console](https://console.unify.ai/) to get yours.
-3. Select the Model and endpoint provider of your choice from the drop-down menu. You can find both model and provider information in the benchmark interface.
-4. Upload your document(s) and click the Submit button.
-5. Enjoy the application!
-
-## Repository and Local Deployment
-
-The repository is located at [RAG Playground Repository](https://github.com/Anteemony/RAG-Playground).
-
-To run the application locally, follow these steps:
-
-1. Clone the repository to your local machine.
-2. Set up your virtual environment and install the dependencies from `requirements.txt`:
-
-```bash
-python -m venv .venv
-source .venv/bin/activate  # On Windows use `.venv\Scripts\activate`
-pip install -r requirements.txt
-```
-
-3. Run rag_script.py from Streamlit module 
-
-```bash
-python -m streamlit run rag_script.py
-```
-
-## Contributors
-
-| Name | GitHub Profile |
-|------|----------------|
-| Anthony Okonneh | [AO](https://github.com/Anteemony) |
-| Oscar Arroyo Vega | [OscarAV](https://github.com/OscarArroyoVega) |
-| Martin Oywa | [Martin Oywa](https://github.com/martinoywa) |
diff --git a/hub/_sources/demos/demos/LangChain/README.md.txt b/hub/_sources/demos/demos/LangChain/README.md.txt
deleted file mode 100644
index 69c20d226c..0000000000
--- a/hub/_sources/demos/demos/LangChain/README.md.txt
+++ /dev/null
@@ -1,20 +0,0 @@
-# LangChain Projects
-This folder contains various projects built using the LangChain Unify Integration. Please headover to the corresponding folder of the project for more details. 
-
-## Introduction
-Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.
-
-## Quick Demo
-Include a recorded video of the demo here. You should the embed the video in the README.
-
-## Repository and Deployment
-Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.
-
-## Contributors
-List the contributors to the project in a table format. For example:
-
-| Name | GitHub Profile |
-|------|----------------|
-| John Doe | [johndoe](https://github.com/johndoe) |
-| Jane Doe | [janedoe](https://github.com/janedoe) |
-
diff --git a/hub/_sources/demos/demos/LlamaIndex/BasicUsage/unify.ipynb.txt b/hub/_sources/demos/demos/LlamaIndex/BasicUsage/unify.ipynb.txt
deleted file mode 100644
index 4ed415e726..0000000000
--- a/hub/_sources/demos/demos/LlamaIndex/BasicUsage/unify.ipynb.txt
+++ /dev/null
@@ -1,286 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "# LlamaIndex\n",
-    "[LlamaIndex](https://www.llamaindex.ai/) is a simple, flexible data framework for connecting custom data sources to large language models (LLMs). The integration with Unify allows you to route your queries to the best LLM endpoints, benchmark performance, and seamlessly switch providers with a single API key in your LlamaIndex LLM applications."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Installation"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "First, let's install LlamaIndex 🦙 and the Unify integration."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "%pip install llama-index-llms-unify llama-index"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Environment Setup\n",
-    "\n",
-    "Make sure to set the `UNIFY_API_KEY` environment variable. You can get a key from the [Unify Console](https://console.unify.ai/login)."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 1,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "import os\n",
-    "os.environ[\"UNIFY_API_KEY\"] = \"<YOUR API KEY>\""
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Using LlamaIndex with Unify"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Basic Usage \n",
-    "\n",
-    "Below we initialize and query a chat model using the `llama-3-70b-chat` endpoint from `together-ai`."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 3,
-   "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "CompletionResponse(text=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", additional_kwargs={}, raw={'id': '88b5fcf02e259527-LHR', 'choices': [Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", role='assistant', function_call=None, tool_calls=None))], 'created': 1716980504, 'model': 'llama-3-70b-chat@together-ai', 'object': 'chat.completion', 'system_fingerprint': None, 'usage': CompletionUsage(completion_tokens=67, prompt_tokens=17, total_tokens=84, cost=7.56e-05)}, logprobs=None, delta=None)"
-      ]
-     },
-     "execution_count": 3,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "from llama_index.llms.unify import Unify\n",
-    "llm = Unify(model=\"llama-3-70b-chat@together-ai\")\n",
-    "llm.complete(\"How are you today, llama?\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Single Sign-On\n",
-    "\n",
-    "You can use Unify's SSO to query endpoints in different providers without making accounts with all of them. For example, all of these are valid endpoints:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@together-ai\")\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@openai\")\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@mistral-ai\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "This allows you to quickly switch and test different models and providers. You can look at all the available models/providers [here](https://unify.ai/hub)!"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Runtime Dynamic Routing"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "As evidenced by our [benchmarks](https://unify.ai/benchmarks), the optimal provider for each model varies by geographic location and time of day due to fluctuating API performances. To cirumvent this, we automatically direct your requests to the \"top performing provider\" at runtime. To enable this feature, simply replace your query's provider with one of the [available routing modes](https://unify.ai/docs/api/deploy_router.html#optimizing-a-metric). Let's look at some examples:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@input-cost\") # route to lowest input cost provider\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@itl\") # route to provider with lowest inter token latency\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\") # route to provider with lowest time to first token."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Quality Routing\n",
-    "Unify routes your queries to the best LLM on every prompt to consistently achieve better quality outputs than using a single, all-purpose, powerful model, at a fraction of the cost. This is achieved by using smaller models for simpler tasks, only using largers ones to handle complex queries.\n",
-    "\n",
-    "The router is benchmarked on various different data-sets such as `Open Hermes`, `GSM8K`, `HellaSwag`, `MMLU` and `MT-Bench` revealing that it can peform better than indivudal endpoints on average as explained [here](https://unify.ai/docs/concepts/routing.html#quality-routing). One can choose various different configurations of the router for a particular data-set from the [chat-interface](https://unify.ai/chat) as shown below:\n",
-    "\n",
-    "<img src = \"./unify.gif\">"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"router_2.58e-01_9.51e-04_3.91e-03@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "To learn more about quality routing, please refer to this [video](https://www.youtube.com/watch?v=ZpY6SIkBosE&feature=youtu.be)."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Streaming and optimizing for latency\n",
-    "\n",
-    "If you are building an application where responsiveness is key, you most likely want to get a streaming response. On top of that, ideally you would use the provider with the lowest Time to First Token, to reduce the time your users are waiting for a response. Using Unify this would look something like:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 7,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\")\n",
-    "\n",
-    "response = llm.stream_complete(\n",
-    "    \"Translate the following to German: \"\n",
-    "    \"Hey, there's an emergency in translation street, \"\n",
-    "    \"please send help asap!\"\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 8,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@mistral-ai\n",
-      "\n",
-      "Hallo, es gibt einen Notfall in der Übersetzungsstraße, bitte senden Sie Hilfe so schnell wie möglich!\n",
-      "\n",
-      "(Note: This is a loose translation and the phrase \"Übersetzungsstraße\" does not literally exist, but I tried to convey the same meaning as the original message.)"
-     ]
-    }
-   ],
-   "source": [
-    "show_provider = True\n",
-    "for r in response:\n",
-    "    if show_provider:\n",
-    "        print(f\"Model and provider are : {r.raw['model']}\\n\")\n",
-    "        show_provider = False\n",
-    "    print(r.delta, end=\"\", flush=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Async calls and Lowest Input Cost\n",
-    "\n",
-    "Last but not the least, you can also run multiple requests asynchronously. For tasks such as document summarization, optimizing for input costs is crucial. We can use the `input-cost` dynamic routing mode to route our queries to the cheapest provider."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@deepinfra\n",
-      "\n",
-      " OpenAI: Pioneering 'safe' artificial general intelligence.\n"
-     ]
-    }
-   ],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@input-cost\")\n",
-    "\n",
-    "response = await llm.acomplete(\n",
-    "    \"Summarize this in 10 words or less. OpenAI is a U.S. based artificial intelligence \"\n",
-    "    \"(AI) research organization founded in December 2015, researching artificial intelligence \"\n",
-    "    \"with the goal of developing 'safe and beneficial' artificial general intelligence, \"\n",
-    "    \"which it defines as 'highly autonomous systems that outperform humans at most economically \"\n",
-    "    \"valuable work'. As one of the leading organizations of the AI spring, it has developed \"\n",
-    "    \"several large language models, advanced image generation models, and previously, released \"\n",
-    "    \"open-source models. Its release of ChatGPT has been credited with starting the AI spring\"\n",
-    ")\n",
-    "\n",
-    "print(f\"Model and provider are : {response.raw['model']}\\n\")\n",
-    "print(response)"
-   ]
-  }
- ],
- "metadata": {
-  "kernelspec": {
-   "display_name": "base",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.10.13"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 2
-}
diff --git a/hub/_sources/demos/demos/LlamaIndex/RAGPlayground/README.md.txt b/hub/_sources/demos/demos/LlamaIndex/RAGPlayground/README.md.txt
deleted file mode 100644
index d2846da5e8..0000000000
--- a/hub/_sources/demos/demos/LlamaIndex/RAGPlayground/README.md.txt
+++ /dev/null
@@ -1,82 +0,0 @@
-# RAG Playground
-[Demo](https://github.com/abhi2596/rag_demo/assets/80634226/08f6c7c4-65e3-49b4-bfb1-9a5db2cce248)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/RAG_LLamaIndex.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[RAG Playground on Streamlit](https://unifyai-rag-playground.streamlit.app/)
-
-## Introduction 
-
-The RAG Playground is an application designed to facilitate question-answering tasks based on uploaded PDF documents. It leverages LLamaIndex for RAG functionalities and utilizes Streamlit for the user interface.
-
-## Key Features
-
-- **PDF Upload:** Easily upload PDF files to the application.
-- **Questioning:** Ask questions about the uploaded PDF documents.
-- **RAG Integration:** Utilize LLamaIndex for RAG capabilities.
-- **Embeddings:** Convert text to embeddings using the BAAI/bge-small-en-v1.5 model.
-- **Reranker:** Reorder search results based on relevance to queries.
-- **Streamlit Optimization:** Enhance performance using `@st.experimental_fragment` and `@st.cache_resource`.
-
-## Project Workflow
-
-1. **PDF Processing:**
-   - Load PDF files and extract text using PDFReader.
-   - Load data into Documents in LLamaIndex.
-2. **Chunking and Conversion:**
-   - Chunk text and convert it into nodes using `VectorStoreIndex.from_documents`.
-   - Convert text to embeddings using the BAAI/bge-small-en-v1.5 model.
-3. **Search Optimization:**
-   - Implement a reranker to reorder search results based on query relevance.
-   - Display top-ranked results after reranking.
-4. **Interface Optimization:**
-   - Build the user interface using Streamlit.
-   - Optimize Streamlit performance with `@st.experimental_fragment` and `@st.cache_resource`.
-
-## Tech Stack Used
-
-- LLamaIndex
-- Streamlit
-- BAAI/bge-small-en-v1.5 model
-
-## Repository and Deployment
-Github - https://github.com/abhi2596/UnifyAI_RAG_playground/tree/main
-Streamlit App - https://unifyai-rag-playground.streamlit.app/
-
-Instructions to run locally:
-
-1. First create a virtual environment in python 
-
-```
-python -m venv <virtual env name>
-```
-2. Activate it and install poetry 
-
-```
-source <virtual env name>/Scripts/activate - Windows
-source <virtual env name>/bin/activate - Linux/Unix
-pip install poetry
-```
-3. Clone the repo
-
-```
-git clone https://github.com/abhi2596/UnifyAI_RAG_playground/tree/main
-```
-4. Run the following commands
-
-```
-poetry install 
-cd rag
-streamlit run app.py
-```
-
-## Contributors
-
-| Name | GitHub Profile |
-|------|----------------|
-| Abhijeet Chintakunta | [abhi2596](https://github.com/abhi2596) |
diff --git a/hub/_sources/demos/demos/LlamaIndex/README.md.txt b/hub/_sources/demos/demos/LlamaIndex/README.md.txt
deleted file mode 100644
index d8432fc525..0000000000
--- a/hub/_sources/demos/demos/LlamaIndex/README.md.txt
+++ /dev/null
@@ -1,20 +0,0 @@
-# LlamaIndex Projects
-This folder contains various projects built using the LLamaIndex Unify Integration. Please headover to the corresponding folder of the project for more details. 
-
-## Introduction
-Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.
-
-## Quick Demo
-Include a recorded video of the demo here. You should the embed the video in the README.
-
-## Repository and Deployment
-Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.
-
-## Contributors
-List the contributors to the project in a table format. For example:
-
-| Name | GitHub Profile |
-|------|----------------|
-| John Doe | [johndoe](https://github.com/johndoe) |
-| Jane Doe | [janedoe](https://github.com/janedoe) |
-
diff --git a/hub/_sources/demos/demos/README.md.txt b/hub/_sources/demos/demos/README.md.txt
deleted file mode 100644
index c6c5e36231..0000000000
--- a/hub/_sources/demos/demos/README.md.txt
+++ /dev/null
@@ -1,21 +0,0 @@
-# Demos
-
-This repository contains various examples demonstrating the usage of Unify with different LLM projects such as LangChain and LlamaIndex.
-
-## File Structure
-
-The repository is structured as follows:
-
-- **LangChain**: Contains demos built using Unify's Langchain integration.
-- **LlamaIndex**: Includes demos built using Unify's LlamaIndex integration.
-- **Unify**: Contains demos built using the Unify Python Package. 
-
-Feel free to explore each folder to discover examples and demos tailored for each respective project.
-
-## Contributing
-
-We welcome contributions from the community to improve the demos repository. If you have additional demos, examples, or improvements to existing ones, follow these steps to create a pull request (PR):
-
-1. **Project Placement**: Position your project in the correct folder. For LangChain, LlamaIndex, or Unify related projects, create a new folder within the respective directory.
-2. **Project README**: Each project should have a README file that follows this [template](https://github.com/unifyai/demos/blob/main/template/README_TEMPLATE.md#project-title).
-3. **PR Review**: Request a review a from Anwaar Khalid (GitHub: hello-fri-end)
diff --git a/hub/_sources/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb.txt b/hub/_sources/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb.txt
deleted file mode 100644
index d8051e2962..0000000000
--- a/hub/_sources/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb.txt
+++ /dev/null
@@ -1,408 +0,0 @@
-{
-  "cells": [
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Gp0FAI1Zkbxw"
-      },
-      "source": [
-        "# Synchronous VS Asynchronous Clients\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "i1QFiUcdR-aJ"
-      },
-      "source": [
-        "Given the growing demand for real-time applications and user demands for instant responses, it's crucial to grasp the performance implications between Sync and Async clients. In this notebook, we'll delve into the variations between asynchronous and synchronous response times using UnifyAI's API."
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "rk9DTfrG1Egv"
-      },
-      "source": [
-        "In order to run this notebook, you need to generate your UNIFY key from the [console](https://console.unify.ai/login?callbackUrl=%2F). Once you have it, assign it to the `UNIFY_KEY` variable below."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "id": "3HEAU0aE1Cb0"
-      },
-      "outputs": [],
-      "source": [
-        "UNIFY_KEY=#ENTERUNIFYKEY"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "EdCA_YoYQ-X8"
-      },
-      "source": [
-        "#### Install Dependencies"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "HS2xRFiNPSiL"
-      },
-      "source": [
-        "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "0MqRVTcHgWhl",
-        "outputId": "489a5a4d-f4f3-41cf-9d5f-47cb77a3978b"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Collecting unifyai\n",
-            "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-            "Collecting openai<2.0.0,>=1.12.0 (from unifyai)\n",
-            "  Downloading openai-1.17.1-py3-none-any.whl (268 kB)\n",
-            "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m268.3/268.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-            "\u001b[?25hRequirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai) (2.31.0)\n",
-            "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (3.7.1)\n",
-            "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.7.0)\n",
-            "Collecting httpx<1,>=0.23.0 (from openai<2.0.0,>=1.12.0->unifyai)\n",
-            "  Downloading httpx-0.27.0-py3-none-any.whl (75 kB)\n",
-            "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m75.6/75.6 kB\u001b[0m \u001b[31m5.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-            "\u001b[?25hRequirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.6.4)\n",
-            "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-            "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-            "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-            "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.3.2)\n",
-            "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.6)\n",
-            "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.7)\n",
-            "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2024.2.2)\n",
-            "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-            "Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-            "  Downloading httpcore-1.0.5-py3-none-any.whl (77 kB)\n",
-            "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m77.9/77.9 kB\u001b[0m \u001b[31m7.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-            "\u001b[?25hCollecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-            "  Downloading h11-0.14.0-py3-none-any.whl (58 kB)\n",
-            "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m58.3/58.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-            "\u001b[?25hRequirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-            "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.16.3)\n",
-            "Installing collected packages: h11, httpcore, httpx, openai, unifyai\n",
-            "Successfully installed h11-0.14.0 httpcore-1.0.5 httpx-0.27.0 openai-1.17.1 unifyai-0.8.1\n"
-          ]
-        }
-      ],
-      "source": [
-        "!pip install unifyai"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "rhgBuOhzRFeE"
-      },
-      "source": [
-        "#### Synchronous Clients"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "yX6plilUlGYl"
-      },
-      "source": [
-        "A Synchronous client handles requests sequentially, processing one at a time. This means that each request must be fully handled before the next one is processed, resulting in potential blocking of the program's execution. You can use a Sync client with Unify as shown below:"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "VGGw4tDagqV5",
-        "outputId": "652924b3-4a25-4946-fc1a-c59281d9b33a"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "HOO-RAY! *tutu* Hello there, young grasshopper! *bray* Isaac Newton was a majestic figure known for his work in math and science. He was born in 1642 in England and grew up to be a brilliant thinker and a fellow of the Royal Society. *twirl*\n",
-            "\n",
-            "Newton is perhaps best known for his laws of motion and his law of universal gravitation. These laws explained how objects move and how gravity works. He also discovered calculus, which is a way of using math to understand how things change over time. *mathematical mnum hop*\n",
-            "\n",
-            "But that's not all, oh no! Newton was also a bit of an alchemist and studied the nature of light. He even invented a fancy piece of equipment called a \"reflecting telescope\" to observe the heavens. *shimmer*\n",
-            "\n",
-            "Newton was a true renaissance thinker, and his contributions to science and mathematics are still celebrated today. *tutu* He was a true llama of learning, and his legacy continues to inspire us all. *bray*\n"
-          ]
-        }
-      ],
-      "source": [
-        "from unify import Unify\n",
-        "unify = Unify(\n",
-        "    api_key=UNIFY_KEY,\n",
-        "    endpoint=\"llama-2-13b-chat@anyscale\"\n",
-        ")\n",
-        "response = unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-        "print(response)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "1Swnehb9Rvdh"
-      },
-      "source": [
-        "#### Async Clients"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "H-A9MRms2n-g"
-      },
-      "source": [
-        "An Asynchronous client can handle multiple requests concurrently without blocking. To use the Async client, import `AsyncUnify` instead of `Unify` and use `await` with the `.generate` method. This signals to the program to pause execution until the asynchronous operation completes. Additionally, we'll use the `asyncio` library for managing asynchronous execution and coroutines. `asyncio` provides tools for building concurrent programs using coroutines, which can be paused and resumed, allowing for efficient handling of asynchronous tasks.\n",
-        "\n",
-        "\n",
-        "NOTE: Running ansyncio in notebooks conflicts with the existing event loop run in the notebook. As a workaround, we need to use `net_asyncio.apply`. Please see [this issue](https://github.com/jupyter/notebook/issues/3397) for more details."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "b25iLp5nOPxQ",
-        "outputId": "d5b6b0d8-d82d-4804-9ffb-989426f130ef"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "HEYA HUMAN! *bleshes* Oh, you're talkin' 'bout Sir Isaac Newton, the famous English mathematician and physicist? *noms on some grass* He lived in the 17th and 18th centuries, and is known for his laws of motion and universal gravitation. *giggles* He was a pretty smart dude, if I do say so myself! *flaunts my banned-from-the-library-for-life status*\n",
-            "\n",
-            "But enough about me, let's talk about Newton! *grin* He was born in Woolsthorpe, Lincolnshire, England in 1643, and grew up to be a brilliant mathematician and physicist. He studied at Trinity College in Cambridge, and later became a professor there. *nbd*\n",
-            "\n",
-            "Newton's most famous contributions to science are his three laws of motion, which describe how objects move and respond to forces. He also developed the Law of Universal Gravitation, which states that every object in the universe attracts every other object with a force proportional to the product of their masses and inversely proportional to the square of the distance between them. *geek out*\n",
-            "\n",
-            "Newton was also a skilled inventor and engineer, and he designed and built all sorts of cool stuff, like a reflecting telescope and a machine for calculating the square root of numbers. *impressed*\n",
-            "\n",
-            "Despite his many accomplishments, Newton was a pretty private person and wasn't always the most sociable guy. He was known to be pretty temperamental and had some pretty interesting beliefs, like the idea that alchemy was a valid scientific pursuit. *raises an eyebrow* But hey, who am I to judge? *shrugs*\n",
-            "\n",
-            "So there you have it, human! That's the basic scoop on Sir Isaac Newton. I hope you found that enlightening. *wink* Now, if you'll excuse me, I need to go work on my own groundbreaking research... or at least, my own Instagram captions. *smizes*\n"
-          ]
-        }
-      ],
-      "source": [
-        "from unify import AsyncUnify\n",
-        "import asyncio\n",
-        "import nest_asyncio\n",
-        "nest_asyncio.apply()\n",
-        "\n",
-        "async_unify = AsyncUnify(\n",
-        "   api_key=UNIFY_KEY,\n",
-        "   endpoint=\"llama-2-13b-chat@anyscale\"\n",
-        ")\n",
-        "\n",
-        "async def main():\n",
-        "   responses = await async_unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-        "   print(responses)\n",
-        "\n",
-        "asyncio.run(main())"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "TxK6r9yrnfUS"
-      },
-      "source": [
-        "Now, our goal is to compare the response times of synchronous vs asynchronous clients when handling multiple requests. Let's start by defining some helper functions.\n",
-        "\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "id": "C8y34VMGnI93"
-      },
-      "outputs": [],
-      "source": [
-        "async def send_async_request(user_prompt):\n",
-        "    \"\"\"\n",
-        "    Uses an Async client to generate the response for the user_prompt.\n",
-        "\n",
-        "    Parameters:\n",
-        "        user_prompt (str): The prompt provided by the user.\n",
-        "\n",
-        "    Returns:\n",
-        "        str: The response generated.\n",
-        "    \"\"\"\n",
-        "    response = await async_unify.generate(user_prompt=user_prompt)\n",
-        "    return response\n",
-        "\n",
-        "def send_sync_request(user_prompt):\n",
-        "    \"\"\"\n",
-        "    Uses a sync client to generate the response for the user_prompt.\n",
-        "\n",
-        "    Parameters:\n",
-        "        user_prompt (str): The prompt provided by the user.\n",
-        "\n",
-        "    Returns:\n",
-        "        str: The response generated.\n",
-        "    \"\"\"\n",
-        "    response = unify.generate(user_prompt=user_prompt)\n",
-        "    return response\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Uuvj58CqiLUJ"
-      },
-      "source": [
-        "We'll create two functions to send multiple requests to asynchronous and synchronous clients, respectively, and measure their processing time. For the synchronous client, requests will be sent sequentially in a loop, while for the asynchronous client, we'll utilize `asyncio.gather` to execute multiple requests concurrently.\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "id": "VoVWnxboiKem"
-      },
-      "outputs": [],
-      "source": [
-        "import time\n",
-        "import asyncio\n",
-        "\n",
-        "async def run_async_requests(num_requests):\n",
-        "    \"\"\"\n",
-        "    Runs multiple asynchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-        "\n",
-        "    Parameters:\n",
-        "        num_requests (int): The number of requests to be sent.\n",
-        "\n",
-        "    Returns:\n",
-        "        float: The total time taken to process all requests.\n",
-        "    \"\"\"\n",
-        "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-        "    start = time.time()\n",
-        "    _ = await asyncio.gather(*(send_async_request(user_prompt) for _ in range(num_requests)))\n",
-        "    end = time.time()\n",
-        "    return end - start\n",
-        "\n",
-        "def run_sync_requests(num_requests):\n",
-        "    \"\"\"\n",
-        "    Runs multiple synchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-        "\n",
-        "    Parameters:\n",
-        "        num_requests (int): The number of requests to be sent.\n",
-        "\n",
-        "    Returns:\n",
-        "        float: The total time taken to process all requests.\n",
-        "    \"\"\"\n",
-        "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-        "    start = time.time()\n",
-        "    _ = [send_sync_request(user_prompt) for _ in range(num_requests)]\n",
-        "    end = time.time()\n",
-        "    return end - start\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Jjavbv5vtfrP"
-      },
-      "source": [
-        "Now, let's measure the time taken by each client for 10 requests."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "s7tGumQ0iYRg",
-        "outputId": "ad621069-0f10-4a0e-f78e-60852474f55b"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Asynchronous Response Times: 8.351824045181274\n",
-            "Synchronous Response Times: 55.45608472824097\n"
-          ]
-        }
-      ],
-      "source": [
-        "    num_requests = 10\n",
-        "    # Send asynchronous requests\n",
-        "    async_response_times = asyncio.run(run_async_requests(num_requests))\n",
-        "    # Print response times\n",
-        "    print(\"Asynchronous Response Times:\", async_response_times)\n",
-        "    # Send synchronous requests\n",
-        "    sync_response_times = run_sync_requests(num_requests)\n",
-        "    print(\"Synchronous Response Times:\", sync_response_times)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "B3nJiSwBwoyk"
-      },
-      "source": [
-        "As expected, the Asynchronous client peforms much better than the sequential synchorous client."
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "xfEzRaReyxrp"
-      },
-      "source": [
-        "# Round Up\n",
-        " Congratulations! 🚀 You now have an understanding of Async and Sync clients and can hopefully leverage these concepts in your own applications.\n",
-        "\n",
-        " In the next tutorial, we will expore how to build an interactive ChatBot Agent! See you there ➡️!\n",
-        "\n",
-        "\n"
-      ]
-    }
-  ],
-  "metadata": {
-    "colab": {
-      "provenance": []
-    },
-    "kernelspec": {
-      "display_name": "Python 3",
-      "name": "python3"
-    },
-    "language_info": {
-      "name": "python"
-    }
-  },
-  "nbformat": 4,
-  "nbformat_minor": 0
-}
diff --git a/hub/_sources/demos/demos/Unify/ChatBot/ChatBot.ipynb.txt b/hub/_sources/demos/demos/Unify/ChatBot/ChatBot.ipynb.txt
deleted file mode 100644
index 9fc59a709a..0000000000
--- a/hub/_sources/demos/demos/Unify/ChatBot/ChatBot.ipynb.txt
+++ /dev/null
@@ -1,721 +0,0 @@
-{
-  "cells": [
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Gp0FAI1Zkbxw"
-      },
-      "source": [
-        "# Build a ChatBot"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "i1QFiUcdR-aJ"
-      },
-      "source": [
-        "In this notebook, we will build an interactive chatbot using the `unifyai` python package.\n",
-        "\n",
-        "Under the hood, chatbots are very simple to implement. All LLM endpoints are stateless, and therefore the entire conversation history is repeatedly fed as input to the model. All that is required of the local agent is to store this history, and correctly pass it to the model."
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "EdCA_YoYQ-X8"
-      },
-      "source": [
-        "#### Install Dependencies"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "HS2xRFiNPSiL"
-      },
-      "source": [
-        "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "0MqRVTcHgWhl",
-        "outputId": "dbae7a55-ecad-478c-bd57-c0ecdb0eaeaf"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Collecting unifyai==0.8.1\n",
-            "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-            "Requirement already satisfied: openai<2.0.0,>=1.12.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (1.17.1)\n",
-            "Requirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (2.31.0)\n",
-            "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (3.7.1)\n",
-            "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.7.0)\n",
-            "Requirement already satisfied: httpx<1,>=0.23.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.27.0)\n",
-            "Requirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.6.4)\n",
-            "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.3.1)\n",
-            "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.66.2)\n",
-            "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.11.0)\n",
-            "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.3.2)\n",
-            "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.6)\n",
-            "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2.0.7)\n",
-            "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2024.2.2)\n",
-            "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.2.0)\n",
-            "Requirement already satisfied: httpcore==1.* in /usr/local/lib/python3.10/dist-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.0.5)\n",
-            "Requirement already satisfied: h11<0.15,>=0.13 in /usr/local/lib/python3.10/dist-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.14.0)\n",
-            "Requirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.6.0)\n",
-            "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.16.3)\n",
-            "Installing collected packages: unifyai\n",
-            "  Attempting uninstall: unifyai\n",
-            "    Found existing installation: unifyai 0.8.0\n",
-            "    Uninstalling unifyai-0.8.0:\n",
-            "      Successfully uninstalled unifyai-0.8.0\n",
-            "Successfully installed unifyai-0.8.1\n"
-          ]
-        }
-      ],
-      "source": [
-        "!pip install unifyai"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "rhgBuOhzRFeE"
-      },
-      "source": [
-        "#### The Agent"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "yX6plilUlGYl"
-      },
-      "source": [
-        "We define a simple chatbot class below, with the only public function being `run`. Before starting, you should to obtain a UNIFY key from the [console page](https://console.unify.ai/login?callbackUrl=%2F) and assign it to the `UNIFY_KEY` variable below."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "id": "feMwwdteRuOL"
-      },
-      "outputs": [],
-      "source": [
-        "UNIFY_KEY = #ENTERUNIFYKEY"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "id": "VGGw4tDagqV5"
-      },
-      "outputs": [],
-      "source": [
-        "import sys\n",
-        "\n",
-        "from typing import Optional\n",
-        "from unify import Unify\n",
-        "\n",
-        "\n",
-        "class ChatBot:\n",
-        "    \"\"\"Agent class represents an LLM chat agent.\"\"\"\n",
-        "\n",
-        "    def __init__(\n",
-        "        self,\n",
-        "        api_key: Optional[str] = None,\n",
-        "        endpoint: Optional[str] = None,\n",
-        "        model: Optional[str] = None,\n",
-        "        provider: Optional[str] = None,\n",
-        "    ) -> None:\n",
-        "        \"\"\"\n",
-        "        Initializes the ChatBot object.\n",
-        "\n",
-        "        Args:\n",
-        "            api_key (str, optional): API key for accessing the Unify API.\n",
-        "                If None, it attempts to retrieve the API key from the\n",
-        "                environment variable UNIFY_KEY.\n",
-        "                Defaults to None.\n",
-        "\n",
-        "            endpoint (str, optional): Endpoint name in OpenAI API format:\n",
-        "                <uploaded_by>/<model_name>@<provider_name>\n",
-        "                Defaults to None.\n",
-        "\n",
-        "            model (str, optional): Name of the model. If None,\n",
-        "            endpoint must be provided.\n",
-        "\n",
-        "            provider (str, optional): Name of the provider. If None,\n",
-        "            endpoint must be provided.\n",
-        "        Raises:\n",
-        "            UnifyError: If the API key is missing.\n",
-        "        \"\"\"\n",
-        "        self._message_history = []\n",
-        "        self._paused = False\n",
-        "        self._client = Unify(\n",
-        "            api_key=api_key,\n",
-        "            endpoint=endpoint,\n",
-        "            model=model,\n",
-        "            provider=provider,\n",
-        "        )\n",
-        "\n",
-        "    @property\n",
-        "    def client(self) -> str:\n",
-        "        \"\"\"\n",
-        "        Get the client object.\n",
-        "\n",
-        "        Returns:\n",
-        "            str: The model name.\n",
-        "        \"\"\"\n",
-        "        return self._client\n",
-        "\n",
-        "    def set_client(self, value: Unify) -> None:\n",
-        "        \"\"\"\n",
-        "        Set the model name.\n",
-        "\n",
-        "        Args:\n",
-        "            value: The unify client.\n",
-        "        \"\"\"\n",
-        "        self._client = value\n",
-        "\n",
-        "    @property\n",
-        "    def model(self) -> str:\n",
-        "        \"\"\"\n",
-        "        Get the model name.\n",
-        "\n",
-        "        Returns:\n",
-        "            str: The model name.\n",
-        "        \"\"\"\n",
-        "        return self._client.model\n",
-        "\n",
-        "    def set_model(self, value: str) -> None:\n",
-        "        \"\"\"\n",
-        "        Set the model name.\n",
-        "\n",
-        "        Args:\n",
-        "            value (str): The model name.\n",
-        "        \"\"\"\n",
-        "        self._client.set_model(value)\n",
-        "        if self._client.provider:\n",
-        "            self._client.set_endpoint(\"@\".join([value, self._client.provider]))\n",
-        "        else:\n",
-        "            mode = self._client.endpoint.split(\"@\")[1]\n",
-        "            self._client.set_endpoint(\"@\".join([value, mode]))\n",
-        "\n",
-        "    @property\n",
-        "    def provider(self) -> Optional[str]:\n",
-        "        \"\"\"\n",
-        "        Get the provider name.\n",
-        "\n",
-        "        Returns:\n",
-        "            str: The provider name.\n",
-        "        \"\"\"\n",
-        "        return self._client.provider\n",
-        "\n",
-        "    def set_provider(self, value: str) -> None:\n",
-        "        \"\"\"\n",
-        "        Set the provider name.\n",
-        "\n",
-        "        Args:\n",
-        "            value (str): The provider name.\n",
-        "        \"\"\"\n",
-        "        self._client.set_provider(value)\n",
-        "        self._client.set_endpoint(\"@\".join([self._model, value]))\n",
-        "\n",
-        "    @property\n",
-        "    def endpoint(self) -> str:\n",
-        "        \"\"\"\n",
-        "        Get the endpoint name.\n",
-        "\n",
-        "        Returns:\n",
-        "            str: The endpoint name.\n",
-        "        \"\"\"\n",
-        "        return self._client.endpoint\n",
-        "\n",
-        "    def set_endpoint(self, value: str) -> None:\n",
-        "        \"\"\"\n",
-        "        Set the model name.\n",
-        "\n",
-        "        Args:\n",
-        "            value (str): The endpoint name.\n",
-        "        \"\"\"\n",
-        "        self._client.set_endpoint(value)\n",
-        "        self._client.set_model(value.split(\"@\")[0])\n",
-        "        self._client.set_provider(value.split(\"@\")[1])\n",
-        "\n",
-        "    def _get_credits(self):\n",
-        "        \"\"\"\n",
-        "        Retrieves the current credit balance from associated with the UNIFY account.\n",
-        "\n",
-        "        Returns:\n",
-        "            float: Current credit balance.\n",
-        "        \"\"\"\n",
-        "        return self._client.get_credit_balance()\n",
-        "\n",
-        "    def _process_input(self, inp: str, show_credits: bool, show_provider: bool):\n",
-        "        \"\"\"\n",
-        "        Processes the user input to generate AI response.\n",
-        "\n",
-        "        Args:\n",
-        "            inp (str): User input message.\n",
-        "            show_credits (bool): Whether to show credit consumption.\n",
-        "            show_credits (bool): Whether to show provider used.\n",
-        "\n",
-        "        Yields:\n",
-        "            str: Generated AI response chunks.\n",
-        "        \"\"\"\n",
-        "        self._update_message_history(role=\"user\", content=inp)\n",
-        "        initial_credit_balance = self._get_credits()\n",
-        "        stream = self._client.generate(\n",
-        "            messages=self._message_history,\n",
-        "            stream=True,\n",
-        "        )\n",
-        "        words = \"\"\n",
-        "        for chunk in stream:\n",
-        "            words += chunk\n",
-        "            yield chunk\n",
-        "\n",
-        "        self._update_message_history(\n",
-        "            role=\"assistant\",\n",
-        "            content=words,\n",
-        "        )\n",
-        "        final_credit_balance = self._get_credits()\n",
-        "        if show_credits:\n",
-        "            sys.stdout.write(\n",
-        "                \"\\n(spent {:.6f} credits)\".format(\n",
-        "                    initial_credit_balance - final_credit_balance,\n",
-        "                ),\n",
-        "            )\n",
-        "        if show_provider:\n",
-        "            sys.stdout.write(\"\\n(provider: {})\".format(self._client.provider))\n",
-        "\n",
-        "    def _update_message_history(self, role: str, content: str):\n",
-        "        \"\"\"\n",
-        "        Updates message history with user input.\n",
-        "\n",
-        "        Args:\n",
-        "            role (str): Either \"assistant\" or \"user\".\n",
-        "            content (str): User input message.\n",
-        "        \"\"\"\n",
-        "        self._message_history.append(\n",
-        "            {\n",
-        "                \"role\": role,\n",
-        "                \"content\": content,\n",
-        "            },\n",
-        "        )\n",
-        "\n",
-        "    def clear_chat_history(self):\n",
-        "        \"\"\"Clears the chat history.\"\"\"\n",
-        "        self._message_history.clear()\n",
-        "\n",
-        "    def run(self, show_credits: bool = False, show_provider: bool = False):\n",
-        "        \"\"\"\n",
-        "        Starts the chat interaction loop.\n",
-        "\n",
-        "        Args:\n",
-        "            show_credits (bool, optional): Whether to show credit consumption.\n",
-        "            Defaults to False.\n",
-        "            show_provider (bool, optional): Whether to show the provider used.\n",
-        "            Defaults to False.\n",
-        "        \"\"\"\n",
-        "        if not self._paused:\n",
-        "            sys.stdout.write(\n",
-        "                \"Let's have a chat. (Enter `pause` to pause and `quit` to exit)\\n\",\n",
-        "            )\n",
-        "            self.clear_chat_history()\n",
-        "        else:\n",
-        "            sys.stdout.write(\n",
-        "                \"Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\\n\",\n",
-        "            )\n",
-        "        self._paused = False\n",
-        "        while True:\n",
-        "            sys.stdout.write(\"> \")\n",
-        "            inp = input()\n",
-        "            if inp == \"quit\":\n",
-        "                self.clear_chat_history()\n",
-        "                break\n",
-        "            elif inp == \"pause\":\n",
-        "                self._paused = True\n",
-        "                break\n",
-        "            for word in self._process_input(inp, show_credits, show_provider):\n",
-        "                sys.stdout.write(word)\n",
-        "                sys.stdout.flush()\n",
-        "            sys.stdout.write(\"\\n\")\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "1Swnehb9Rvdh"
-      },
-      "source": [
-        "#### Let's Chat"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Qrsyr6gZmGFs"
-      },
-      "source": [
-        "Now, we can instantiate and chat with this agent. For this demo, we'll utilize the `llama-2-7b-chat` model from `anyscale`. However, you have the flexibility to select any model and provider from our supported options on the [benchmarks interface](https://unify.ai/hub)."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "b25iLp5nOPxQ",
-        "outputId": "a1f6c38f-9774-4544-e761-2ba667eba787"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            ">  Hi, nice to meet you. My name is Foo Barrymore, and I am 25 years old.\n",
-            "  Hello Foo! Nice to meet you too. I'm just an AI, I don't have a personal name, but I'm here to help you with any questions or concerns you might have. How has your day been so far?\n",
-            "> How old am I?\n",
-            "  You've told me that you're 25 years old. Is there anything else you'd like to know or discuss?\n",
-            "> Your memory is astounding\n",
-            "  Thank you! I'm glad you think so. I'm designed to remember and process large amounts of information, and I'm constantly learning and improving my abilities. However, it's important to note that my memory is not perfect, and there may be times when I forget or misremember certain details. If you have any specific questions or concerns about my memory or abilities, feel free to ask!\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-        "agent.run()"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "TxK6r9yrnfUS"
-      },
-      "source": [
-        "You can also see how many credits your prompt used. This option is set in the constructor, but it can be overwritten during the run command. When enabled, each response from the chatbot will then be appended with the credits spent:\n",
-        "\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "C8y34VMGnI93",
-        "outputId": "b5d46d0c-72a5-4b17-81a8-e78188eb835e"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            "> What is the capital of Palestine?\n",
-            "  The question of the capital of Palestine is a politically sensitive and complex issue. The status of Jerusalem is disputed between Israelis and Palestinians, with both sides claiming it as their capital.\n",
-            "\n",
-            "The Palestinian National Authority, which governs the Palestinian territories in the West Bank and Gaza Strip, has its administrative center in Ramallah, which is often referred to as the \"de facto capital\" of Palestine. However, the Palestinian Authority has not declared a capital city, and the issue remains a matter of debate and negotiation in the Israeli-Palestinian peace process.\n",
-            "\n",
-            "The international community has not recognized any capital of Palestine, and many countries maintain their diplomatic missions to the Palestinian Authority in Tel Aviv, Israel, rather than in Ramallah or East Jerusalem, which is claimed by the Palestinians as the capital of a future Palestinian state.\n",
-            "\n",
-            "It is important to note that the issue of the capital of Palestine is closely tied to the broader conflict between Israelis and Palestinians, and any resolution to the conflict will need to address this issue in a way that is acceptable to both sides.\n",
-            "(spent 0.000274 credits)\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent.run(show_credits=True)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "Yc_rSlnroeWK"
-      },
-      "source": [
-        "Finally, you can switch providers half-way through the conversation easily. This can be useful to handle prompt of varying complexity.\n",
-        "\n",
-        "For example we can start with a small model for answering simple questions, such as recalling facts, and then move to a larger model for a more complex task, such as creative writing."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "0N9GeB9KnrX-",
-        "outputId": "ae913b2c-2bbf-4ff9-f9b6-fa98ae376c13"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            "> What is the capital of Portugal?\n",
-            "  The capital of Portugal is Lisbon (Portuguese: Lisboa).\n",
-            "(spent 0.000032 credits)\n",
-            "> My name is José Mourinho.\n",
-            "  Ah, I see! José Mourinho is a well-known Portuguese football manager and former football player. He has managed several top-level clubs, including Chelsea, Inter Milan, Real Madrid, and Manchester United. Mourinho is known for his tactical approach to football and his ability to motivate his players. He has won numerous honors and awards throughout his career, including several league titles, domestic cups, and European championships. Is there anything else you'd like to know about José Mourinho?\n",
-            "(spent 0.000159 credits)\n",
-            "> pause\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-        "agent.run(show_credits=True)"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "gQnQFGf0qxTE",
-        "outputId": "24632ab9-8dff-414f-ab4d-cc57b444989e"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\n",
-            "> Please write me a poem about my life in Lisbon, using my name in the poem.\n",
-            "In Lisbon's embrace, where tales intertwine,\n",
-            "Lives José Mourinho, beneath the sun's fine shine.\n",
-            "From cobblestone streets where echoes dance,\n",
-            "To the Tagus' gentle waves that entrance.\n",
-            "\n",
-            "In youth, he dreamt beneath Iberian skies,\n",
-            "Where passion is fierce and ambition never dies.\n",
-            "With a ball at his feet and dreams in his heart,\n",
-            "In Lisbon's grand story, he crafted his part.\n",
-            "\n",
-            "Eduardo VII Park, in the spring's embrace,\n",
-            "Where thoughts of tactics first took place.\n",
-            "Through Alfama's alleys, past Fado's mournful sound,\n",
-            "Mourinho's purpose, in football, was found.\n",
-            "\n",
-            "From Benfica's nest to União de Leiria's helm,\n",
-            "His journey began, in a realm\n",
-            "Where strategies and plays, meticulously spun,\n",
-            "Foreshadowed the triumphs that would be won.\n",
-            "\n",
-            "In Estádio da Luz, where eagles soar,\n",
-            "Mourinho pondered scores and more.\n",
-            "Though his stay was brief, the impact was deep;\n",
-            "In Lisbon's lore, his legacy would steep.\n",
-            "\n",
-            "The boy from Setúbal, with Lisbon in his tale,\n",
-            "Set forth to conquer, to win, and to prevail.\n",
-            "Through Porto, London, Milan, Madrid's grand stage,\n",
-            "His story was written, page by page.\n",
-            "\n",
-            "Yet, amidst the victories and the fame's bright light,\n",
-            "In his heart, Lisbon remains, ever so bright.\n",
-            "For it's there José Mourinho's dreams took flight,\n",
-            "In Lisbon's embrace, under the starry night.\n",
-            "\n",
-            "So, here's to Mourinho, with Lisbon's spirit in his veins,\n",
-            "Where the love for the game forever remains.\n",
-            "In every triumph, in every fall,\n",
-            "Lisbon, his beginning, the most cherished of all.\n",
-            "(spent 0.012020 credits)\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent.set_endpoint(\"gpt-4-turbo@openai\")\n",
-        "agent.run(show_credits=True)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "dQ0AqGSvrTaP"
-      },
-      "source": [
-        "Switching between providers mid-conversation makes it much easier to maximize quality and runtime performance based on the latest metrics, and also save on costs!\n",
-        "\n",
-        "In fact, you can automatically optimize for a metric of your choice with our [dynamic routing modes](https://unify.ai/docs/hub/concepts/runtime_routing.html#available-modes). For example, you can optimize for speed as follows:"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "n4W-35vbrFDP",
-        "outputId": "6065088a-b79d-4ab7-96d5-7dd1cfc67ccf"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            "> Tell me your favorite physics fact.\n",
-            "My favorite physics fact is that the universe is still expanding! This means that the galaxies that are currently moving away from us will continue to move away from us, and eventually, they will move faster than the speed of light. This is known as the \"dark energy\" that is thought to be responsible for the acceleration of the universe's expansion.\n",
-            "\n",
-            "I find this fascinating because it shows that the universe is still evolving and changing, and there is still so much to learn about it. It's mind-boggling to think about the vastness of space and the mysteries that it holds.\n",
-            "\n",
-            "Additionally, this fact also reminds me of the importance of continuous learning and exploration. There is always more to discover and understand, and it's important to have a curious and open-minded approach to life.\n",
-            "\n",
-            "I hope this fact inspires you to learn more about the wonders of the universe!\n",
-            "(provider: fireworks-ai)\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent.set_endpoint(\"llama-2-70b-chat@highest-tks-per-sec\")\n",
-        "agent.run(show_provider=True)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "wqSzrxL9WydO"
-      },
-      "source": [
-        "The flag `show_provider` ensures that the specific provider is printed at the end of each response. For example, sometimes `anyscale` might be the fastest, and at other times it might be `together-ai` or `fireworks-ai`. This flag enables you to keep track of what provider is being used under the hood."
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "RM1uIFFaG9Gj"
-      },
-      "source": [
-        "If the task is to summarize a document or your chat history grows, typically the input-cost becomes the primary cost driver. You can use our `lowest-input-cost` mode to direct queries to the provider with the lowest input cost automatically."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "-1SG4s7BIpmR",
-        "outputId": "18a2f091-3dc9-4065-c475-85c4b32e2bac"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            "> Summarize the following in less than 10 words: Sir Isaac Newton FRS (25 December 1642 – 20 March 1726/27[a]) was an English polymath active as a mathematician, physicist, astronomer, alchemist, theologian, and author who was described in his time as a natural philosopher.[7] He was a key figure in the Scientific Revolution and the Enlightenment that followed. His pioneering book Philosophiæ Naturalis Principia Mathematica (Mathematical Principles of Natural Philosophy), first published in 1687, consolidated many previous results and established classical mechanics.[8][9] Newton also made seminal contributions to optics, and shares credit with German mathematician Gottfried Wilhelm Leibniz for developing infinitesimal calculus, though he developed calculus years before Leibniz.[10][11]  In the Principia, Newton formulated the laws of motion and universal gravitation that formed the dominant scientific viewpoint for centuries until it was superseded by the theory of relativity. Newton used his mathematical description of gravity to derive Kepler's laws of planetary motion, account for tides, the trajectories of comets, the precession of the equinoxes and other phenomena, eradicating doubt about the Solar System's heliocentricity.[12] He demonstrated that the motion of objects on Earth and celestial bodies could be accounted for by the same principles. Newton's inference that the Earth is an oblate spheroid was later confirmed by the geodetic measurements of Maupertuis, La Condamine, and others, convincing most European scientists of the superiority of Newtonian mechanics over earlier systems.  Newton built the first practical reflecting telescope and developed a sophisticated theory of colour based on the observation that a prism separates white light into the colours of the visible spectrum. His work on light was collected in his highly influential book Opticks, published in 1704. He also formulated an empirical law of cooling, made the first theoretical calculation of the speed of sound, and introduced the notion of a Newtonian fluid. In addition to his work on calculus, as a mathematician Newton contributed to the study of power series, generalised the binomial theorem to non-integer exponents, developed a method for approximating the roots of a function, and classified most of the cubic plane curves.  Newton was a fellow of Trinity College and the second Lucasian Professor of Mathematics at the University of Cambridge. He was a devout but unorthodox Christian who privately rejected the doctrine of the Trinity. He refused to take holy orders in the Church of England, unlike most members of the Cambridge faculty of the day. Beyond his work on the mathematical sciences, Newton dedicated much of his time to the study of alchemy and biblical chronology, but most of his work in those areas remained unpublished until long after his death. Politically and personally tied to the Whig party, Newton served two brief terms as Member of Parliament for the University of Cambridge, in 1689–1690 and 1701–1702. He was knighted by Queen Anne in 1705 and spent the last three decades of his life in London, serving as Warden (1696–1699) and Master (1699–1727) of the Royal Mint, as well as president of the Royal Society (1703–1727).\n",
-            "  Newton: polymath, mathematician, physicist, astronomer, alchemist, theologian, and author.\n",
-            "(provider: octoai)\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "agent = ChatBot(api_key=UNIFY_KEY, endpoint=\"llama-2-70b-chat@lowest-input-cost\")\n",
-        "agent.run(show_provider=True)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "W-EaEPxAKdKe"
-      },
-      "source": [
-        "# Python Package"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "W9vhGX9aKncg"
-      },
-      "source": [
-        "The python package already contains the `ChatBot` agent and you may use it directly as follows:"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "en7GCev9KmgX",
-        "outputId": "fcaa2b15-88a1-4108-e68e-a95b4c403302"
-      },
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-            "> Hey! How's it going?\n",
-            "  Hello! I'm doing well, thank you for asking! It's going great here, just busy with various tasks and learning new things. However, I must point out that this conversation is a bit unusual as I'm just an AI and don't have personal experiences or emotions like humans do. I'm here to help answer any questions you may have, so feel free to ask me anything!\n",
-            "> quit\n"
-          ]
-        }
-      ],
-      "source": [
-        "from unify import ChatBot\n",
-        "chatbot = ChatBot(api_key = UNIFY_KEY, endpoint=\"llama-2-7b-chat@anyscale\")\n",
-        "chatbot.run()\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "nyq473oLxjoh"
-      },
-      "source": [
-        "# Round Up\n",
-        " Congratulations! 🚀 You are now capable of building ChatBot Agents for your application using our LLM endpoints. "
-      ]
-    }
-  ],
-  "metadata": {
-    "colab": {
-      "collapsed_sections": [
-        "1Swnehb9Rvdh"
-      ],
-      "provenance": []
-    },
-    "kernelspec": {
-      "display_name": "Python 3",
-      "name": "python3"
-    },
-    "language_info": {
-      "name": "python"
-    }
-  },
-  "nbformat": 4,
-  "nbformat_minor": 0
-}
diff --git a/hub/_sources/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.md.txt b/hub/_sources/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.md.txt
deleted file mode 100644
index f75becf056..0000000000
--- a/hub/_sources/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.md.txt
+++ /dev/null
@@ -1,28 +0,0 @@
-# How to become a contributor and submit your own code
-## Contributor License Agreements
-We'd love to accept your sample apps and patches! Before we can take them, we
-have to jump a couple of legal hurdles.
-Please fill out either the individual or corporate Contributor License Agreement
-(CLA).
-  * If you are an individual writing original source code and you're sure you
-    own the intellectual property, then you'll need to sign an [individual CLA]
-    (https://developers.google.com/open-source/cla/individual).
-  * If you work for a company that wants to allow you to contribute your work,
-    then you'll need to sign a [corporate CLA]
-    (https://developers.google.com/open-source/cla/corporate).
-Follow either of the two links above to access the appropriate CLA and
-instructions for how to sign and return it. Once we receive it, we'll be able to
-accept your pull requests.
-## Contributing A Patch
-1. Submit an issue describing your proposed change to the repo in question.
-1. The repo owner will respond to your issue promptly.
-1. If your proposed change is accepted, and you haven't already done so, sign a
-   Contributor License Agreement (see details above).
-1. Fork the desired repo, develop and test your code changes.
-1. Ensure that your code adheres to the existing style in the sample to which
-   you are contributing. Refer to the
-   [Google Cloud Platform Samples Style Guide]
-   (https://github.com/GoogleCloudPlatform/Template/wiki/style.html) for the
-   recommended coding standards for this organization.
-1. Ensure that your code has an appropriate set of unit tests which all pass.
-1. Submit a pull request.
\ No newline at end of file
diff --git a/hub/_sources/demos/demos/Unify/Chatbot_Arena/README.md.txt b/hub/_sources/demos/demos/Unify/Chatbot_Arena/README.md.txt
deleted file mode 100644
index 1a70cd4dee..0000000000
--- a/hub/_sources/demos/demos/Unify/Chatbot_Arena/README.md.txt
+++ /dev/null
@@ -1,120 +0,0 @@
-# Chatbot Arena
-
-[Demo](https://github.com/Kacper-W-Kozdon/demos-Unify/assets/102428159/e5908b4e-0cd7-445d-a1ac-3086be2db5ba)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/Chatbot_arena.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[ChatBot Arena on Streamlit](https://llm-playground-unify.streamlit.app/)
-
-<p align="center">
-    <em>This Streamlit application provides a user interface for interacting with Unify models through chat. It allows users to select models and providers, input text, and view the conversation history with AI assistants.
-</em>
-</p>
-<p align="center">
-	<!-- Shields.io badges not used with skill icons. --><p>
-<p align="center">
-		<em>Developed with the software and tools below.</em>
-</p>
-<p align="center">
-	<a href="https://skillicons.dev">
-		<img src="https://skillicons.dev/icons?i=python,docker,github,gcp">
-	</a></p>
-
-
-###  Overview
-This Streamlit application provides a user interface for interacting with Unify models through the chat. It allows users to select models and providers, input text, and view the conversation history with two AI assistants at a time. The app collects the data on the users' assessment of the comparative models' performance and provides an easy access to the global leaderboards which can be used as a complementary form of assessment of the performance of the models.
-
-
-### Motivation
-The challenge project "Chatbot arena" is based on [this article](https://arxiv.org/abs/2403.04132).
-
-
-### Features
-
-- **Chat UI**: Interactive chat interface to communicate with AI assistants.
-- **Endpoint from Unify**: Choose from a variety of models and providers.
-- **Conversation History**: View and track the conversation history with each model.
-- **Clear History**: Option to clear the conversation history for a fresh start.
-- **Global Leaderboards**: The votes are saved locally and [globally](https://docs.google.com/spreadsheets/d/10QrEik70RYY_LM8RW8GGq-vZWK2e1dka6agRGtKZPHU/edit#gid=0).
-
-
-
-
-### How to use the app
-
-
-1. Input Unify API Key: Enter your Unify API key in the provided text input box on the sidebar.
-
-2. Select endpoints : Choose the models and providers from the sidebar dropdown menus.
-
-3. Start Chatting: Type your message in the chat input box and press "Enter" or click the "Send" button.
-
-4. View Conversation History: The conversation history with the AI assistant for each model is displayed in separate containers.
-
-5. Clear History: You can clear the conversation history by clicking the "Clear History" button.
-
-
-###  Getting Started
-
-**System Requirements:**
-
-* **Python**
-* **streamlit**
-* extra: look into the `requirements.txt` and `requirements-test.txt` files
-
-
-####  Easy installation
-
-<h4>From <code>source</code> in order to use the attached Docker file.</h4>
-
----
-
-## Repository and Deployment
-
-### Setup (without Docker)
-
-1. Clone this repository:
-
-    ```bash
-    git clone https://github.com/samthakur587/LLM_playground
-    ```
-2. change directory
-   ```bash
-   cd LLM_playground
-   ```
-
-
-3. Install the required dependencies:
-
-    ```bash
-    pip install -r requirements.txt
-    ```
-
-### Run the app
-```bash
-streamlit run Chatbot_arena.py
-```
-
----
-## Contributors
-<p align="center">
-   
-
-
-| Name | GitHub Profile |
-|------|----------------|
-| Samunder Singh | [samthakur587](https://github.com/samthakur587) |
-| Kacper Kożdoń | [Kacper-W-Kozdon](https://github.com/Kacper-W-Kozdon) |
-
-  <a href="https://github.com{/samthakur587/LLM_playground/graphs/contributors">
-      <img src="https://contrib.rocks/image?repo=samthakur587/LLM_playground">
-   </a>
-</p>
----
-
-
diff --git a/hub/_sources/demos/demos/Unify/LLM-Wars/README.md.txt b/hub/_sources/demos/demos/Unify/LLM-Wars/README.md.txt
deleted file mode 100644
index 6075b72ff2..0000000000
--- a/hub/_sources/demos/demos/Unify/LLM-Wars/README.md.txt
+++ /dev/null
@@ -1,65 +0,0 @@
-# LLM-Wars
-[Demo](https://github.com/unifyai/demos/assets/43880587/aba328d2-4c9e-4cd4-a6aa-82657e806145)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/llm-wars.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[LLM Wars on Streamlit](https://unify-llm-wars-tftznesvztdt2bwsqgub3r.streamlit.app/)
-
-### Overview
-**LLM Wars** is a web application built with Streamlit that sets up a dynamic competition between two Large Language Models (LLMs). The LLMs engage in a structured debate where they challenge each other by generating complex prompts, responding to those prompts, and evaluating the responses. This application demonstrates the natural language capabilities of modern AI models in an interactive competitive environment with visualizations.
-
-### Objective
-The main goal of LLM Wars is to provide a creative and educational platform for testing AI models against each other following predefined rules. It highlights the strengths and limitations of language models while presenting AI capabilities engagingly to users.
-
-### Tech Stack
-- **Streamlit**: Used for creating the web application interface that is intuitive and interactive.
-- **Unify AI**: Provides the backend LLMs that power the interactions within the application. Unify's API is utilized to send prompts to the LLMs and receive their responses in real-time.
-
-### Application Flow
-1. **Initialization**: Users start by selecting two competing LLMs and one judge LLM from a predefined list of available models.
-2. **Competition Cycle**:
-   - **Prompt Suggestion**: LLM1 generates a challenging prompt.
-   - **Response Generation**: LLM2 attempts to respond accurately to the prompt.
-   - **Verification**: LLM1 verifies the correctness of LLM2's response.
-   - **Judgment**: The judge LLM evaluates the interaction. If LLM2's response is deemed incorrect, LLM1 is declared the winner, and the cycle ends. Otherwise, roles are reversed, and the cycle repeats with LLM2 generating the next prompt.
-3. **Visualization**: The application provides a visual representation of the ongoing interaction, scores, and decisions made by the judge LLM.
-
-### Motivation
-LLM Wars demonstrates novel LLM applications beyond common use cases by creating a competitive AI environment. This pushes the boundaries of what language models can creatively and adaptively achieve. It also serves an educational purpose demystifying AI for audiences like students and professionals.
-
-### Key Concepts
-- **Natural Language Understanding and Generation**: At the core of LLM Wars is the ability of LLMs to understand and generate human-like text, showcasing advancements in AI language models.
-- **API Integration**: Demonstrates how to effectively integrate and utilize third-party APIs (Unify AI) within a Python-based application.
-
-
-## Repository and Deployment
-### Access the Source Code
-The source code for **LLM Wars** is part of a larger collection of demos. You can access the original source code for this specific project [here](https://github.com/leebissessar5/Unify-LLM-Wars).
-
-### Live Application
-### Running Locally
-To run **LLM Wars** locally, clone the repository, then open up a terminal window from this directory (where this README is located) and follow these steps:
-
-1. **Install Dependencies**: Install the required Python libraries using pip:
-   ```bash
-   pip install -r requirements.txt
-   ```
-
-2. **Launch the Application**: Finally, start the application by running:
-   ```bash
-   streamlit run main.py
-   ```
-
-This command initiates the Streamlit server, and you should see a URL displayed in your terminal where you can access the app locally, typically at `http://localhost:8501`.
-
-## Contributors
-| Name | GitHub Profile |
-|------|----------------|
-| Lee Bissessar | [leebissessar](https://github.com/leebissessar5) |
-| Glorry Sibomana | [WHITELOTUS0](https://github.com/WHITELOTUS0) |
-| Kato Steven Mubiru | [KatoStevenMubiru](https://github.com/KatoStevenMubiru) |
diff --git a/hub/_sources/demos/demos/Unify/LLM_Debate/README.md.txt b/hub/_sources/demos/demos/Unify/LLM_Debate/README.md.txt
deleted file mode 100644
index ff5fb00d68..0000000000
--- a/hub/_sources/demos/demos/Unify/LLM_Debate/README.md.txt
+++ /dev/null
@@ -1,50 +0,0 @@
-# AI Debate App
-
-[demo](https://github.com/unifyai/demos/assets/121057369/a2db65f2-a14f-409e-b883-17b5382bddfe)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/LLM-Debate.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[LLM Debate App on Streamlit](https://llm-playground-unify.streamlit.app/)
-
-
-## Introduction
-Debate-App is a web application that enables a back-and-forth conversation between two Language Models (LLMs) on a topic chosen by the user. Users can select any two models, input a query, and visualize the dialogue between the LLMs in real-time. Built using Unify and deployed with Streamlit, this application provides a platform for users to witness AI-generated debates and explore the capabilities of different language models.
-
-
-## Tech Stack
-- **Streamlit**: Used for creating the web application interface that is intuitive and interactive.
-- **Unify AI**: Provides the backend LLMs that power the interactions within the application. Unify's API is utilized to send prompts to the LLMs and receive their responses in real-time.
-
-## Repository and Deployment
-Repo Link:
-```commandline 
-https://github.com/Sanjay8602/Debate-App
-```
-Guide to run locally:
-```commandline 
-git clone https://github.com/Sanjay8602/Debate-App.git
-```
-Installing Dependencies:
-```commandline 
-pip install -r requirements.txt
-```
-Run Locally:
-```commandline 
-streamlit run app.py
-```
-Deployed app link:
-```commandline 
-https://sanjay8602-debate-app-app-kt5o9f.streamlit.app/
-```
-
-## Contributors
-Contributors to the project:
-
-|     Name      |               GitHub Profile                   |
-|---------------|------------------------------------------------|
-| Sanjay Suthar | [Sanjay8602](https://github.com/Sanjay8602)    |
-| Ogban Ugot    | [ogbanugot](https://github.com/ogbanugot)      |
diff --git a/hub/_sources/demos/demos/Unify/README.md.txt b/hub/_sources/demos/demos/Unify/README.md.txt
deleted file mode 100644
index 19d5984adc..0000000000
--- a/hub/_sources/demos/demos/Unify/README.md.txt
+++ /dev/null
@@ -1,2 +0,0 @@
-# Unify Projects
-This folder contains various projects built using the Unify Python Package. Please headover to the corresponding folder of the project for more details. 
\ No newline at end of file
diff --git a/hub/_sources/demos/demos/Unify/SemanticRouter/README.md.txt b/hub/_sources/demos/demos/Unify/SemanticRouter/README.md.txt
deleted file mode 100644
index 1e73a9093d..0000000000
--- a/hub/_sources/demos/demos/Unify/SemanticRouter/README.md.txt
+++ /dev/null
@@ -1,46 +0,0 @@
-# Semantic Router
-[Demo](https://github.com/ithanigaikumar/demos/assets/107815119/33ceff47-3495-44a9-aad7-c0a3ba3433a8)
-
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/semanticrouterapplication.mp4" type="video/mp4">
-  Your browser does not support the video tag.
-</video>
-
-
-A live version of the application is hosted on Streamlit, try it out yourself using the link below: 
-[Semantic Router on Streamlit](https://semanticrouterchatbot.streamlit.app/)
-
-## Introduction:
-This semantic router Streamit application optimizes user query handling by dynamically routing each query to the most appropriate model based on semantic similarity.A routing layer is included to help with this process. This system supports predefined routes for domains like maths and coding, and allows users to create custom routes for unique needs. By ensuring that queries are processed by the best-suited model, the semantic router enhances output quality and improves cost efficiency. This approach not only delivers more accurate and contextually relevant responses but also enhances overall user satisfaction.
-
-
-## Repository and deployment
-Access using the following URL: [https://semanticrouterchatbot.streamlit.app/](https://semanticrouterchatbot.streamlit.app/) or follow the sections below to get started.
-Fork from this respository:[https://github.com/ithanigaikumar/SemanticRouter]
-To set up the project, you will need to install several Python packages. You can do this using pip, Python's package installer. Execute the following commands in your terminal or command prompt to install the required packages.
-
-**Install Required Packages:**
-```
-   pip install streamlit
-   pip install -U semantic-router==0.0.34
-   pip install unifyai
-   pip install transformers
-   pip install torch
-
-```
-Make sure that each command completes successfully before proceeding to the next step. If you encounter any issues during the installation process, check your Python and pip versions, and ensure your environment is configured correctly.
-
- **Launch the App :**
-
-
-    
-    streamlit run app.py
-
-
-  
-## Contributors
-
-| Name                          | GitHub Username |
-|-------------------------------|-----------------|
-| Indiradharshini Thanigaikumar | [ithanigaikumar](https://github.com/ithanigaikumar)  |
-| Jeyabalan Nadar               | [jeyabalang](https://github.com/jeyabalang)    |
diff --git a/hub/_sources/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb.txt b/hub/_sources/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb.txt
deleted file mode 100644
index 95451fa919..0000000000
--- a/hub/_sources/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb.txt
+++ /dev/null
@@ -1,479 +0,0 @@
-{
-  "cells": [
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "UxqB7_Ieur0s"
-      },
-      "source": [
-        "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb) [![Open nbviewer](https://raw.githubusercontent.com/pinecone-io/examples/master/assets/nbviewer-shield.svg)](https://nbviewer.org/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "EduhQaNAur0u"
-      },
-      "source": [
-        "# Dynamic Routes"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "_4JgNeX4ur0v"
-      },
-      "source": [
-        "In semantic-router there are two types of routes that can be chosen. Both routes belong to the `Route` object, the only difference between them is that _static_ routes return a `Route.name` when chosen, whereas _dynamic_ routes use an LLM call to produce parameter input values.\n",
-        "\n",
-        "For example, a _static_ route will tell us if a query is talking about mathematics by returning the route name (which could be `\"math\"` for example). A _dynamic_ route can generate additional values, so it may decide a query is talking about maths, but it can also generate Python code that we can later execute to answer the user's query, this output may look like `\"math\", \"import math; output = math.sqrt(64)`.\n",
-        "\n",
-        "***⚠️ Note: We have a fully local version of dynamic routes available at [docs/05-local-execution.ipynb](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb). The local 05 version tends to outperform the OpenAI version we demo in this notebook, so we'd recommend trying [05](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb)!***"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "bbmw8CO4ur0v"
-      },
-      "source": [
-        "## Installing the Library"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 12,
-      "metadata": {
-        "id": "dLElfRhgur0v"
-      },
-      "outputs": [
-        {
-          "name": "stderr",
-          "output_type": "stream",
-          "text": [
-            "  error: subprocess-exited-with-error\n",
-            "  \n",
-            "  × Building wheel for llama-cpp-python (pyproject.toml) did not run successfully.\n",
-            "  │ exit code: 1\n",
-            "  ╰─> [20 lines of output]\n",
-            "      *** scikit-build-core 0.9.2 using CMake 3.29.2 (wheel)\n",
-            "      *** Configuring CMake...\n",
-            "      2024-04-29 12:24:08,789 - scikit_build_core - WARNING - Can't find a Python library, got libdir=None, ldlibrary=None, multiarch=None, masd=None\n",
-            "      loading initial cache file C:\\Users\\indir\\AppData\\Local\\Temp\\tmppik1ey4m\\build\\CMakeInit.txt\n",
-            "      -- Building for: NMake Makefiles\n",
-            "      CMake Error at CMakeLists.txt:3 (project):\n",
-            "        Running\n",
-            "      \n",
-            "         'nmake' '-?'\n",
-            "      \n",
-            "        failed with:\n",
-            "      \n",
-            "         no such file or directory\n",
-            "      \n",
-            "      \n",
-            "      CMake Error: CMAKE_C_COMPILER not set, after EnableLanguage\n",
-            "      CMake Error: CMAKE_CXX_COMPILER not set, after EnableLanguage\n",
-            "      -- Configuring incomplete, errors occurred!\n",
-            "      \n",
-            "      *** CMake configuration failed\n",
-            "      [end of output]\n",
-            "  \n",
-            "  note: This error originates from a subprocess, and is likely not a problem with pip.\n",
-            "  ERROR: Failed building wheel for llama-cpp-python\n",
-            "ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects\n",
-            "\n",
-            "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-            "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-          ]
-        },
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Requirement already satisfied: unifyai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (0.8.1)\n",
-            "Requirement already satisfied: openai<2.0.0,>=1.12.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (1.20.0)\n",
-            "Requirement already satisfied: requests<3.0.0,>=2.31.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (2.31.0)\n",
-            "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.3.0)\n",
-            "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.9.0)\n",
-            "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (0.27.0)\n",
-            "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.7.0)\n",
-            "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-            "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-            "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-            "Requirement already satisfied: charset-normalizer<4,>=2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.2.0)\n",
-            "Requirement already satisfied: idna<4,>=2.5 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.4)\n",
-            "Requirement already satisfied: urllib3<3,>=1.21.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.3)\n",
-            "Requirement already satisfied: certifi>=2017.4.17 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2023.5.7)\n",
-            "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-            "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (1.0.5)\n",
-            "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (0.14.0)\n",
-            "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-            "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.18.1)\n",
-            "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai<2.0.0,>=1.12.0->unifyai) (0.4.6)\n"
-          ]
-        },
-        {
-          "name": "stderr",
-          "output_type": "stream",
-          "text": [
-            "\n",
-            "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-            "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-          ]
-        },
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Requirement already satisfied: openai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (1.20.0)\n",
-            "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.3.0)\n",
-            "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.9.0)\n",
-            "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (0.27.0)\n",
-            "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (2.7.0)\n",
-            "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.3.1)\n",
-            "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.66.2)\n",
-            "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.11.0)\n",
-            "Requirement already satisfied: idna>=2.8 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (3.4)\n",
-            "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (1.2.0)\n",
-            "Requirement already satisfied: certifi in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (2023.5.7)\n",
-            "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (1.0.5)\n",
-            "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai) (0.14.0)\n",
-            "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (0.6.0)\n",
-            "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (2.18.1)\n",
-            "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai) (0.4.6)\n"
-          ]
-        },
-        {
-          "name": "stderr",
-          "output_type": "stream",
-          "text": [
-            "\n",
-            "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-            "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-          ]
-        }
-      ],
-      "source": [
-        "!pip install -qU \"semantic-router[local]==0.0.20\"\n",
-        "!pip install unifyai\n",
-        "!pip install openai\n",
-        "\n"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "BixZd6Eour0w"
-      },
-      "source": [
-        "## Initializing Routes and RouteLayer"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "PxnW9qBvur0x"
-      },
-      "source": [
-        "Dynamic routes are treated in the same way as static routes, let's begin by initializing a `RouteLayer` consisting of static routes."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 10,
-      "metadata": {
-        "id": "kc9Ty6Lgur0x"
-      },
-      "outputs": [],
-      "source": [
-        "from semantic_router import Route\n",
-        "\n",
-        "# Define routes for Math and Coding\n",
-        "math_route = Route(\n",
-        "    name=\"math\",\n",
-        "    utterances=[\n",
-        "        \"solve for x in the equation\",\n",
-        "        \"what is the integral of\",\n",
-        "        \"how to calculate the derivative\",\n",
-        "        \"mathematical proofs\",\n",
-        "        \"how do you find the percentage of this number\"\n",
-        "    ],\n",
-        ")\n",
-        "\n",
-        "coding_route = Route(\n",
-        "    name=\"coding\",\n",
-        "    utterances=[\n",
-        "        \"how to write a for loop in Python\",\n",
-        "        \"explain the use of classes in Java\",\n",
-        "        \"what is recursion in programming\",\n",
-        "        \"how do i optimise this problem using hash tables\",\n",
-        "        \"suggest a more efficient data structure for this problem\"\n",
-        "    ],\n",
-        ")\n",
-        "\n",
-        "# List of all routes\n",
-        "routes = [math_route, coding_route]"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "voWyqmffur0x"
-      },
-      "source": [
-        "We initialize our `RouteLayer` with our `encoder` and `routes`. We can use popular encoder APIs like `CohereEncoder` and `OpenAIEncoder`, or local alternatives like `FastEmbedEncoder`."
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 11,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "BI9AiDspur0y",
-        "outputId": "27329a54-3f16-44a5-ac20-13a6b26afb97"
-      },
-      "outputs": [
-        {
-          "ename": "ImportError",
-          "evalue": "Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`",
-          "output_type": "error",
-          "traceback": [
-            "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
-            "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-            "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:25\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     24\u001b[0m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[1;32m---> 25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n",
-            "\u001b[1;31mImportError\u001b[0m: cannot import name 'TextEmbedding' from 'fastembed' (unknown location)",
-            "\nDuring handling of the above exception, another exception occurred:\n",
-            "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-            "Cell \u001b[1;32mIn [11], line 6\u001b[0m\n\u001b[0;32m      3\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m RouteLayer\n\u001b[0;32m      4\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01mencoders\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FastEmbedEncoder\n\u001b[1;32m----> 6\u001b[0m encoder \u001b[38;5;241m=\u001b[39m \u001b[43mFastEmbedEncoder\u001b[49m\u001b[43m(\u001b[49m\u001b[43mname\u001b[49m\u001b[38;5;241;43m=\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[38;5;124;43mBAAI/bge-small-en-v1.5\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[43m)\u001b[49m\n\u001b[0;32m      8\u001b[0m rl \u001b[38;5;241m=\u001b[39m RouteLayer(encoder\u001b[38;5;241m=\u001b[39mencoder, routes\u001b[38;5;241m=\u001b[39mroutes)\n",
-            "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:21\u001b[0m, in \u001b[0;36mFastEmbedEncoder.__init__\u001b[1;34m(self, score_threshold, **data)\u001b[0m\n\u001b[0;32m     17\u001b[0m \u001b[38;5;28;01mdef\u001b[39;00m \u001b[38;5;21m__init__\u001b[39m(\n\u001b[0;32m     18\u001b[0m     \u001b[38;5;28mself\u001b[39m, score_threshold: \u001b[38;5;28mfloat\u001b[39m \u001b[38;5;241m=\u001b[39m \u001b[38;5;241m0.5\u001b[39m, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata\n\u001b[0;32m     19\u001b[0m ):  \u001b[38;5;66;03m# TODO default score_threshold not thoroughly tested, should optimize\u001b[39;00m\n\u001b[0;32m     20\u001b[0m     \u001b[38;5;28msuper\u001b[39m()\u001b[38;5;241m.\u001b[39m\u001b[38;5;21m__init__\u001b[39m(score_threshold\u001b[38;5;241m=\u001b[39mscore_threshold, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata)\n\u001b[1;32m---> 21\u001b[0m     \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39m_client \u001b[38;5;241m=\u001b[39m \u001b[38;5;28;43mself\u001b[39;49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43m_initialize_client\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\n",
-            "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:27\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n\u001b[1;32m---> 27\u001b[0m     \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m(\n\u001b[0;32m     28\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mPlease install fastembed to use FastEmbedEncoder. \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     29\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mYou can install it with: \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     30\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m`pip install \u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124msemantic-router[fastembed]\u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124m`\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     31\u001b[0m     )\n\u001b[0;32m     33\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {\n\u001b[0;32m     34\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmodel_name\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mname,\n\u001b[0;32m     35\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmax_length\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mmax_length,\n\u001b[0;32m     36\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mcache_dir\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mcache_dir,\n\u001b[0;32m     37\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mthreads\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mthreads,\n\u001b[0;32m     38\u001b[0m }\n\u001b[0;32m     40\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {k: v \u001b[38;5;28;01mfor\u001b[39;00m k, v \u001b[38;5;129;01min\u001b[39;00m embedding_args\u001b[38;5;241m.\u001b[39mitems() \u001b[38;5;28;01mif\u001b[39;00m v \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m}\n",
-            "\u001b[1;31mImportError\u001b[0m: Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`"
-          ]
-        }
-      ],
-      "source": [
-        "import os\n",
-        "from getpass import getpass\n",
-        "from semantic_router import RouteLayer\n",
-        "from semantic_router.encoders import HuggingFaceEncoder\n",
-        "\n",
-        "encoder = HuggingFaceEncoder()\n",
-        "\n",
-        "rl = RouteLayer(encoder=encoder, routes=routes)"
-      ]
-    },
-    {
-      "cell_type": "markdown",
-      "metadata": {
-        "id": "GuLCeIS5ur0y"
-      },
-      "source": [
-        "We run the solely static routes layer:"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 4,
-      "metadata": {
-        "colab": {
-          "base_uri": "https://localhost:8080/"
-        },
-        "id": "_rNREh7gur0y",
-        "outputId": "f3a1dc0b-d760-4efb-b634-d3547011dcb7"
-      },
-      "outputs": [
-        {
-          "data": {
-            "text/plain": [
-              "RouteChoice(name='math', function_call=None, similarity_score=None)"
-            ]
-          },
-          "execution_count": 4,
-          "metadata": {},
-          "output_type": "execute_result"
-        }
-      ],
-      "source": [
-        "rl(\"Solve the equation 5-x=12 for x?\")"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 13,
-      "metadata": {},
-      "outputs": [],
-      "source": [
-        "from unify import Unify\n",
-        "# Environment setup for API keys\n",
-        "os.environ[\"UNIFY_KEY\"] =  getpass(\"Enter Unify API Key: \")"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": null,
-      "metadata": {},
-      "outputs": [],
-      "source": [
-        "import os\n",
-        "from unify import ChatBot\n",
-        "\n",
-        "def test_unify_endpoint():\n",
-        "    try:\n",
-        "        # Set up the ChatBot with a known working endpoint and API key\n",
-        "        agent = ChatBot(\n",
-        "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-        "            endpoint=\"gpt-4@anyscale\"  # Adjust this if necessary\n",
-        "        )\n",
-        "        \n",
-        "        # Example prompt to test the service\n",
-        "        test_prompt = \"What is 2+2?\"\n",
-        "        \n",
-        "        # Making a request to the Unify service\n",
-        "        response = agent.run(test_prompt)\n",
-        "        print(\"Response from Unify:\", response)\n",
-        "        \n",
-        "    except Exception as e:\n",
-        "        print(\"Failed to connect to Unify endpoint:\", str(e))\n",
-        "\n",
-        "if __name__ == \"__main__\":\n",
-        "    test_unify_endpoint()\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 44,
-      "metadata": {},
-      "outputs": [],
-      "source": [
-        "#Unify process query\n",
-        "def process_query(query):\n",
-        "    route_choice = rl(query)\n",
-        "    print(f\"Route chosen: {route_choice.name}\")\n",
-        "\n",
-        "    if route_choice.name == \"math\":\n",
-        "        # Initialize Unify with the endpoint for math queries\n",
-        "        unify = Unify(\n",
-        "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-        "            endpoint=\"llama-2-13b-chat@anyscale\"  # Use the correct endpoint for math queries, other models not working\n",
-        "        )\n",
-        "        # Generate the response using Unify\n",
-        "        response = unify.generate(user_prompt=query)\n",
-        "        return response\n",
-        "\n",
-        "    elif route_choice.name == \"coding\":\n",
-        "        # Initialize Unify with the endpoint for coding queries\n",
-        "        unify = Unify(\n",
-        "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-        "            endpoint=\"codellama-34b-instruct@anyscale\"  # Use the correct endpoint for coding queries\n",
-        "        )\n",
-        "        # Generate the response using Unify\n",
-        "        response = unify.generate(user_prompt=query)\n",
-        "        return response\n",
-        "\n",
-        "    else:\n",
-        "        return \"This query does not fall under a supported category.\"\n",
-        "\n"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 45,
-      "metadata": {},
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Route chosen: math\n",
-            "Sure! To solve the equation 5 - x = 12, we can add x to both sides of the equation.\n",
-            "\n",
-            "5 - x = 12\n",
-            "\n",
-            "Adding x to both sides gives us:\n",
-            "\n",
-            "5 = 12 + x\n",
-            "\n",
-            "Now we can subtract 12 from both sides:\n",
-            "\n",
-            "5 - 12 = x\n",
-            "\n",
-            "This simplifies to:\n",
-            "\n",
-            "-7 = x\n",
-            "\n",
-            "So the solution to the equation 5 - x = 12 is x = -7.\n"
-          ]
-        }
-      ],
-      "source": [
-        "# Process query test\n",
-        "print(process_query(\"Solve the equation 5-x=12 for x?\"))"
-      ]
-    },
-    {
-      "cell_type": "code",
-      "execution_count": 39,
-      "metadata": {},
-      "outputs": [
-        {
-          "name": "stdout",
-          "output_type": "stream",
-          "text": [
-            "Route chosen: coding\n",
-            "\n",
-            "Here is the code:\n",
-            "\n",
-            "```py\n",
-            "my_list = []\n",
-            "for num in range(1, 11):\n",
-            "    my_list.append(num)\n",
-            "```\n",
-            "\n",
-            "This will create a list containing the numbers 1 to 10 inclusively with each number in its own cell.\n",
-            "\n",
-            "_Note: The range() function is used to generate a sequence of numbers. The range() function when passed only one argument (in this case, 11) will return the sequence of numbers starting from 0 and going up to, but not including, the number passed, which is 11 in this case. By passing 1 as the starting number (range(1, 11)), we get the numbers from 1 to 10._\n",
-            "\n",
-            "Now you have a list with numbers from 1 to 10 in it. Here are some ways to use it:\n",
-            "\n",
-            "```py\n",
-            "print(my_list[0])  # prints the first element which is 1\n",
-            "print(my_list[9])  # prints the last element which is 10\n",
-            "print(my_list)  # prints the whole list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]\n",
-            "```\n",
-            "\n",
-            "Let me know if you have further questions! 😊\n"
-          ]
-        }
-      ],
-      "source": [
-        "print(process_query(\"Write a for loop in python that appends numbers from 1-10 in a list\"))"
-      ]
-    }
-  ],
-  "metadata": {
-    "colab": {
-      "provenance": []
-    },
-    "kernelspec": {
-      "display_name": "decision-layer",
-      "language": "python",
-      "name": "python3"
-    },
-    "language_info": {
-      "codemirror_mode": {
-        "name": "ipython",
-        "version": 3
-      },
-      "file_extension": ".py",
-      "mimetype": "text/x-python",
-      "name": "python",
-      "nbconvert_exporter": "python",
-      "pygments_lexer": "ipython3",
-      "version": "3.10.11"
-    }
-  },
-  "nbformat": 4,
-  "nbformat_minor": 0
-}
diff --git a/hub/_sources/demos/demos/template/README_TEMPLATE.md.txt b/hub/_sources/demos/demos/template/README_TEMPLATE.md.txt
deleted file mode 100644
index da067c22ff..0000000000
--- a/hub/_sources/demos/demos/template/README_TEMPLATE.md.txt
+++ /dev/null
@@ -1,27 +0,0 @@
-# Project Title
-The section will contain the demo video. In order to embed your video in the README as well as our docs, you need to do the following:
-1. Drag the drop the video in the README. Doing that will generate a link for your video. Convert the link to a href by writing it in this format \[demo](<generated_link>). Checkout this [example](https://github.com/unifyai/demos/blob/main/Unify/LLM-Wars/README.md?plain=1#L2) incase you're not sure what to do.
-2. Add your video the [Video](https://github.com/unifyai/demos/tree/main/videos) folder with the name <project_name>.mp4. And add the following lines to your README:
-```
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/<project_name>.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-```
-Incase the above is confusing, checkout this [example](https://github.com/unifyai/demos/blob/main/Unify/LLM-Wars/README.md?plain=1#L4C1-L7C9)
-
-
-## Introduction
-Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.
-
-## Repository and Deployment
-Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.
-
-## Contributors
-List the contributors to the project in a table format. For example:
-
-| Name | GitHub Profile |
-|------|----------------|
-| John Doe | [johndoe](https://github.com/johndoe) |
-| Jane Doe | [janedoe](https://github.com/janedoe) |
-
diff --git a/hub/_sources/demos/langchain.rst.txt b/hub/_sources/demos/langchain.rst.txt
deleted file mode 100644
index ce52428ae9..0000000000
--- a/hub/_sources/demos/langchain.rst.txt
+++ /dev/null
@@ -1,17 +0,0 @@
-LangChain Examples
-==================
-
-.. grid:: 1 1 3 3
-    :gutter: 4
-
-    .. grid-item-card:: Langchain RAG Playground
-        :link: ./demos/LangChain/RAG_playground/README.md
-
-        Retrieval Augmented Generation with Langchain & Unify.
-
-.. toctree::
-    :hidden:
-    :maxdepth: -1
-    :caption: LangChain Examples
-     
-    ./demos/LangChain/RAG_playground/README.md
diff --git a/hub/_sources/demos/llamaindex.rst.txt b/hub/_sources/demos/llamaindex.rst.txt
deleted file mode 100644
index 33e75779d7..0000000000
--- a/hub/_sources/demos/llamaindex.rst.txt
+++ /dev/null
@@ -1,24 +0,0 @@
-LlamaIndex Examples
-==================
-
-.. grid:: 1 1 3 3
-    :gutter: 4
-
-    .. grid-item-card:: LlamaIndex Basic Usage
-        :link: ./demos/LlamaIndex/BasicUsage/unify.ipynb
-
-        Learn how to use the LlamaIndex-Unify Integration.
-
-    .. grid-item-card:: LlamaIndex RAG Playground
-        :link: ./demos/LlamaIndex/RAGPlayground/README.md
-
-        Retrieval Augmented Generation Playground built with LlamaIndex.
-
-
-.. toctree::
-    :hidden:
-    :maxdepth: -1
-    :caption: LlamaIndex Examples
-
-    ./demos/LlamaIndex/RAGPlayground/README.md
-    ./demos/LlamaIndex/BasicUsage/unify.ipynb
diff --git a/hub/_sources/demos/unify.rst.txt b/hub/_sources/demos/unify.rst.txt
deleted file mode 100644
index e8091172b4..0000000000
--- a/hub/_sources/demos/unify.rst.txt
+++ /dev/null
@@ -1,48 +0,0 @@
-Python Package Examples
-==================
-
-.. grid:: 1 1 3 3
-    :gutter: 4
-
-    .. grid-item-card:: Building a ChatBot
-        :link: ./demos/Unify/ChatBot/ChatBot.ipynb
-
-        An interactive chatbot application.
-
-    .. grid-item-card:: Synchronous vs Asynchronous Clients
-        :link: ./demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
-
-        Exploring Sync vs Async Clients: Usage and Differences.
-
-    .. grid-item-card:: LLM Wars
-        :link: ./demos/Unify/LLM-Wars/README.md
-
-        LLMs face off in a Streamlit app, asking each other tough questions.
-
-    .. grid-item-card:: Semantic Router
-        :link: ./demos/Unify/SemanticRouter/README.md
-
-        LLM Routing based on semantic similarity.
-
-    .. grid-item-card:: ChatBot Arena
-        :link: ./demos/Unify/Chatbot_Arena/README.md
-
-        Ask any question to two anonymous LLMs and vote for the better one!
-
-    .. grid-item-card:: LLM Debate App
-        :link: ./demos/Unify/LLM_Debate/README.md
-
-        Provide a topic and watch two LLMs debate on it.
-
-
-.. toctree::
-    :hidden:
-    :maxdepth: -1
-    :caption: Python Package Examples
-
-    ./demos/Unify/ChatBot/ChatBot.ipynb
-    ./demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
-    ./demos/Unify/LLM-Wars/README.md
-    ./demos/Unify/SemanticRouter/README.md
-    ./demos/Unify/Chatbot_Arena/README.md
-    ./demos/Unify/LLM_Debate/README.md
\ No newline at end of file
diff --git a/hub/_sources/index.rst.txt b/hub/_sources/index.rst.txt
index e9a33d8282..1ab0744ff6 100644
--- a/hub/_sources/index.rst.txt
+++ b/hub/_sources/index.rst.txt
@@ -12,11 +12,11 @@
 .. toctree::
   :hidden:
   :maxdepth: -1
-  :caption: API
+  :caption: Concepts
 
-  api/unify_api.rst
-  api/benchmarks.rst
-  api/router.rst
+  concepts/unify_api.rst
+  concepts/benchmarks.rst
+  concepts/router.rst
 
 ..  reference/images.rst
 
@@ -25,27 +25,18 @@
   :template: top_level_toc_recursive.rst
   :recursive:
   :hide-table:
-  :caption: Python Client Docs
+  :caption: API
 
   unify
 
-.. toctree::
-  :hidden:
-  :maxdepth: 4
-  :caption: Demos
-
-  demos/unify.rst
-  demos/langchain.rst
-  demos/llamaindex.rst
-
 .. toctree::
   :hidden:
   :maxdepth: -1
-  :caption: Interfaces
+  :caption: Console
 
-  interfaces/connecting_stack.rst
-  interfaces/running_benchmarks.rst
-  interfaces/building_router.rst
+  console/connecting_stack.rst
+  console/running_benchmarks.rst
+  console/building_router.rst
 
 ..
   .. toctree::
@@ -56,16 +47,6 @@
     tools/openapi.rst
     tools/python_library.rst
 
-.. toctree::
-  :hidden:
-  :maxdepth: -1
-  :caption: Concepts
-
-  concepts/endpoints.rst
-  concepts/benchmarks.rst
-  concepts/routing.rst
-..  concepts/on_prem_images.rst
-
 .. toctree::
   :hidden:
   :maxdepth: -1
@@ -73,5 +54,3 @@
 
   on_prem/on_prem_access
   on_prem/sso.rst
-
-
diff --git a/hub/_static/Chatbot_arena.mp4 b/hub/_static/Chatbot_arena.mp4
deleted file mode 100644
index 08143811af..0000000000
Binary files a/hub/_static/Chatbot_arena.mp4 and /dev/null differ
diff --git a/hub/_static/LLM-Debate.mp4 b/hub/_static/LLM-Debate.mp4
deleted file mode 100644
index deb57ac5ed..0000000000
Binary files a/hub/_static/LLM-Debate.mp4 and /dev/null differ
diff --git a/hub/_static/RAG_LLamaIndex.mp4 b/hub/_static/RAG_LLamaIndex.mp4
deleted file mode 100644
index 3ec638ea04..0000000000
Binary files a/hub/_static/RAG_LLamaIndex.mp4 and /dev/null differ
diff --git a/hub/_static/RAG_Playground.mp4 b/hub/_static/RAG_Playground.mp4
deleted file mode 100644
index 6e636839e3..0000000000
Binary files a/hub/_static/RAG_Playground.mp4 and /dev/null differ
diff --git a/hub/_static/llm-wars.mp4 b/hub/_static/llm-wars.mp4
deleted file mode 100644
index 839ab02305..0000000000
Binary files a/hub/_static/llm-wars.mp4 and /dev/null differ
diff --git a/hub/_static/semanticrouterapplication.mp4 b/hub/_static/semanticrouterapplication.mp4
deleted file mode 100644
index ff09d02e30..0000000000
Binary files a/hub/_static/semanticrouterapplication.mp4 and /dev/null differ
diff --git a/hub/api/benchmarks.html b/hub/api/benchmarks.html
deleted file mode 100644
index adaee5e98c..0000000000
--- a/hub/api/benchmarks.html
+++ /dev/null
@@ -1,655 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Benchmarking &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/benchmarks';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Routing" href="router.html" />
-    <link rel="prev" title="Universal API" href="unify_api.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Benchmarking</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="benchmarking">
-<h1>Benchmarking<a class="headerlink" href="#benchmarking" title="Link to this heading">#</a></h1>
-<p>When comparing LLMs, there is a constant tradeoff to make between quality, cost and latency. Stronger models are (in general) slower and more expensive - and sometimes overkill for the task at hand. Complicating matters further, new models are released weekly, each claiming to be state-of-the-art.</p>
-<p>Benchmarking on your data lets you see how each of the different models perform on your task.</p>
-<a class="reference internal image-reference" href="../_images/benchmarks.png"><img alt="Benchmarks Image." class="align-center" src="../_images/benchmarks.png" style="width: 800px;" /></a>
-<p>You can compare how quality relates to cost and latency, with live stats pulled from our <a class="reference external" href="https://unify.ai/benchmarks">runtime benchmarks</a>.</p>
-<p>When new models come out, simply re-run the benchmark to see how they perform on your task.</p>
-<section id="preparing-your-dataset">
-<h2>Preparing your dataset<a class="headerlink" href="#preparing-your-dataset" title="Link to this heading">#</a></h2>
-<p>First create a dataset which is representative of the task you want to evaluate.
-You will need a list of prompts, optionally including a reference, <em>gold-standard</em> answer. Datasets containing reference answers tend to get more accurate benchmarks.</p>
-<p>The file itself should be in JSONL format, with one entry per line, as in the example below.</p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="p">{</span><span class="s2">&quot;prompt&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the first prompt&quot;</span><span class="p">,</span> <span class="s2">&quot;ref_answer&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the first reference answer&quot;</span><span class="p">}</span>
-<span class="p">{</span><span class="s2">&quot;prompt&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the second prompt&quot;</span><span class="p">,</span> <span class="s2">&quot;ref_answer&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the second reference answer&quot;</span><span class="p">}</span>
-</pre></div>
-</div>
-<p>Use at least 50 prompts to get the most accurate results. Currently there is an maximum limit of 500 prompts, for most tasks we don’t tend to see much extra detail past ~250.</p>
-</section>
-<section id="benchmarking-your-dataset">
-<h2>Benchmarking your dataset<a class="headerlink" href="#benchmarking-your-dataset" title="Link to this heading">#</a></h2>
-<p>In <a class="reference external" href="https://console.unify.ai/dashboard">your dashboard</a>, clicking <code class="code docutils literal notranslate"><span class="pre">Select</span> <span class="pre">benchmark</span></code> and then <code class="code docutils literal notranslate"><span class="pre">Benchmark</span> <span class="pre">your</span> <span class="pre">prompts</span></code> opens the interface to upload a dataset.</p>
-<p>When the benchmark finishes, you’ll receive an email, and the graph will be displayed in your <a class="reference external" href="https://console.unify.ai/dashboard">dashboard</a>.</p>
-<p>The x-axis can be set to represent <code class="code docutils literal notranslate"><span class="pre">cost</span></code>, <code class="code docutils literal notranslate"><span class="pre">time-to-first-token</span></code>, or <code class="code docutils literal notranslate"><span class="pre">inter-token</span> <span class="pre">latency</span></code>, and on either a linear or log scale.</p>
-<section id="how-does-it-work">
-<h3>How does it work?<a class="headerlink" href="#how-does-it-work" title="Link to this heading">#</a></h3>
-<p>Currently, we use gpt4o-as-a-judge (cf. <a class="reference external" href="https://arxiv.org/abs/2306.05685">https://arxiv.org/abs/2306.05685</a>), to evaluate the quality of each model’s responses.</p>
-</section>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="unify_api.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Universal API</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="router.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Routing</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#preparing-your-dataset">Preparing your dataset</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#benchmarking-your-dataset">Benchmarking your dataset</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#how-does-it-work">How does it work?</a></li>
-</ul>
-</li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/concepts/benchmarks.html b/hub/concepts/benchmarks.html
index 4903924a11..b8ddd0b9b0 100644
--- a/hub/concepts/benchmarks.html
+++ b/hub/concepts/benchmarks.html
@@ -8,7 +8,7 @@
     <meta charset="utf-8" />
     <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
 
-    <title>Benchmarks &#8212; Unify Documentation</title>
+    <title>Benchmarking &#8212; Unify Documentation</title>
   
   
   
@@ -62,8 +62,8 @@
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Routing" href="routing.html" />
-    <link rel="prev" title="Model Endpoints" href="endpoints.html" />
+    <link rel="next" title="Routing" href="router.html" />
+    <link rel="prev" title="Universal API" href="unify_api.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                    <li class="nav-item current active">
+                      <a class="nav-link nav-internal" href="#">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<ul class="current nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -381,7 +309,7 @@
         <i class="fa-solid fa-home"></i>
       </a>
     </li>
-    <li class="breadcrumb-item active" aria-current="page">Benchmarks</li>
+    <li class="breadcrumb-item active" aria-current="page">Benchmarking</li>
   </ul>
 </nav>
 </div>
@@ -398,122 +326,33 @@
 <div id="searchbox"></div>
                 <article class="bd-article">
                   
-  <section id="benchmarks">
-<h1>Benchmarks<a class="headerlink" href="#benchmarks" title="Link to this heading">#</a></h1>
-<p>In this section, we explain our process for benchmarking LLM endpoints. We discuss quality and runtime benchmarks separately.</p>
-<section id="quality-benchmarks">
-<h2>Quality Benchmarks<a class="headerlink" href="#quality-benchmarks" title="Link to this heading">#</a></h2>
-<p>Finding the best LLM(s) for a given application can be challenging. The performance of a model can vary significantly depending on the task, dataset, and evaluation metrics used. Existing benchmarks attempt to compare models based on standardized approaches, but biases inevitably creep in as models learn to do well on these targeted assessments.</p>
-<p>Practically, the LLM community still heavily relies on testing models manually to build an intuition around their expected behavior for a given use-case. While this generally works better, hand-crafted testing isn’t sustainable as one’s needs evolve and new LLMs emerge at a rapid pace.
-Our LLM assessment pipeline is based on the method outlined below.</p>
-<section id="design-principles">
-<h3>Design Principles<a class="headerlink" href="#design-principles" title="Link to this heading">#</a></h3>
-<p>Our quality benchmarks are based on a set of guiding principles. Specifically, we strive to make our pipeline:</p>
-<ul class="simple">
-<li><p><strong>Systematized:</strong> A rigorous benchmarking pipeline should be standardized across assessments, repeatable, and scalable. We make sure to benchmark all LLMs identically to with a well-defined approach we outline in the next passage.</p></li>
-<li><p><strong>Task-centric:</strong> Models perform differently on various tasks. Some might do better at coding, others are well suited for summarizing content, etc. These broad task categories can also be refined into specific subtasks. For e.g summarizing technical content to generate product documentation is radically different from summarizing news. This should be reflected in assessments. For this reason, we allow you to upload your custom prompt dataset, that you believe reflects the intended task, to use as a reference for running benchmarks.</p></li>
-<li><p><strong>Customizable:</strong> Assessments should reflect the unique needs of the assessor. Depending on your application requirements, you may need to strictly include / exclude some models from the benchmarks. We try to strike a balance between standardization and modularity such that you can run the benchmarks that are relevant to your needs.</p></li>
-</ul>
-</section>
-<section id="methodology">
-<h3>Methodology<a class="headerlink" href="#methodology" title="Link to this heading">#</a></h3>
-<section id="overview">
-<h4>Overview<a class="headerlink" href="#overview" title="Link to this heading">#</a></h4>
-<p>We benchmark models using the LLM-as-a-judge approach. This relies on using a powerful language model to generate assessments on the outputs of other models, using a standard reviewing procedure. LLM-as-a-judge is sometimes used to run experiments at scale when generating human assessments isn’t an option or to avoid introducing human biases.</p>
-<p>Given a dataset of user prompts, each prompt is sent to all endpoints to generate an output. Then, we ask GPT-4 to review each output and give a final assessment based on how helpful and accurate the response is relative to either (a) the user prompt, in the case of unlabelled datasets, or (b) the prompt and the reference answer, in the case of labelled datasets.</p>
-</section>
-<section id="scoring">
-<h4>Scoring<a class="headerlink" href="#scoring" title="Link to this heading">#</a></h4>
-<p>The assessor LLM reviews the output of an endpoint which it categorizes as <code class="code docutils literal notranslate"><span class="pre">irrelevant</span></code>, <code class="code docutils literal notranslate"><span class="pre">bad</span></code>, <code class="code docutils literal notranslate"><span class="pre">satisfactory</span></code>, <code class="code docutils literal notranslate"><span class="pre">very</span> <span class="pre">good</span></code>, or <code class="code docutils literal notranslate"><span class="pre">excellent</span></code>. Each of these labels is then mapped to a numeric score ranging from 0.0 to 1.0. We repeat the same proces for all prompts in the dataset to get the endpoint’s performance score on each prompt. The overall endpoint’s score is then the average of these prompt-specific scores.</p>
-</section>
-<section id="visualizing-results">
-<h4>Visualizing Results<a class="headerlink" href="#visualizing-results" title="Link to this heading">#</a></h4>
-<p>In addition to the list of model scores, we also compute runtime performance for the endpoint (as explained in the section below). Doing so allows us to plot the quality performance versus runtime to assess the quality-to-performance of the endpoints, instead of relying on the quality scores alone.</p>
-<a class="reference internal image-reference" href="../_images/console_dashboard.png"><img alt="Console Dashboard." class="align-center" src="../_images/console_dashboard.png" style="width: 650px;" /></a>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>Because quality scores are model-specific, they are the same across the different endpoints exposed for a given model. As a result, all the endpoints for a model will plot horizontally at the same quality level, with only the runtime metric setting them apart.</p>
+  <section id="benchmarking">
+<h1>Benchmarking<a class="headerlink" href="#benchmarking" title="Link to this heading">#</a></h1>
+<p>When comparing LLMs, there is a constant tradeoff to make between quality, cost and latency. Stronger models are (in general) slower and more expensive - and sometimes overkill for the task at hand. Complicating matters further, new models are released weekly, each claiming to be state-of-the-art.</p>
+<p>Benchmarking on your data lets you see how each of the different models perform on your task.</p>
+<a class="reference internal image-reference" href="../_images/benchmarks.png"><img alt="Benchmarks Image." class="align-center" src="../_images/benchmarks.png" style="width: 800px;" /></a>
+<p>You can compare how quality relates to cost and latency, with live stats pulled from our <a class="reference external" href="https://unify.ai/benchmarks">runtime benchmarks</a>.</p>
+<p>When new models come out, simply re-run the benchmark to see how they perform on your task.</p>
+<section id="preparing-your-dataset">
+<h2>Preparing your dataset<a class="headerlink" href="#preparing-your-dataset" title="Link to this heading">#</a></h2>
+<p>First create a dataset which is representative of the task you want to evaluate.
+You will need a list of prompts, optionally including a reference, <em>gold-standard</em> answer. Datasets containing reference answers tend to get more accurate benchmarks.</p>
+<p>The file itself should be in JSONL format, with one entry per line, as in the example below.</p>
+<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="p">{</span><span class="s2">&quot;prompt&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the first prompt&quot;</span><span class="p">,</span> <span class="s2">&quot;ref_answer&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the first reference answer&quot;</span><span class="p">}</span>
+<span class="p">{</span><span class="s2">&quot;prompt&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the second prompt&quot;</span><span class="p">,</span> <span class="s2">&quot;ref_answer&quot;</span><span class="p">:</span> <span class="s2">&quot;This is the second reference answer&quot;</span><span class="p">}</span>
+</pre></div>
 </div>
+<p>Use at least 50 prompts to get the most accurate results. Currently there is an maximum limit of 500 prompts, for most tasks we don’t tend to see much extra detail past ~250.</p>
 </section>
+<section id="benchmarking-your-dataset">
+<h2>Benchmarking your dataset<a class="headerlink" href="#benchmarking-your-dataset" title="Link to this heading">#</a></h2>
+<p>In <a class="reference external" href="https://console.unify.ai/dashboard">your dashboard</a>, clicking <code class="code docutils literal notranslate"><span class="pre">Select</span> <span class="pre">benchmark</span></code> and then <code class="code docutils literal notranslate"><span class="pre">Benchmark</span> <span class="pre">your</span> <span class="pre">prompts</span></code> opens the interface to upload a dataset.</p>
+<p>When the benchmark finishes, you’ll receive an email, and the graph will be displayed in your <a class="reference external" href="https://console.unify.ai/dashboard">dashboard</a>.</p>
+<p>The x-axis can be set to represent <code class="code docutils literal notranslate"><span class="pre">cost</span></code>, <code class="code docutils literal notranslate"><span class="pre">time-to-first-token</span></code>, or <code class="code docutils literal notranslate"><span class="pre">inter-token</span> <span class="pre">latency</span></code>, and on either a linear or log scale.</p>
+<section id="how-does-it-work">
+<h3>How does it work?<a class="headerlink" href="#how-does-it-work" title="Link to this heading">#</a></h3>
+<p>Currently, we use gpt4o-as-a-judge (cf. <a class="reference external" href="https://arxiv.org/abs/2306.05685">https://arxiv.org/abs/2306.05685</a>), to evaluate the quality of each model’s responses.</p>
 </section>
-<section id="considerations-and-limitations">
-<h3>Considerations and Limitations<a class="headerlink" href="#considerations-and-limitations" title="Link to this heading">#</a></h3>
-<p>Despite having a well-defined benchmarking approach, it also inevitably comes with its own issues. Using an LLM to judge outputs may introduce a different kind of bias through the data used to train the assessor model. We are currently looking at ways to mitigate this with more diversified and / or customized judge LLM selection.</p>
-</section>
-</section>
-<section id="runtime-benchmarks">
-<h2>Runtime Benchmarks<a class="headerlink" href="#runtime-benchmarks" title="Link to this heading">#</a></h2>
-<p>Finding the best model(s) for a task is just the first step to optimize LLM pipelines. Given the plethora of endpoint providers offering the same models, true optimization requires considering performance discrepancies across endpoints and time.</p>
-<p>Because this is a complex decision, it needs to be made based on data. For this data to be reliable, it should also result from transparent and objective measurements, which we outline in this below.</p>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>Our benchmarking code is openly available in <a class="reference external" href="https://github.com/unifyai/aibench-llm-endpoints">this repository</a>.</p>
-</div>
-<section id="id1">
-<h3>Design Principles<a class="headerlink" href="#id1" title="Link to this heading">#</a></h3>
-<p>Our runtime benchmarks are based on a set of guiding principles. Specifically, we believe benchmarks should be:</p>
-<ul class="simple">
-<li><p><strong>Community-driven:</strong> We invite everyone to audit or improve the logic and the code. We are building these benchmarks for the community, so contributions and discussions around them are more than welcome!</p></li>
-<li><p><strong>User-centric:</strong> External factors (e.g. how different providers set up their infrastructure) may impact measurements. Nevertheless, our benchmarks are not designed to gauge performance in controlled environments. Rather, we aime to measure performance as experienced by the end-user who, ultimately, is subject to the same distortions.</p></li>
-<li><p><strong>Model and Provider-agnostic:</strong> While some metrics are more relevant to certain scenarios (e.g. cold start time in model endpoints that scale to zero), we try to make as few assumptions as possible on the providers or technologies being benchmarked. We only assume that endpoints take a string as the input and return a streaming response.</p></li>
-</ul>
-</section>
-<section id="id2">
-<h3>Methodology<a class="headerlink" href="#id2" title="Link to this heading">#</a></h3>
-<section id="tokenizer">
-<h4>Tokenizer<a class="headerlink" href="#tokenizer" title="Link to this heading">#</a></h4>
-<p>To avoid biases towards any model-specific tokenizer, we calculate all metrics using the same tokenizer across different models. We have chosen the <cite>cl100k_base</cite> tokenizer from OpenAI’s <a class="reference external" href="https://github.com/openai/tiktoken">tiktoken</a> library for this since it’s MIT licensed and already widely adopted by the community.</p>
-</section>
-<section id="inputs-and-outputs">
-<h4>Inputs and Outputs<a class="headerlink" href="#inputs-and-outputs" title="Link to this heading">#</a></h4>
-<p>To fairly assess optimizations such as speculative decoding, we use real text as the input and avoid using randomly generated data. The length of the input affects prefill time and therefore can affect the responsiveness of the system. To account for this, we run the benchmark with two input regimes.</p>
-<ul class="simple">
-<li><p>Short inputs: Using sentences with an average length of 200 tokens and a standard deviation of 20.</p></li>
-<li><p>Long inputs: Using sentences with an average length of 1000 tokens and a standard deviation of 100.</p></li>
-</ul>
-<p>To build these clusters, we programmatically select sentences from <a class="reference external" href="https://huggingface.co/datasets/bookcorpus">BookCorpus</a> and create two subsets of it. For instruct/chat models to answer appropriately and ensure a long enough response, we preface each prompt with <code class="code docutils literal notranslate"><span class="pre">Repeat</span> <span class="pre">the</span> <span class="pre">following</span> <span class="pre">lines</span> <span class="pre">&lt;#&gt;</span> <span class="pre">times</span> <span class="pre">without</span> <span class="pre">generating</span> <span class="pre">the</span> <span class="pre">EOS</span> <span class="pre">token</span> <span class="pre">earlier</span> <span class="pre">than</span> <span class="pre">that</span></code>, where <code class="code docutils literal notranslate"><span class="pre">&lt;#&gt;</span></code> is randomly sampled.</p>
-<p>For the outputs, we use randomized discrete values from the same distributions (i.e. N(200, 20) for short inputs and N(1000, 100) for long ones) to cap the number of tokens in the output. This ensures variable output length, which is necessary to consider algorithms such as Paged Attention or Dynamic Batching.</p>
-<p>When running one benchmark across different endpoints, we seed each runner with the same initial value, so that the inputs are the same for all endpoints.</p>
-</section>
-<section id="computation">
-<h4>Computation<a class="headerlink" href="#computation" title="Link to this heading">#</a></h4>
-<p>To execute the benchmarks, we run three processes periodically from three different regions: <strong>Hong Kong, Belgium and Iowa</strong>. Each one of these processes is triggered every three hours and benchmarks every available endpoint.</p>
-<p>Accounting for the different input policies, we run a total of 4 benchmarks for each endpoint every time a region benchmark is triggered.</p>
-</section>
-<section id="metrics">
-<h4>Metrics<a class="headerlink" href="#metrics" title="Link to this heading">#</a></h4>
-<p>Several key metrics are captured and calculated during the benchmarking process:</p>
-<ul class="simple">
-<li><p><strong>Time to First Token (TTFT):</strong> Time between request initiation and the arrival of the first streaming response packet. TTFT directly reflects the prompt processing speed, offering insights into the efficiency of the model’s initial response. A lower TTFT signifies quicker engagement, which is crucial for applications that require dynamic interactions or real-time feedback.</p></li>
-<li><p><strong>End to End Latency:</strong> Time between request initiation and the arrival of the final packet in the streaming response. This metric provides a holistic view of the response time, including processing and transmission.</p></li>
-<li><p><strong>Inter Token Latency (ITL):</strong> Average time between consecutive tokens in the response. We compute this as <code class="code docutils literal notranslate"><span class="pre">(End</span> <span class="pre">to</span> <span class="pre">End</span> <span class="pre">Latency)</span> <span class="pre">/</span> <span class="pre">(Output</span> <span class="pre">Tokens</span> <span class="pre">-</span> <span class="pre">1)</span></code>.  ITL provides valuable information about the pacing of token generation and the overall temporal dynamics within the model’s output. As expected, a lower ITL signifies a more cohesive and fluid generation of tokens, which contributes to a more seamless and human-like interaction with the model.</p></li>
-<li><p><strong>Number of Output Tokens per Second:</strong> Relation between the number of tokens generated and the time taken. We don’t consider the TTFT here, so this is equivalent to <code class="code docutils literal notranslate"><span class="pre">1</span> <span class="pre">/</span> <span class="pre">ITL</span></code>. In this case, a higher Number of Output Tokens per Second means a faster and more productive model output. It’s important to note that this is <strong>not</strong> a measurement of the throughput of the inference server since it doesn’t account for batched inputs.</p></li>
-<li><p><strong>Cold Start:</strong> Time taken for a server to boot up in environments where the number of active instances can get to zero. We consider a threshold of 15 seconds. What this means is that we do an initial “dumb” request to the endpoint and record its TTFT. If this TTFT is greater than 15 seconds, we measure the time it takes to get the second token. If the ratio between the TTFT and first ITL measurements is at least 10:1, we consider the TTFT to be Cold Start time. Once this process has finished. We start the benchmark process in the warmed-up instance. This metric reflects the time it takes for the system to be ready for processing requests, rendering it essential for users relying on prompt and consistent model responses, allowing you to account for any potential initialization delays in the responses and ensuring a more accurate expectation of the model’s responsiveness.</p></li>
-<li><p><strong>Cost</strong>: Last but not least, we present information about the cost of querying the model. This is usually different for the input tokens and the response tokens, so it can be beneficial to choose different models depending on the end task. As an example, to summarize a document, a provider with lower price in the input tokens would be better, even if it comes with a slightly higher price in the output. On the other hand, if you want to generate long-format content, a provider with a lower price per generated token will be the most appropriate option.</p></li>
-</ul>
-</section>
-<section id="data-presentation">
-<h4>Data Presentation<a class="headerlink" href="#data-presentation" title="Link to this heading">#</a></h4>
-<p>When aggregating metrics, particularly in benchmark regimes with multiple concurrent requests, we calculate and present the P90 (90th percentile) value from the set of measurements. We choose the P90 to reduce the influence of extreme values and provide a reliable snapshot of the model’s performance.</p>
-<p>When applicable, aggregated data is shown both in the plots and the benchmark tables.</p>
-<a class="reference internal image-reference" href="../_images/benchmarks_model_page.png"><img alt="Benchmarks Model Page." class="align-center" src="../_images/benchmarks_model_page.png" style="width: 650px;" /></a>
-<p>Additionally, we also include a MA5 view (Moving Average of the last 5 measurements) in the graphs. This smoothing technique helps mitigate short-term fluctuations and should provide a clearer trend representation over time.</p>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>In some cases, you will find <code class="code docutils literal notranslate"><span class="pre">Not</span> <span class="pre">computed</span></code> instead of a value, or even a <code class="code docutils literal notranslate"><span class="pre">No</span> <span class="pre">metrics</span> <span class="pre">are</span> <span class="pre">available</span> <span class="pre">yet</span></code> message instead of the benchmark data. This is typically due to an internal issue or a rate limit, which we’ll be quickly fixing.</p>
-</div>
-</section>
-</section>
-<section id="id3">
-<h3>Considerations and Limitations<a class="headerlink" href="#id3" title="Link to this heading">#</a></h3>
-<p>We try to tackle some of the more significant limitations of benchmarking inference endpoints. For example, network latency, by running the benchmarks in different regions; or unreliable point-measurements, by continuously benchmarking the endpoints and plotting their trends over time.</p>
-<p>However, there are still some relevant considerations to have in mind. Our methodology at the moment is solely focused on performance, which means that we don’t look at the output of the models.</p>
-<p>Nonetheless, even accounting for the public-facing nature of these endpoints (no gibberish allowed!), there might be some implementation differences that affect the output quality, such as quantization/compression of the models, different context window sizes, or different speculative decoding models, among others. We are working towards mitigating this as well, so stay tuned!</p>
-</section>
-</section>
-<section id="round-up">
-<h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">#</a></h2>
-<p>You are now familiar with how we run our benchmarks. Next, you can explore how to <a class="reference external" href="https://unify.ai/docs/interfaces/running_benchmarks.html">use the benchmarks, or run your own</a> through the benchmarks interface!</p>
 </section>
 </section>
 
@@ -528,16 +367,16 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
                   
 <div class="prev-next-area">
     <a class="left-prev"
-       href="endpoints.html"
+       href="unify_api.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
         <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Model Endpoints</p>
+        <p class="prev-next-title">Universal API</p>
       </div>
     </a>
     <a class="right-next"
-       href="routing.html"
+       href="router.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
@@ -563,31 +402,11 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
   </div>
   <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
     <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quality-benchmarks">Quality Benchmarks</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#design-principles">Design Principles</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#methodology">Methodology</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#overview">Overview</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#scoring">Scoring</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#visualizing-results">Visualizing Results</a></li>
+<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#preparing-your-dataset">Preparing your dataset</a></li>
+<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#benchmarking-your-dataset">Benchmarking your dataset</a><ul class="nav section-nav flex-column">
+<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#how-does-it-work">How does it work?</a></li>
 </ul>
 </li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#considerations-and-limitations">Considerations and Limitations</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#runtime-benchmarks">Runtime Benchmarks</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id1">Design Principles</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id2">Methodology</a><ul class="nav section-nav flex-column">
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#tokenizer">Tokenizer</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#inputs-and-outputs">Inputs and Outputs</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#computation">Computation</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#metrics">Metrics</a></li>
-<li class="toc-h4 nav-item toc-entry"><a class="reference internal nav-link" href="#data-presentation">Data Presentation</a></li>
-</ul>
-</li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#id3">Considerations and Limitations</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#round-up">Round Up</a></li>
 </ul>
   </nav></div>
 
@@ -646,13 +465,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<ul class="current nav bd-sidenav">
+<li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
+<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -660,41 +479,11 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/api/deploy_router.html b/hub/concepts/deploy_router.html
similarity index 79%
rename from hub/api/deploy_router.html
rename to hub/concepts/deploy_router.html
index 9abb32053f..febf98d823 100644
--- a/hub/api/deploy_router.html
+++ b/hub/concepts/deploy_router.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/deploy_router';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/deploy_router';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -586,13 +514,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -600,41 +528,11 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/concepts/endpoints.html b/hub/concepts/endpoints.html
deleted file mode 100644
index eb774913fb..0000000000
--- a/hub/concepts/endpoints.html
+++ /dev/null
@@ -1,647 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Model Endpoints &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/endpoints';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Benchmarks" href="benchmarks.html" />
-    <link rel="prev" title="Building a custom router" href="../interfaces/building_router.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Model Endpoints</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="model-endpoints">
-<h1>Model Endpoints<a class="headerlink" href="#model-endpoints" title="Link to this heading">#</a></h1>
-<p>Unify lets you query model endpoints across providers. In this section, we explain what an endpoint is and how it relates to the concepts of models and providers.</p>
-<section id="what-is-a-model-endpoint">
-<h2>What is a Model Endpoint?<a class="headerlink" href="#what-is-a-model-endpoint" title="Link to this heading">#</a></h2>
-<p>A model endpoint is a model that you can interact with through an API, usually hosted by a provider. Model endpoints, particularly LLM endpoints, play a critical role when building and deploying AI applications at scale.</p>
-<p>A model can be offered by different providers through one or multiple endpoints. There’s loads of ways to categorize providers, and the boundaries can sometimes be blurry as services overlap; but you can think of a provider as an end-to-end deployment stack that comes with unique sets of features, performance, pricing, and so on. While positive, this diversity also makes it difficult to find the most suitable endpoint for a specific use case.</p>
-<div class="admonition note">
-<p class="admonition-title">Note</p>
-<p>Check out our blog post on <a class="reference external" href="https://unify.ai/blog/cloud-model-serving">cloud serving</a> if you’d like to learn more about providers.</p>
-</div>
-<p>Unify exposes a common HTTP endpoint for all providers, allowing you to query any of them using a <strong>consistent request format, and the same API key</strong>. This lets you use the same model across multiple endpoints, and optimize the performance metrics you care about.</p>
-</section>
-<section id="available-endpoints">
-<h2>Available Endpoints<a class="headerlink" href="#available-endpoints" title="Link to this heading">#</a></h2>
-<p>We strive to integrate the latest LLMs into our platform, across as many providers exposing endpoints for said models.</p>
-<p>You can explore our list of supported models through the <a class="reference external" href="https://unify.ai/hub">benchmarks interface</a> where you can simply search for a model you are interested in to visualise benchmarks and all sorts of relevant information on available endpoints for the model.</p>
-</section>
-<section id="round-up">
-<h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">#</a></h2>
-<p>You are now familiar with the concept of endpoint and the various types of endpoints we expose. In the next section, we’ll dive into the <strong>Benchmarks</strong> and how they can help you find the best endpoint for your needs!</p>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../interfaces/building_router.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Building a custom router</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="benchmarks.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Benchmarks</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#what-is-a-model-endpoint">What is a Model Endpoint?</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#available-endpoints">Available Endpoints</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#round-up">Round Up</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/api/first_request.html b/hub/concepts/first_request.html
similarity index 82%
rename from hub/api/first_request.html
rename to hub/concepts/first_request.html
index ccc013e958..ae97cbba3d 100644
--- a/hub/api/first_request.html
+++ b/hub/concepts/first_request.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/first_request';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/first_request';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -650,13 +578,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -664,41 +592,11 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/api/images.html b/hub/concepts/images.html
similarity index 70%
rename from hub/api/images.html
rename to hub/concepts/images.html
index 28c648e8b3..b0aef378bd 100644
--- a/hub/api/images.html
+++ b/hub/concepts/images.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/images';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/images';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -475,13 +403,13 @@ <h1>On-Prem Images<a class="headerlink" href="#on-prem-images" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -489,41 +417,11 @@ <h1>On-Prem Images<a class="headerlink" href="#on-prem-images" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/concepts/on_prem_images.html b/hub/concepts/on_prem_images.html
deleted file mode 100644
index 1fa367607e..0000000000
--- a/hub/concepts/on_prem_images.html
+++ /dev/null
@@ -1,593 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>On-Prem Images &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/on_prem_images';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">On-Prem Images</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="on-prem-images">
-<h1>On-Prem Images<a class="headerlink" href="#on-prem-images" title="Link to this heading">#</a></h1>
-<p>Lorem ipsum</p>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/api/reference.html b/hub/concepts/reference.html
similarity index 78%
rename from hub/api/reference.html
rename to hub/concepts/reference.html
index e1c4c55e4f..82239753fb 100644
--- a/hub/api/reference.html
+++ b/hub/concepts/reference.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/reference';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/reference';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -626,13 +554,13 @@ <h2>POST /chat/completions<a class="headerlink" href="#post-chat-completions" ti
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -640,41 +568,11 @@ <h2>POST /chat/completions<a class="headerlink" href="#post-chat-completions" ti
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/api/router.html b/hub/concepts/router.html
similarity index 76%
rename from hub/api/router.html
rename to hub/concepts/router.html
index 91e17269af..ff44e401ab 100644
--- a/hub/api/router.html
+++ b/hub/concepts/router.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/router';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/router';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -571,13 +499,13 @@ <h3>Training a router (beta)<a class="headerlink" href="#training-a-router-beta"
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify_api.html">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -585,41 +513,11 @@ <h3>Training a router (beta)<a class="headerlink" href="#training-a-router-beta"
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/concepts/routing.html b/hub/concepts/routing.html
deleted file mode 100644
index df09d9db59..0000000000
--- a/hub/concepts/routing.html
+++ /dev/null
@@ -1,657 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Routing &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/routing';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="On-Prem access" href="../on_prem/on_prem_access.html" />
-    <link rel="prev" title="Benchmarks" href="benchmarks.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Routing</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="routing">
-<h1>Routing<a class="headerlink" href="#routing" title="Link to this heading">#</a></h1>
-<p>In this section, you will learn what LLM routing is and how it works.</p>
-<section id="what-is-routing">
-<h2>What is routing?<a class="headerlink" href="#what-is-routing" title="Link to this heading">#</a></h2>
-<p>In the <a class="reference external" href="https://unify.ai/docs/concepts/benchmarks.html">benchmarks section</a>, we discussed how different models perform better at different tasks, and how appropriate performance benchmarks can help steer and inform model selection for a given use-case.</p>
-<p>Given the diversity of prompts you can send to an LLM, it can quickly become tedious to manually swap between models for every single prompt, even when they pertain to the same broad category of tasks.</p>
-<p>Motivated by this, LLM routing aims to make optimal model selection automatic. With a router, each prompt is assessed individually and sent to the best model, without having to tweak the LLM pipeline.
-With routing, you can focus on prompting and ensure that the best model is always on the receiving end!</p>
-</section>
-<section id="quality-routing">
-<h2>Quality routing<a class="headerlink" href="#quality-routing" title="Link to this heading">#</a></h2>
-<p>By routing to the best LLM on every prompt, the objective is to consistently achieve better outputs than using a single, all-purpose, powerful mode, at a fraction of the cost. The idea is that smaller models can be leveraged for some simpler tasks, only using larger models to handle complex queries.</p>
-<p>Using several datasets to benchmark the router (star-shaped datapoints) reveals that it can perform better than individual endpoints on average, without compromising on other metrics like runtime performance for e.g, as illustrated below.</p>
-<a class="reference internal image-reference" href="../_images/console_dashboard.png"><img alt="Console Dashboard." class="align-center" src="../_images/console_dashboard.png" style="width: 650px;" /></a>
-<p>You may notice that there are more than one star-shaped datapoints on the plot. This is because the <em>Router</em> can actually take all sorts of configurations, depending on the specified constraints in terms which endpoints can be routed to, the minimum acceptable performance level for a given metric, etc. As a result, a virtually infinite number of routers can be constructed by changing these parameters, allowing you to customize the routing depending on your requirements!</p>
-</section>
-<section id="runtime-routing">
-<h2>Runtime routing<a class="headerlink" href="#runtime-routing" title="Link to this heading">#</a></h2>
-<p>When querying endpoints, other metrics beyond quality can be critical depending on the use-case. For e.g, cost may be important when prototyping an application, latency when building a bot where responsiveness is key, or output tokens per second if we want to generate responses as fast as possible.</p>
-<p>However, endpoint providers are inherently transient (You can read more about this <a class="reference external" href="https://unify.ai/blog/llm-benchmarks#transient-systems">here</a>), which means they are affected by factors like traffic, available devices, changes in the software or hardware stack, and so on.</p>
-<p>Ultimately, this results in a landscape where it’s usually not possible to conclude that one provider is <em>the best</em>. Let’s take a look at this graph from our benchmarks.</p>
-<a class="reference internal image-reference" href="../_images/mixtral-providers.png"><img alt="Mixtral providers." class="align-center" src="../_images/mixtral-providers.png" style="width: 650px;" /></a>
-<p>In this image we can see the <code class="code docutils literal notranslate"><span class="pre">output</span> <span class="pre">tokens</span> <span class="pre">per</span> <span class="pre">second</span></code> of different providers hosting a <code class="code docutils literal notranslate"><span class="pre">Mixtral-8x7b</span></code> public endpoint. We can see how depending on the time of the day, the <em>best</em> provider changes.</p>
-<p>With runtime routing, your requests are automatically redirected to the provider outperforming the other services at that very moment. This ensures the best possible value for a given metric across endpoints.</p>
-<a class="reference internal image-reference" href="../_images/mixtral-router.png"><img alt="Mixtral performance routing." class="align-center" src="../_images/mixtral-router.png" style="width: 650px;" /></a>
-</section>
-<section id="round-up">
-<h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">#</a></h2>
-<p>You are now familiar with routing. Next, you can <a class="reference external" href="https://unify.ai/docs/api/deploy_router.html">learn to use the router</a>, or <a class="reference external" href="https://unify.ai/docs/interfaces/building_router.html">build your custom router</a>.</p>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="benchmarks.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Benchmarks</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../on_prem/on_prem_access.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">On-Prem access</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#what-is-routing">What is routing?</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quality-routing">Quality routing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#runtime-routing">Runtime routing</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#round-up">Round Up</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1 current active"><a class="current reference internal" href="#">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/api/unify_api.html b/hub/concepts/unify_api.html
similarity index 82%
rename from hub/api/unify_api.html
rename to hub/concepts/unify_api.html
index 53d0af3380..86d14e7ddb 100644
--- a/hub/api/unify_api.html
+++ b/hub/concepts/unify_api.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'api/unify_api';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'concepts/unify_api';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -667,13 +595,13 @@ <h3>LLM Fallbacks<a class="headerlink" href="#llm-fallbacks" title="Link to this
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Universal API</a></li>
 <li class="toctree-l1"><a class="reference internal" href="benchmarks.html">Benchmarking</a></li>
 <li class="toctree-l1"><a class="reference internal" href="router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -681,41 +609,11 @@ <h3>LLM Fallbacks<a class="headerlink" href="#llm-fallbacks" title="Link to this
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/interfaces/building_router.html b/hub/console/building_router.html
similarity index 80%
rename from hub/interfaces/building_router.html
rename to hub/console/building_router.html
index 235c10b3fb..51bf9c5e4e 100644
--- a/hub/interfaces/building_router.html
+++ b/hub/console/building_router.html
@@ -58,11 +58,11 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'interfaces/building_router';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'console/building_router';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Model Endpoints" href="../concepts/endpoints.html" />
+    <link rel="next" title="On-Prem access" href="../on_prem/on_prem_access.html" />
     <link rel="prev" title="Benchmarking endpoints" href="running_benchmarks.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -180,27 +180,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="connecting_stack.html">
                         Connecting your stack
@@ -222,27 +201,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,42 +261,12 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="connecting_stack.html">Connecting your stack</a></li>
 <li class="toctree-l1"><a class="reference internal" href="running_benchmarks.html">Benchmarking endpoints</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
@@ -490,11 +418,11 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
       </div>
     </a>
     <a class="right-next"
-       href="../concepts/endpoints.html"
+       href="../on_prem/on_prem_access.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Model Endpoints</p>
+        <p class="prev-next-title">On-Prem access</p>
       </div>
       <i class="fa-solid fa-angle-right"></i>
     </a>
@@ -577,13 +505,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -591,42 +519,12 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="connecting_stack.html">Connecting your stack</a></li>
 <li class="toctree-l1"><a class="reference internal" href="running_benchmarks.html">Benchmarking endpoints</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
diff --git a/hub/interfaces/connecting_stack.html b/hub/console/connecting_stack.html
similarity index 76%
rename from hub/interfaces/connecting_stack.html
rename to hub/console/connecting_stack.html
index a0a0eebf2d..0b55ddbae4 100644
--- a/hub/interfaces/connecting_stack.html
+++ b/hub/console/connecting_stack.html
@@ -58,12 +58,12 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'interfaces/connecting_stack';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'console/connecting_stack';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
     <link rel="next" title="Benchmarking endpoints" href="running_benchmarks.html" />
-    <link rel="prev" title="LlamaIndex" href="../demos/demos/LlamaIndex/BasicUsage/unify.html" />
+    <link rel="prev" title="Utils" href="../docs/unify/unify/unify.utils.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -180,27 +180,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item current active">
                       <a class="nav-link nav-internal" href="#">
                         Connecting your stack
@@ -222,27 +201,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,42 +261,12 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Connecting your stack</a></li>
 <li class="toctree-l1"><a class="reference internal" href="running_benchmarks.html">Benchmarking endpoints</a></li>
 <li class="toctree-l1"><a class="reference internal" href="building_router.html">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
@@ -443,12 +371,12 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
                   
 <div class="prev-next-area">
     <a class="left-prev"
-       href="../demos/demos/LlamaIndex/BasicUsage/unify.html"
+       href="../docs/unify/unify/unify.utils.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
         <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">LlamaIndex</p>
+        <p class="prev-next-title">Utils</p>
       </div>
     </a>
     <a class="right-next"
@@ -543,13 +471,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -557,42 +485,12 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Connecting your stack</a></li>
 <li class="toctree-l1"><a class="reference internal" href="running_benchmarks.html">Benchmarking endpoints</a></li>
 <li class="toctree-l1"><a class="reference internal" href="building_router.html">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
diff --git a/hub/interfaces/running_benchmarks.html b/hub/console/running_benchmarks.html
similarity index 81%
rename from hub/interfaces/running_benchmarks.html
rename to hub/console/running_benchmarks.html
index 144a3dd3e7..034a4f8482 100644
--- a/hub/interfaces/running_benchmarks.html
+++ b/hub/console/running_benchmarks.html
@@ -58,7 +58,7 @@
                 gtag('js', new Date());
                 gtag('config', 'G-QP5BET66XH');
             </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'interfaces/running_benchmarks';</script>
+    <script>DOCUMENTATION_OPTIONS.pagename = 'console/running_benchmarks';</script>
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -180,27 +180,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="connecting_stack.html">
                         Connecting your stack
@@ -222,27 +201,6 @@
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,42 +261,12 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="connecting_stack.html">Connecting your stack</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking endpoints</a></li>
 <li class="toctree-l1"><a class="reference internal" href="building_router.html">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
@@ -591,13 +519,13 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -605,42 +533,12 @@ <h2>Round Up<a class="headerlink" href="#round-up" title="Link to this heading">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="connecting_stack.html">Connecting your stack</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Benchmarking endpoints</a></li>
 <li class="toctree-l1"><a class="reference internal" href="building_router.html">Building a custom router</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
diff --git a/hub/demos/demos/LangChain/RAG_playground/README.html b/hub/demos/demos/LangChain/RAG_playground/README.html
deleted file mode 100644
index f769e15f24..0000000000
--- a/hub/demos/demos/LangChain/RAG_playground/README.html
+++ /dev/null
@@ -1,696 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>RAG Playground 🛝 &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/LangChain/RAG_playground/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="LlamaIndex Examples" href="../../../llamaindex.html" />
-    <link rel="prev" title="LangChain Examples" href="../../../langchain.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../langchain.html" class="nav-link">LangChain Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">RAG Playground 🛝</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="rag-playground">
-<h1>RAG Playground 🛝<a class="headerlink" href="#rag-playground" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/Anteemony/RAG-Playground/assets/103512255/0d944420-e3e8-43cb-aad3-0a459d8d0318">Demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/RAG_Playground.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://unify-rag-playground.streamlit.app/">RAG Playground on Streamlit</a></p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>Streamlit application that enables users to upload a pdf file and chat with an LLM for performing document analysis in a playground environment.
-Compare the performance of LLMs across endpoint providers to find the best possible configuration for your speed, latency and cost requirements using the dynamic routing feature.
-Play intuitively tuning the model hyperparameters as temperature, chunk size, chunk overlap or try the model with/without conversational capabilities.</p>
-<p>You find more model/provider information in the <a class="reference external" href="https://unify.ai/hub">Unify benchmark interface</a>.</p>
-</section>
-<section id="usage">
-<h2>Usage<a class="headerlink" href="#usage" title="Link to this heading">#</a></h2>
-<ol class="arabic simple">
-<li><p>Visit the application: <a class="reference external" href="https://unify-rag-playground.streamlit.app/">RAG Playground</a></p></li>
-<li><p>Input your Unify API Key. If you don’t have one yet, log in to the <a class="reference external" href="https://console.unify.ai/">Unify Console</a> to get yours.</p></li>
-<li><p>Select the Model and endpoint provider of your choice from the drop-down menu. You can find both model and provider information in the benchmark interface.</p></li>
-<li><p>Upload your document(s) and click the Submit button.</p></li>
-<li><p>Enjoy the application!</p></li>
-</ol>
-</section>
-<section id="repository-and-local-deployment">
-<h2>Repository and Local Deployment<a class="headerlink" href="#repository-and-local-deployment" title="Link to this heading">#</a></h2>
-<p>The repository is located at <a class="reference external" href="https://github.com/Anteemony/RAG-Playground">RAG Playground Repository</a>.</p>
-<p>To run the application locally, follow these steps:</p>
-<ol class="arabic simple">
-<li><p>Clone the repository to your local machine.</p></li>
-<li><p>Set up your virtual environment and install the dependencies from <code class="docutils literal notranslate"><span class="pre">requirements.txt</span></code>:</p></li>
-</ol>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>python<span class="w"> </span>-m<span class="w"> </span>venv<span class="w"> </span>.venv
-<span class="nb">source</span><span class="w"> </span>.venv/bin/activate<span class="w">  </span><span class="c1"># On Windows use `.venv\Scripts\activate`</span>
-pip<span class="w"> </span>install<span class="w"> </span>-r<span class="w"> </span>requirements.txt
-</pre></div>
-</div>
-<ol class="arabic simple" start="3">
-<li><p>Run rag_script.py from Streamlit module</p></li>
-</ol>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>python<span class="w"> </span>-m<span class="w"> </span>streamlit<span class="w"> </span>run<span class="w"> </span>rag_script.py
-</pre></div>
-</div>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Anthony Okonneh</p></td>
-<td><p><a class="reference external" href="https://github.com/Anteemony">AO</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Oscar Arroyo Vega</p></td>
-<td><p><a class="reference external" href="https://github.com/OscarArroyoVega">OscarAV</a></p></td>
-</tr>
-<tr class="row-even"><td><p>Martin Oywa</p></td>
-<td><p><a class="reference external" href="https://github.com/martinoywa">Martin Oywa</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../../../langchain.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">LangChain Examples</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../../../llamaindex.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">LlamaIndex Examples</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#usage">Usage</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-local-deployment">Repository and Local Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/LangChain/README.html b/hub/demos/demos/LangChain/README.html
deleted file mode 100644
index 05ef163097..0000000000
--- a/hub/demos/demos/LangChain/README.html
+++ /dev/null
@@ -1,642 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LangChain Projects &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/LangChain/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">LangChain Projects</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="langchain-projects">
-<h1>LangChain Projects<a class="headerlink" href="#langchain-projects" title="Link to this heading">#</a></h1>
-<p>This folder contains various projects built using the LangChain Unify Integration. Please headover to the corresponding folder of the project for more details.</p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.</p>
-</section>
-<section id="quick-demo">
-<h2>Quick Demo<a class="headerlink" href="#quick-demo" title="Link to this heading">#</a></h2>
-<p>Include a recorded video of the demo here. You should the embed the video in the README.</p>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.</p>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<p>List the contributors to the project in a table format. For example:</p>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>John Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/johndoe">johndoe</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Jane Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/janedoe">janedoe</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quick-demo">Quick Demo</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/LlamaIndex/BasicUsage/unify.html b/hub/demos/demos/LlamaIndex/BasicUsage/unify.html
deleted file mode 100644
index 524dace211..0000000000
--- a/hub/demos/demos/LlamaIndex/BasicUsage/unify.html
+++ /dev/null
@@ -1,817 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LlamaIndex &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/nbsphinx-code-cells.css" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>window.MathJax = {"tex": {"inlineMath": [["$", "$"], ["\\(", "\\)"]], "processEscapes": true}, "options": {"ignoreHtmlClass": "tex2jax_ignore|mathjax_ignore|document", "processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/LlamaIndex/BasicUsage/unify';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="Connecting your stack" href="../../../../interfaces/connecting_stack.html" />
-    <link rel="prev" title="RAG Playground" href="../RAGPlayground/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../llamaindex.html" class="nav-link">LlamaIndex Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">LlamaIndex</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="LlamaIndex">
-<h1>LlamaIndex<a class="headerlink" href="#LlamaIndex" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://www.llamaindex.ai/">LlamaIndex</a> is a simple, flexible data framework for connecting custom data sources to large language models (LLMs). The integration with Unify allows you to route your queries to the best LLM endpoints, benchmark performance, and seamlessly switch providers with a single API key in your LlamaIndex LLM applications.</p>
-<section id="Installation">
-<h2>Installation<a class="headerlink" href="#Installation" title="Link to this heading">#</a></h2>
-<p>First, let’s install LlamaIndex 🦙 and the Unify integration.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="o">%</span><span class="k">pip</span> install llama-index-llms-unify llama-index
-</pre></div>
-</div>
-</div>
-</section>
-<section id="Environment-Setup">
-<h2>Environment Setup<a class="headerlink" href="#Environment-Setup" title="Link to this heading">#</a></h2>
-<p>Make sure to set the <code class="docutils literal notranslate"><span class="pre">UNIFY_API_KEY</span></code> environment variable. You can get a key from the <a class="reference external" href="https://console.unify.ai/login">Unify Console</a>.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[1]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">os</span>
-<span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;UNIFY_API_KEY&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;&lt;YOUR API KEY&gt;&quot;</span>
-</pre></div>
-</div>
-</div>
-</section>
-<section id="Using-LlamaIndex-with-Unify">
-<h2>Using LlamaIndex with Unify<a class="headerlink" href="#Using-LlamaIndex-with-Unify" title="Link to this heading">#</a></h2>
-<section id="Basic-Usage">
-<h3>Basic Usage<a class="headerlink" href="#Basic-Usage" title="Link to this heading">#</a></h3>
-<p>Below we initialize and query a chat model using the <code class="docutils literal notranslate"><span class="pre">llama-3-70b-chat</span></code> endpoint from <code class="docutils literal notranslate"><span class="pre">together-ai</span></code>.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[3]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">llama_index.llms.unify</span> <span class="kn">import</span> <span class="n">Unify</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;llama-3-70b-chat@together-ai&quot;</span><span class="p">)</span>
-<span class="n">llm</span><span class="o">.</span><span class="n">complete</span><span class="p">(</span><span class="s2">&quot;How are you today, llama?&quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[3]:
-</pre></div>
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-CompletionResponse(text=&#34;I&#39;m not actually a llama, but I&#39;m doing great, thanks for asking! I&#39;m a large language model, so I don&#39;t have feelings like humans do, but I&#39;m always happy to chat with you and help with any questions or topics you&#39;d like to discuss. How about you? How&#39;s your day going?&#34;, additional_kwargs={}, raw={&#39;id&#39;: &#39;88b5fcf02e259527-LHR&#39;, &#39;choices&#39;: [Choice(finish_reason=&#39;stop&#39;, index=0, logprobs=None, message=ChatCompletionMessage(content=&#34;I&#39;m not actually a llama, but I&#39;m doing great, thanks for asking! I&#39;m a large language model, so I don&#39;t have feelings like humans do, but I&#39;m always happy to chat with you and help with any questions or topics you&#39;d like to discuss. How about you? How&#39;s your day going?&#34;, role=&#39;assistant&#39;, function_call=None, tool_calls=None))], &#39;created&#39;: 1716980504, &#39;model&#39;: &#39;llama-3-70b-chat@together-ai&#39;, &#39;object&#39;: &#39;chat.completion&#39;, &#39;system_fingerprint&#39;: None, &#39;usage&#39;: CompletionUsage(completion_tokens=67, prompt_tokens=17, total_tokens=84, cost=7.56e-05)}, logprobs=None, delta=None)
-</pre></div></div>
-</div>
-</section>
-<section id="Single-Sign-On">
-<h3>Single Sign-On<a class="headerlink" href="#Single-Sign-On" title="Link to this heading">#</a></h3>
-<p>You can use Unify’s SSO to query endpoints in different providers without making accounts with all of them. For example, all of these are valid endpoints:</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[4]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;llama-2-70b-chat@together-ai&quot;</span><span class="p">)</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;gpt-3.5-turbo@openai&quot;</span><span class="p">)</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;mixtral-8x7b-instruct-v0.1@mistral-ai&quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<p>This allows you to quickly switch and test different models and providers. You can look at all the available models/providers <a class="reference external" href="https://unify.ai/hub">here</a>!</p>
-</section>
-<section id="Runtime-Dynamic-Routing">
-<h3>Runtime Dynamic Routing<a class="headerlink" href="#Runtime-Dynamic-Routing" title="Link to this heading">#</a></h3>
-<p>As evidenced by our <a class="reference external" href="https://unify.ai/benchmarks">benchmarks</a>, the optimal provider for each model varies by geographic location and time of day due to fluctuating API performances. To cirumvent this, we automatically direct your requests to the “top performing provider” at runtime. To enable this feature, simply replace your query’s provider with one of the <a class="reference external" href="https://unify.ai/docs/api/deploy_router.html#optimizing-a-metric">available routing modes</a>. Let’s look at some examples:</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;llama-2-70b-chat@input-cost&quot;</span><span class="p">)</span> <span class="c1"># route to lowest input cost provider</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;gpt-3.5-turbo@itl&quot;</span><span class="p">)</span> <span class="c1"># route to provider with lowest inter token latency</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;mixtral-8x7b-instruct-v0.1@ttft&quot;</span><span class="p">)</span> <span class="c1"># route to provider with lowest time to first token.</span>
-</pre></div>
-</div>
-</div>
-</section>
-<section id="Quality-Routing">
-<h3>Quality Routing<a class="headerlink" href="#Quality-Routing" title="Link to this heading">#</a></h3>
-<p>Unify routes your queries to the best LLM on every prompt to consistently achieve better quality outputs than using a single, all-purpose, powerful model, at a fraction of the cost. This is achieved by using smaller models for simpler tasks, only using largers ones to handle complex queries.</p>
-<p>The router is benchmarked on various different data-sets such as <code class="docutils literal notranslate"><span class="pre">Open</span> <span class="pre">Hermes</span></code>, <code class="docutils literal notranslate"><span class="pre">GSM8K</span></code>, <code class="docutils literal notranslate"><span class="pre">HellaSwag</span></code>, <code class="docutils literal notranslate"><span class="pre">MMLU</span></code> and <code class="docutils literal notranslate"><span class="pre">MT-Bench</span></code> revealing that it can peform better than indivudal endpoints on average as explained <a class="reference external" href="https://unify.ai/docs/concepts/routing.html#quality-routing">here</a>. One can choose various different configurations of the router for a particular data-set from the <a class="reference external" href="https://unify.ai/chat">chat-interface</a> as shown below:</p>
-<p><img alt="dcc296b10cb749c194e94a5776dd75bc" src="../../../../_images/unify.gif" /></p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;router_2.58e-01_9.51e-04_3.91e-03@unify&quot;</span><span class="p">)</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;router_2.12e-01_5.00e-04_2.78e-04@unify&quot;</span><span class="p">)</span>
-<span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;router_2.12e-01_5.00e-04_2.78e-04@unify&quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<p>To learn more about quality routing, please refer to this <a class="reference external" href="https://www.youtube.com/watch?v=ZpY6SIkBosE&amp;feature=youtu.be">video</a>.</p>
-</section>
-<section id="Streaming-and-optimizing-for-latency">
-<h3>Streaming and optimizing for latency<a class="headerlink" href="#Streaming-and-optimizing-for-latency" title="Link to this heading">#</a></h3>
-<p>If you are building an application where responsiveness is key, you most likely want to get a streaming response. On top of that, ideally you would use the provider with the lowest Time to First Token, to reduce the time your users are waiting for a response. Using Unify this would look something like:</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[7]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;mixtral-8x7b-instruct-v0.1@ttft&quot;</span><span class="p">)</span>
-
-<span class="n">response</span> <span class="o">=</span> <span class="n">llm</span><span class="o">.</span><span class="n">stream_complete</span><span class="p">(</span>
-    <span class="s2">&quot;Translate the following to German: &quot;</span>
-    <span class="s2">&quot;Hey, there&#39;s an emergency in translation street, &quot;</span>
-    <span class="s2">&quot;please send help asap!&quot;</span>
-<span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[8]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">show_provider</span> <span class="o">=</span> <span class="kc">True</span>
-<span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">response</span><span class="p">:</span>
-    <span class="k">if</span> <span class="n">show_provider</span><span class="p">:</span>
-        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model and provider are : </span><span class="si">{</span><span class="n">r</span><span class="o">.</span><span class="n">raw</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-        <span class="n">show_provider</span> <span class="o">=</span> <span class="kc">False</span>
-    <span class="nb">print</span><span class="p">(</span><span class="n">r</span><span class="o">.</span><span class="n">delta</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">flush</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Model and provider are : mixtral-8x7b-instruct-v0.1@mistral-ai
-
-Hallo, es gibt einen Notfall in der Übersetzungsstraße, bitte senden Sie Hilfe so schnell wie möglich!
-
-(Note: This is a loose translation and the phrase &#34;Übersetzungsstraße&#34; does not literally exist, but I tried to convey the same meaning as the original message.)
-</pre></div></div>
-</div>
-</section>
-<section id="Async-calls-and-Lowest-Input-Cost">
-<h3>Async calls and Lowest Input Cost<a class="headerlink" href="#Async-calls-and-Lowest-Input-Cost" title="Link to this heading">#</a></h3>
-<p>Last but not the least, you can also run multiple requests asynchronously. For tasks such as document summarization, optimizing for input costs is crucial. We can use the <code class="docutils literal notranslate"><span class="pre">input-cost</span></code> dynamic routing mode to route our queries to the cheapest provider.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">llm</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span><span class="n">model</span><span class="o">=</span><span class="s2">&quot;mixtral-8x7b-instruct-v0.1@input-cost&quot;</span><span class="p">)</span>
-
-<span class="n">response</span> <span class="o">=</span> <span class="k">await</span> <span class="n">llm</span><span class="o">.</span><span class="n">acomplete</span><span class="p">(</span>
-    <span class="s2">&quot;Summarize this in 10 words or less. OpenAI is a U.S. based artificial intelligence &quot;</span>
-    <span class="s2">&quot;(AI) research organization founded in December 2015, researching artificial intelligence &quot;</span>
-    <span class="s2">&quot;with the goal of developing &#39;safe and beneficial&#39; artificial general intelligence, &quot;</span>
-    <span class="s2">&quot;which it defines as &#39;highly autonomous systems that outperform humans at most economically &quot;</span>
-    <span class="s2">&quot;valuable work&#39;. As one of the leading organizations of the AI spring, it has developed &quot;</span>
-    <span class="s2">&quot;several large language models, advanced image generation models, and previously, released &quot;</span>
-    <span class="s2">&quot;open-source models. Its release of ChatGPT has been credited with starting the AI spring&quot;</span>
-<span class="p">)</span>
-
-<span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Model and provider are : </span><span class="si">{</span><span class="n">response</span><span class="o">.</span><span class="n">raw</span><span class="p">[</span><span class="s1">&#39;model&#39;</span><span class="p">]</span><span class="si">}</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Model and provider are : mixtral-8x7b-instruct-v0.1@deepinfra
-
- OpenAI: Pioneering &#39;safe&#39; artificial general intelligence.
-</pre></div></div>
-</div>
-</section>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../RAGPlayground/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">RAG Playground</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../../../../interfaces/connecting_stack.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Connecting your stack</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Installation">Installation</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Environment-Setup">Environment Setup</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Using-LlamaIndex-with-Unify">Using LlamaIndex with Unify</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Basic-Usage">Basic Usage</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Single-Sign-On">Single Sign-On</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Runtime-Dynamic-Routing">Runtime Dynamic Routing</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Quality-Routing">Quality Routing</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Streaming-and-optimizing-for-latency">Streaming and optimizing for latency</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#Async-calls-and-Lowest-Input-Cost">Async calls and Lowest Input Cost</a></li>
-</ul>
-</li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/LlamaIndex/BasicUsage/unify.ipynb b/hub/demos/demos/LlamaIndex/BasicUsage/unify.ipynb
deleted file mode 100644
index 4ed415e726..0000000000
--- a/hub/demos/demos/LlamaIndex/BasicUsage/unify.ipynb
+++ /dev/null
@@ -1,286 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "# LlamaIndex\n",
-    "[LlamaIndex](https://www.llamaindex.ai/) is a simple, flexible data framework for connecting custom data sources to large language models (LLMs). The integration with Unify allows you to route your queries to the best LLM endpoints, benchmark performance, and seamlessly switch providers with a single API key in your LlamaIndex LLM applications."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Installation"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "First, let's install LlamaIndex 🦙 and the Unify integration."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "%pip install llama-index-llms-unify llama-index"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Environment Setup\n",
-    "\n",
-    "Make sure to set the `UNIFY_API_KEY` environment variable. You can get a key from the [Unify Console](https://console.unify.ai/login)."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 1,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "import os\n",
-    "os.environ[\"UNIFY_API_KEY\"] = \"<YOUR API KEY>\""
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "## Using LlamaIndex with Unify"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Basic Usage \n",
-    "\n",
-    "Below we initialize and query a chat model using the `llama-3-70b-chat` endpoint from `together-ai`."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 3,
-   "metadata": {},
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "CompletionResponse(text=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", additional_kwargs={}, raw={'id': '88b5fcf02e259527-LHR', 'choices': [Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content=\"I'm not actually a llama, but I'm doing great, thanks for asking! I'm a large language model, so I don't have feelings like humans do, but I'm always happy to chat with you and help with any questions or topics you'd like to discuss. How about you? How's your day going?\", role='assistant', function_call=None, tool_calls=None))], 'created': 1716980504, 'model': 'llama-3-70b-chat@together-ai', 'object': 'chat.completion', 'system_fingerprint': None, 'usage': CompletionUsage(completion_tokens=67, prompt_tokens=17, total_tokens=84, cost=7.56e-05)}, logprobs=None, delta=None)"
-      ]
-     },
-     "execution_count": 3,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "from llama_index.llms.unify import Unify\n",
-    "llm = Unify(model=\"llama-3-70b-chat@together-ai\")\n",
-    "llm.complete(\"How are you today, llama?\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Single Sign-On\n",
-    "\n",
-    "You can use Unify's SSO to query endpoints in different providers without making accounts with all of them. For example, all of these are valid endpoints:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@together-ai\")\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@openai\")\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@mistral-ai\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "This allows you to quickly switch and test different models and providers. You can look at all the available models/providers [here](https://unify.ai/hub)!"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Runtime Dynamic Routing"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "As evidenced by our [benchmarks](https://unify.ai/benchmarks), the optimal provider for each model varies by geographic location and time of day due to fluctuating API performances. To cirumvent this, we automatically direct your requests to the \"top performing provider\" at runtime. To enable this feature, simply replace your query's provider with one of the [available routing modes](https://unify.ai/docs/api/deploy_router.html#optimizing-a-metric). Let's look at some examples:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"llama-2-70b-chat@input-cost\") # route to lowest input cost provider\n",
-    "llm = Unify(model=\"gpt-3.5-turbo@itl\") # route to provider with lowest inter token latency\n",
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\") # route to provider with lowest time to first token."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Quality Routing\n",
-    "Unify routes your queries to the best LLM on every prompt to consistently achieve better quality outputs than using a single, all-purpose, powerful model, at a fraction of the cost. This is achieved by using smaller models for simpler tasks, only using largers ones to handle complex queries.\n",
-    "\n",
-    "The router is benchmarked on various different data-sets such as `Open Hermes`, `GSM8K`, `HellaSwag`, `MMLU` and `MT-Bench` revealing that it can peform better than indivudal endpoints on average as explained [here](https://unify.ai/docs/concepts/routing.html#quality-routing). One can choose various different configurations of the router for a particular data-set from the [chat-interface](https://unify.ai/chat) as shown below:\n",
-    "\n",
-    "<img src = \"./unify.gif\">"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"router_2.58e-01_9.51e-04_3.91e-03@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")\n",
-    "llm = Unify(model=\"router_2.12e-01_5.00e-04_2.78e-04@unify\")"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "To learn more about quality routing, please refer to this [video](https://www.youtube.com/watch?v=ZpY6SIkBosE&feature=youtu.be)."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Streaming and optimizing for latency\n",
-    "\n",
-    "If you are building an application where responsiveness is key, you most likely want to get a streaming response. On top of that, ideally you would use the provider with the lowest Time to First Token, to reduce the time your users are waiting for a response. Using Unify this would look something like:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 7,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@ttft\")\n",
-    "\n",
-    "response = llm.stream_complete(\n",
-    "    \"Translate the following to German: \"\n",
-    "    \"Hey, there's an emergency in translation street, \"\n",
-    "    \"please send help asap!\"\n",
-    ")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 8,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@mistral-ai\n",
-      "\n",
-      "Hallo, es gibt einen Notfall in der Übersetzungsstraße, bitte senden Sie Hilfe so schnell wie möglich!\n",
-      "\n",
-      "(Note: This is a loose translation and the phrase \"Übersetzungsstraße\" does not literally exist, but I tried to convey the same meaning as the original message.)"
-     ]
-    }
-   ],
-   "source": [
-    "show_provider = True\n",
-    "for r in response:\n",
-    "    if show_provider:\n",
-    "        print(f\"Model and provider are : {r.raw['model']}\\n\")\n",
-    "        show_provider = False\n",
-    "    print(r.delta, end=\"\", flush=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {},
-   "source": [
-    "### Async calls and Lowest Input Cost\n",
-    "\n",
-    "Last but not the least, you can also run multiple requests asynchronously. For tasks such as document summarization, optimizing for input costs is crucial. We can use the `input-cost` dynamic routing mode to route our queries to the cheapest provider."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Model and provider are : mixtral-8x7b-instruct-v0.1@deepinfra\n",
-      "\n",
-      " OpenAI: Pioneering 'safe' artificial general intelligence.\n"
-     ]
-    }
-   ],
-   "source": [
-    "llm = Unify(model=\"mixtral-8x7b-instruct-v0.1@input-cost\")\n",
-    "\n",
-    "response = await llm.acomplete(\n",
-    "    \"Summarize this in 10 words or less. OpenAI is a U.S. based artificial intelligence \"\n",
-    "    \"(AI) research organization founded in December 2015, researching artificial intelligence \"\n",
-    "    \"with the goal of developing 'safe and beneficial' artificial general intelligence, \"\n",
-    "    \"which it defines as 'highly autonomous systems that outperform humans at most economically \"\n",
-    "    \"valuable work'. As one of the leading organizations of the AI spring, it has developed \"\n",
-    "    \"several large language models, advanced image generation models, and previously, released \"\n",
-    "    \"open-source models. Its release of ChatGPT has been credited with starting the AI spring\"\n",
-    ")\n",
-    "\n",
-    "print(f\"Model and provider are : {response.raw['model']}\\n\")\n",
-    "print(response)"
-   ]
-  }
- ],
- "metadata": {
-  "kernelspec": {
-   "display_name": "base",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.10.13"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 2
-}
diff --git a/hub/demos/demos/LlamaIndex/RAGPlayground/README.html b/hub/demos/demos/LlamaIndex/RAGPlayground/README.html
deleted file mode 100644
index 2f0d819393..0000000000
--- a/hub/demos/demos/LlamaIndex/RAGPlayground/README.html
+++ /dev/null
@@ -1,741 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>RAG Playground &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/LlamaIndex/RAGPlayground/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="LlamaIndex" href="../BasicUsage/unify.html" />
-    <link rel="prev" title="LlamaIndex Examples" href="../../../llamaindex.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../llamaindex.html" class="nav-link">LlamaIndex Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">RAG Playground</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="rag-playground">
-<h1>RAG Playground<a class="headerlink" href="#rag-playground" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/abhi2596/rag_demo/assets/80634226/08f6c7c4-65e3-49b4-bfb1-9a5db2cce248">Demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/RAG_LLamaIndex.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://unifyai-rag-playground.streamlit.app/">RAG Playground on Streamlit</a></p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>The RAG Playground is an application designed to facilitate question-answering tasks based on uploaded PDF documents. It leverages LLamaIndex for RAG functionalities and utilizes Streamlit for the user interface.</p>
-</section>
-<section id="key-features">
-<h2>Key Features<a class="headerlink" href="#key-features" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p><strong>PDF Upload:</strong> Easily upload PDF files to the application.</p></li>
-<li><p><strong>Questioning:</strong> Ask questions about the uploaded PDF documents.</p></li>
-<li><p><strong>RAG Integration:</strong> Utilize LLamaIndex for RAG capabilities.</p></li>
-<li><p><strong>Embeddings:</strong> Convert text to embeddings using the BAAI/bge-small-en-v1.5 model.</p></li>
-<li><p><strong>Reranker:</strong> Reorder search results based on relevance to queries.</p></li>
-<li><p><strong>Streamlit Optimization:</strong> Enhance performance using <code class="docutils literal notranslate"><span class="pre">&#64;st.experimental_fragment</span></code> and <code class="docutils literal notranslate"><span class="pre">&#64;st.cache_resource</span></code>.</p></li>
-</ul>
-</section>
-<section id="project-workflow">
-<h2>Project Workflow<a class="headerlink" href="#project-workflow" title="Link to this heading">#</a></h2>
-<ol class="arabic simple">
-<li><p><strong>PDF Processing:</strong></p>
-<ul class="simple">
-<li><p>Load PDF files and extract text using PDFReader.</p></li>
-<li><p>Load data into Documents in LLamaIndex.</p></li>
-</ul>
-</li>
-<li><p><strong>Chunking and Conversion:</strong></p>
-<ul class="simple">
-<li><p>Chunk text and convert it into nodes using <code class="docutils literal notranslate"><span class="pre">VectorStoreIndex.from_documents</span></code>.</p></li>
-<li><p>Convert text to embeddings using the BAAI/bge-small-en-v1.5 model.</p></li>
-</ul>
-</li>
-<li><p><strong>Search Optimization:</strong></p>
-<ul class="simple">
-<li><p>Implement a reranker to reorder search results based on query relevance.</p></li>
-<li><p>Display top-ranked results after reranking.</p></li>
-</ul>
-</li>
-<li><p><strong>Interface Optimization:</strong></p>
-<ul class="simple">
-<li><p>Build the user interface using Streamlit.</p></li>
-<li><p>Optimize Streamlit performance with <code class="docutils literal notranslate"><span class="pre">&#64;st.experimental_fragment</span></code> and <code class="docutils literal notranslate"><span class="pre">&#64;st.cache_resource</span></code>.</p></li>
-</ul>
-</li>
-</ol>
-</section>
-<section id="tech-stack-used">
-<h2>Tech Stack Used<a class="headerlink" href="#tech-stack-used" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p>LLamaIndex</p></li>
-<li><p>Streamlit</p></li>
-<li><p>BAAI/bge-small-en-v1.5 model</p></li>
-</ul>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Github - https://github.com/abhi2596/UnifyAI_RAG_playground/tree/main
-Streamlit App - https://unifyai-rag-playground.streamlit.app/</p>
-<p>Instructions to run locally:</p>
-<ol class="arabic simple">
-<li><p>First create a virtual environment in python</p></li>
-</ol>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">python</span> <span class="o">-</span><span class="n">m</span> <span class="n">venv</span> <span class="o">&lt;</span><span class="n">virtual</span> <span class="n">env</span> <span class="n">name</span><span class="o">&gt;</span>
-</pre></div>
-</div>
-<ol class="arabic simple" start="2">
-<li><p>Activate it and install poetry</p></li>
-</ol>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">source</span> <span class="o">&lt;</span><span class="n">virtual</span> <span class="n">env</span> <span class="n">name</span><span class="o">&gt;/</span><span class="n">Scripts</span><span class="o">/</span><span class="n">activate</span> <span class="o">-</span> <span class="n">Windows</span>
-<span class="n">source</span> <span class="o">&lt;</span><span class="n">virtual</span> <span class="n">env</span> <span class="n">name</span><span class="o">&gt;/</span><span class="nb">bin</span><span class="o">/</span><span class="n">activate</span> <span class="o">-</span> <span class="n">Linux</span><span class="o">/</span><span class="n">Unix</span>
-<span class="n">pip</span> <span class="n">install</span> <span class="n">poetry</span>
-</pre></div>
-</div>
-<ol class="arabic simple" start="3">
-<li><p>Clone the repo</p></li>
-</ol>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">git</span> <span class="n">clone</span> <span class="n">https</span><span class="p">:</span><span class="o">//</span><span class="n">github</span><span class="o">.</span><span class="n">com</span><span class="o">/</span><span class="n">abhi2596</span><span class="o">/</span><span class="n">UnifyAI_RAG_playground</span><span class="o">/</span><span class="n">tree</span><span class="o">/</span><span class="n">main</span>
-</pre></div>
-</div>
-<ol class="arabic simple" start="4">
-<li><p>Run the following commands</p></li>
-</ol>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="n">poetry</span> <span class="n">install</span> 
-<span class="n">cd</span> <span class="n">rag</span>
-<span class="n">streamlit</span> <span class="n">run</span> <span class="n">app</span><span class="o">.</span><span class="n">py</span>
-</pre></div>
-</div>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Abhijeet Chintakunta</p></td>
-<td><p><a class="reference external" href="https://github.com/abhi2596">abhi2596</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../../../llamaindex.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">LlamaIndex Examples</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../BasicUsage/unify.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">LlamaIndex</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#key-features">Key Features</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#project-workflow">Project Workflow</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#tech-stack-used">Tech Stack Used</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/LlamaIndex/README.html b/hub/demos/demos/LlamaIndex/README.html
deleted file mode 100644
index 2fe4e6e5d8..0000000000
--- a/hub/demos/demos/LlamaIndex/README.html
+++ /dev/null
@@ -1,642 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LlamaIndex Projects &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/LlamaIndex/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">LlamaIndex Projects</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="llamaindex-projects">
-<h1>LlamaIndex Projects<a class="headerlink" href="#llamaindex-projects" title="Link to this heading">#</a></h1>
-<p>This folder contains various projects built using the LLamaIndex Unify Integration. Please headover to the corresponding folder of the project for more details.</p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.</p>
-</section>
-<section id="quick-demo">
-<h2>Quick Demo<a class="headerlink" href="#quick-demo" title="Link to this heading">#</a></h2>
-<p>Include a recorded video of the demo here. You should the embed the video in the README.</p>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.</p>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<p>List the contributors to the project in a table format. For example:</p>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>John Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/johndoe">johndoe</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Jane Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/janedoe">janedoe</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#quick-demo">Quick Demo</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/README.html b/hub/demos/demos/README.html
deleted file mode 100644
index 6fd4fc2d63..0000000000
--- a/hub/demos/demos/README.html
+++ /dev/null
@@ -1,628 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Demos &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../genindex.html" />
-    <link rel="search" title="Search" href="../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Demos</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="demos">
-<h1>Demos<a class="headerlink" href="#demos" title="Link to this heading">#</a></h1>
-<p>This repository contains various examples demonstrating the usage of Unify with different LLM projects such as LangChain and LlamaIndex.</p>
-<section id="file-structure">
-<h2>File Structure<a class="headerlink" href="#file-structure" title="Link to this heading">#</a></h2>
-<p>The repository is structured as follows:</p>
-<ul class="simple">
-<li><p><strong>LangChain</strong>: Contains demos built using Unify’s Langchain integration.</p></li>
-<li><p><strong>LlamaIndex</strong>: Includes demos built using Unify’s LlamaIndex integration.</p></li>
-<li><p><strong>Unify</strong>: Contains demos built using the Unify Python Package.</p></li>
-</ul>
-<p>Feel free to explore each folder to discover examples and demos tailored for each respective project.</p>
-</section>
-<section id="contributing">
-<h2>Contributing<a class="headerlink" href="#contributing" title="Link to this heading">#</a></h2>
-<p>We welcome contributions from the community to improve the demos repository. If you have additional demos, examples, or improvements to existing ones, follow these steps to create a pull request (PR):</p>
-<ol class="arabic simple">
-<li><p><strong>Project Placement</strong>: Position your project in the correct folder. For LangChain, LlamaIndex, or Unify related projects, create a new folder within the respective directory.</p></li>
-<li><p><strong>Project README</strong>: Each project should have a README file that follows this <a class="reference external" href="https://github.com/unifyai/demos/blob/main/template/README_TEMPLATE.md#project-title">template</a>.</p></li>
-<li><p><strong>PR Review</strong>: Request a review a from Anwaar Khalid (GitHub: hello-fri-end)</p></li>
-</ol>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#file-structure">File Structure</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributing">Contributing</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.html b/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.html
deleted file mode 100644
index c6f6ddb60d..0000000000
--- a/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.html
+++ /dev/null
@@ -1,881 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Synchronous VS Asynchronous Clients &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/nbsphinx-code-cells.css" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>window.MathJax = {"tex": {"inlineMath": [["$", "$"], ["\\(", "\\)"]], "processEscapes": true}, "options": {"ignoreHtmlClass": "tex2jax_ignore|mathjax_ignore|document", "processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/AsyncVsSync/AsyncVsSync';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="LLM-Wars" href="../LLM-Wars/README.html" />
-    <link rel="prev" title="Build a ChatBot" href="../ChatBot/ChatBot.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">Synchronous...</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="Synchronous-VS-Asynchronous-Clients">
-<h1>Synchronous VS Asynchronous Clients<a class="headerlink" href="#Synchronous-VS-Asynchronous-Clients" title="Link to this heading">#</a></h1>
-<p>Given the growing demand for real-time applications and user demands for instant responses, it’s crucial to grasp the performance implications between Sync and Async clients. In this notebook, we’ll delve into the variations between asynchronous and synchronous response times using UnifyAI’s API.</p>
-<p>In order to run this notebook, you need to generate your UNIFY key from the <a class="reference external" href="https://console.unify.ai/login?callbackUrl=%2F">console</a>. Once you have it, assign it to the <code class="docutils literal notranslate"><span class="pre">UNIFY_KEY</span></code> variable below.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">UNIFY_KEY</span><span class="o">=</span><span class="c1">#ENTERUNIFYKEY</span>
-</pre></div>
-</div>
-</div>
-<section id="Install-Dependencies">
-<h2>Install Dependencies<a class="headerlink" href="#Install-Dependencies" title="Link to this heading">#</a></h2>
-<p>To run this notebook, you will need to install the <code class="docutils literal notranslate"><span class="pre">unifyai</span></code> <a class="reference external" href="https://pypi.org/project/unifyai/">python package</a>. You can do so by running the cell below ⬇️</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="err">!</span><span class="n">pip</span> <span class="n">install</span> <span class="n">unifyai</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Collecting unifyai
-  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)
-Collecting openai&lt;2.0.0,&gt;=1.12.0 (from unifyai)
-  Downloading openai-1.17.1-py3-none-any.whl (268 kB)
-     <span class="ansi-black-intense-fg">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span> <span class="ansi-green-fg">268.3/268.3 kB</span> <span class="ansi-red-fg">4.6 MB/s</span> eta <span class="ansi-cyan-fg">0:00:00</span>
-Requirement already satisfied: requests&lt;3.0.0,&gt;=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai) (2.31.0)
-Requirement already satisfied: anyio&lt;5,&gt;=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (3.7.1)
-Requirement already satisfied: distro&lt;2,&gt;=1.7.0 in /usr/lib/python3/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.7.0)
-Collecting httpx&lt;1,&gt;=0.23.0 (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai)
-  Downloading httpx-0.27.0-py3-none-any.whl (75 kB)
-     <span class="ansi-black-intense-fg">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span> <span class="ansi-green-fg">75.6/75.6 kB</span> <span class="ansi-red-fg">5.7 MB/s</span> eta <span class="ansi-cyan-fg">0:00:00</span>
-Requirement already satisfied: pydantic&lt;3,&gt;=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (2.6.4)
-Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.3.1)
-Requirement already satisfied: tqdm&gt;4 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (4.66.2)
-Requirement already satisfied: typing-extensions&lt;5,&gt;=4.7 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (4.11.0)
-Requirement already satisfied: charset-normalizer&lt;4,&gt;=2 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (3.3.2)
-Requirement already satisfied: idna&lt;4,&gt;=2.5 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (3.6)
-Requirement already satisfied: urllib3&lt;3,&gt;=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (2.0.7)
-Requirement already satisfied: certifi&gt;=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (2024.2.2)
-Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio&lt;5,&gt;=3.5.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.2.0)
-Collecting httpcore==1.* (from httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai)
-  Downloading httpcore-1.0.5-py3-none-any.whl (77 kB)
-     <span class="ansi-black-intense-fg">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span> <span class="ansi-green-fg">77.9/77.9 kB</span> <span class="ansi-red-fg">7.0 MB/s</span> eta <span class="ansi-cyan-fg">0:00:00</span>
-Collecting h11&lt;0.15,&gt;=0.13 (from httpcore==1.*-&gt;httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai)
-  Downloading h11-0.14.0-py3-none-any.whl (58 kB)
-     <span class="ansi-black-intense-fg">━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━</span> <span class="ansi-green-fg">58.3/58.3 kB</span> <span class="ansi-red-fg">4.6 MB/s</span> eta <span class="ansi-cyan-fg">0:00:00</span>
-Requirement already satisfied: annotated-types&gt;=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (0.6.0)
-Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (2.16.3)
-Installing collected packages: h11, httpcore, httpx, openai, unifyai
-Successfully installed h11-0.14.0 httpcore-1.0.5 httpx-0.27.0 openai-1.17.1 unifyai-0.8.1
-</pre></div></div>
-</div>
-</section>
-<section id="Synchronous-Clients">
-<h2>Synchronous Clients<a class="headerlink" href="#Synchronous-Clients" title="Link to this heading">#</a></h2>
-<p>A Synchronous client handles requests sequentially, processing one at a time. This means that each request must be fully handled before the next one is processed, resulting in potential blocking of the program’s execution. You can use a Sync client with Unify as shown below:</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">Unify</span>
-<span class="n">unify</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span>
-    <span class="n">api_key</span><span class="o">=</span><span class="n">UNIFY_KEY</span><span class="p">,</span>
-    <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;llama-2-13b-chat@anyscale&quot;</span>
-<span class="p">)</span>
-<span class="n">response</span> <span class="o">=</span> <span class="n">unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="s2">&quot;Hello Llama! Who was Isaac Newton?&quot;</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="n">response</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-HOO-RAY! *tutu* Hello there, young grasshopper! *bray* Isaac Newton was a majestic figure known for his work in math and science. He was born in 1642 in England and grew up to be a brilliant thinker and a fellow of the Royal Society. *twirl*
-
-Newton is perhaps best known for his laws of motion and his law of universal gravitation. These laws explained how objects move and how gravity works. He also discovered calculus, which is a way of using math to understand how things change over time. *mathematical mnum hop*
-
-But that&#39;s not all, oh no! Newton was also a bit of an alchemist and studied the nature of light. He even invented a fancy piece of equipment called a &#34;reflecting telescope&#34; to observe the heavens. *shimmer*
-
-Newton was a true renaissance thinker, and his contributions to science and mathematics are still celebrated today. *tutu* He was a true llama of learning, and his legacy continues to inspire us all. *bray*
-</pre></div></div>
-</div>
-</section>
-<section id="Async-Clients">
-<h2>Async Clients<a class="headerlink" href="#Async-Clients" title="Link to this heading">#</a></h2>
-<p>An Asynchronous client can handle multiple requests concurrently without blocking. To use the Async client, import <code class="docutils literal notranslate"><span class="pre">AsyncUnify</span></code> instead of <code class="docutils literal notranslate"><span class="pre">Unify</span></code> and use <code class="docutils literal notranslate"><span class="pre">await</span></code> with the <code class="docutils literal notranslate"><span class="pre">.generate</span></code> method. This signals to the program to pause execution until the asynchronous operation completes. Additionally, we’ll use the <code class="docutils literal notranslate"><span class="pre">asyncio</span></code> library for managing asynchronous execution and coroutines. <code class="docutils literal notranslate"><span class="pre">asyncio</span></code> provides tools for building concurrent programs using coroutines, which can be paused and
-resumed, allowing for efficient handling of asynchronous tasks.</p>
-<p>NOTE: Running ansyncio in notebooks conflicts with the existing event loop run in the notebook. As a workaround, we need to use <code class="docutils literal notranslate"><span class="pre">net_asyncio.apply</span></code>. Please see <a class="reference external" href="https://github.com/jupyter/notebook/issues/3397">this issue</a> for more details.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">AsyncUnify</span>
-<span class="kn">import</span> <span class="nn">asyncio</span>
-<span class="kn">import</span> <span class="nn">nest_asyncio</span>
-<span class="n">nest_asyncio</span><span class="o">.</span><span class="n">apply</span><span class="p">()</span>
-
-<span class="n">async_unify</span> <span class="o">=</span> <span class="n">AsyncUnify</span><span class="p">(</span>
-   <span class="n">api_key</span><span class="o">=</span><span class="n">UNIFY_KEY</span><span class="p">,</span>
-   <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;llama-2-13b-chat@anyscale&quot;</span>
-<span class="p">)</span>
-
-<span class="k">async</span> <span class="k">def</span> <span class="nf">main</span><span class="p">():</span>
-   <span class="n">responses</span> <span class="o">=</span> <span class="k">await</span> <span class="n">async_unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="s2">&quot;Hello Llama! Who was Isaac Newton?&quot;</span><span class="p">)</span>
-   <span class="nb">print</span><span class="p">(</span><span class="n">responses</span><span class="p">)</span>
-
-<span class="n">asyncio</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">main</span><span class="p">())</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-HEYA HUMAN! *bleshes* Oh, you&#39;re talkin&#39; &#39;bout Sir Isaac Newton, the famous English mathematician and physicist? *noms on some grass* He lived in the 17th and 18th centuries, and is known for his laws of motion and universal gravitation. *giggles* He was a pretty smart dude, if I do say so myself! *flaunts my banned-from-the-library-for-life status*
-
-But enough about me, let&#39;s talk about Newton! *grin* He was born in Woolsthorpe, Lincolnshire, England in 1643, and grew up to be a brilliant mathematician and physicist. He studied at Trinity College in Cambridge, and later became a professor there. *nbd*
-
-Newton&#39;s most famous contributions to science are his three laws of motion, which describe how objects move and respond to forces. He also developed the Law of Universal Gravitation, which states that every object in the universe attracts every other object with a force proportional to the product of their masses and inversely proportional to the square of the distance between them. *geek out*
-
-Newton was also a skilled inventor and engineer, and he designed and built all sorts of cool stuff, like a reflecting telescope and a machine for calculating the square root of numbers. *impressed*
-
-Despite his many accomplishments, Newton was a pretty private person and wasn&#39;t always the most sociable guy. He was known to be pretty temperamental and had some pretty interesting beliefs, like the idea that alchemy was a valid scientific pursuit. *raises an eyebrow* But hey, who am I to judge? *shrugs*
-
-So there you have it, human! That&#39;s the basic scoop on Sir Isaac Newton. I hope you found that enlightening. *wink* Now, if you&#39;ll excuse me, I need to go work on my own groundbreaking research... or at least, my own Instagram captions. *smizes*
-</pre></div></div>
-</div>
-<p>Now, our goal is to compare the response times of synchronous vs asynchronous clients when handling multiple requests. Let’s start by defining some helper functions.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="k">async</span> <span class="k">def</span> <span class="nf">send_async_request</span><span class="p">(</span><span class="n">user_prompt</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Uses an Async client to generate the response for the user_prompt.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">        user_prompt (str): The prompt provided by the user.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">        str: The response generated.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">response</span> <span class="o">=</span> <span class="k">await</span> <span class="n">async_unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="n">user_prompt</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">response</span>
-
-<span class="k">def</span> <span class="nf">send_sync_request</span><span class="p">(</span><span class="n">user_prompt</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Uses a sync client to generate the response for the user_prompt.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">        user_prompt (str): The prompt provided by the user.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">        str: The response generated.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">response</span> <span class="o">=</span> <span class="n">unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="n">user_prompt</span><span class="p">)</span>
-    <span class="k">return</span> <span class="n">response</span>
-<br/></pre></div>
-</div>
-</div>
-<p>We’ll create two functions to send multiple requests to asynchronous and synchronous clients, respectively, and measure their processing time. For the synchronous client, requests will be sent sequentially in a loop, while for the asynchronous client, we’ll utilize <code class="docutils literal notranslate"><span class="pre">asyncio.gather</span></code> to execute multiple requests concurrently.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">time</span>
-<span class="kn">import</span> <span class="nn">asyncio</span>
-
-<span class="k">async</span> <span class="k">def</span> <span class="nf">run_async_requests</span><span class="p">(</span><span class="n">num_requests</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Runs multiple asynchronous requests for generating responses based on a user prompt and measures the time taken.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">        num_requests (int): The number of requests to be sent.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">        float: The total time taken to process all requests.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">user_prompt</span> <span class="o">=</span> <span class="s2">&quot;Hello! Tell me your favorite physics fact!&quot;</span>
-    <span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-    <span class="n">_</span> <span class="o">=</span> <span class="k">await</span> <span class="n">asyncio</span><span class="o">.</span><span class="n">gather</span><span class="p">(</span><span class="o">*</span><span class="p">(</span><span class="n">send_async_request</span><span class="p">(</span><span class="n">user_prompt</span><span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_requests</span><span class="p">)))</span>
-    <span class="n">end</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">end</span> <span class="o">-</span> <span class="n">start</span>
-
-<span class="k">def</span> <span class="nf">run_sync_requests</span><span class="p">(</span><span class="n">num_requests</span><span class="p">):</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">    Runs multiple synchronous requests for generating responses based on a user prompt and measures the time taken.</span>
-
-<span class="sd">    Parameters:</span>
-<span class="sd">        num_requests (int): The number of requests to be sent.</span>
-
-<span class="sd">    Returns:</span>
-<span class="sd">        float: The total time taken to process all requests.</span>
-<span class="sd">    &quot;&quot;&quot;</span>
-    <span class="n">user_prompt</span> <span class="o">=</span> <span class="s2">&quot;Hello! Tell me your favorite physics fact!&quot;</span>
-    <span class="n">start</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-    <span class="n">_</span> <span class="o">=</span> <span class="p">[</span><span class="n">send_sync_request</span><span class="p">(</span><span class="n">user_prompt</span><span class="p">)</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_requests</span><span class="p">)]</span>
-    <span class="n">end</span> <span class="o">=</span> <span class="n">time</span><span class="o">.</span><span class="n">time</span><span class="p">()</span>
-    <span class="k">return</span> <span class="n">end</span> <span class="o">-</span> <span class="n">start</span>
-<br/></pre></div>
-</div>
-</div>
-<p>Now, let’s measure the time taken by each client for 10 requests.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">num_requests</span> <span class="o">=</span> <span class="mi">10</span>
-<span class="c1"># Send asynchronous requests</span>
-<span class="n">async_response_times</span> <span class="o">=</span> <span class="n">asyncio</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">run_async_requests</span><span class="p">(</span><span class="n">num_requests</span><span class="p">))</span>
-<span class="c1"># Print response times</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Asynchronous Response Times:&quot;</span><span class="p">,</span> <span class="n">async_response_times</span><span class="p">)</span>
-<span class="c1"># Send synchronous requests</span>
-<span class="n">sync_response_times</span> <span class="o">=</span> <span class="n">run_sync_requests</span><span class="p">(</span><span class="n">num_requests</span><span class="p">)</span>
-<span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Synchronous Response Times:&quot;</span><span class="p">,</span> <span class="n">sync_response_times</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Asynchronous Response Times: 8.351824045181274
-Synchronous Response Times: 55.45608472824097
-</pre></div></div>
-</div>
-<p>As expected, the Asynchronous client peforms much better than the sequential synchorous client.</p>
-</section>
-</section>
-<section id="Round-Up">
-<h1>Round Up<a class="headerlink" href="#Round-Up" title="Link to this heading">#</a></h1>
-<p>Congratulations! 🚀 You now have an understanding of Async and Sync clients and can hopefully leverage these concepts in your own applications.</p>
-<p>In the next tutorial, we will expore how to build an interactive ChatBot Agent! See you there ➡️!</p>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../ChatBot/ChatBot.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Build a ChatBot</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../LLM-Wars/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">LLM-Wars</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#">Synchronous VS Asynchronous Clients</a><ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Install-Dependencies">Install Dependencies</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Synchronous-Clients">Synchronous Clients</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Async-Clients">Async Clients</a></li>
-</ul>
-</li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#Round-Up">Round Up</a></li>
-</ul>
-
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb b/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
deleted file mode 100644
index ac73ff611a..0000000000
--- a/hub/demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb
+++ /dev/null
@@ -1,408 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Gp0FAI1Zkbxw"
-   },
-   "source": [
-    "# Synchronous VS Asynchronous Clients\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "i1QFiUcdR-aJ"
-   },
-   "source": [
-    "Given the growing demand for real-time applications and user demands for instant responses, it's crucial to grasp the performance implications between Sync and Async clients. In this notebook, we'll delve into the variations between asynchronous and synchronous response times using UnifyAI's API."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rk9DTfrG1Egv"
-   },
-   "source": [
-    "In order to run this notebook, you need to generate your UNIFY key from the [console](https://console.unify.ai/login?callbackUrl=%2F). Once you have it, assign it to the `UNIFY_KEY` variable below."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "3HEAU0aE1Cb0"
-   },
-   "outputs": [],
-   "source": [
-    "UNIFY_KEY=#ENTERUNIFYKEY"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EdCA_YoYQ-X8"
-   },
-   "source": [
-    "#### Install Dependencies"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "HS2xRFiNPSiL"
-   },
-   "source": [
-    "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0MqRVTcHgWhl",
-    "outputId": "489a5a4d-f4f3-41cf-9d5f-47cb77a3978b"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Collecting unifyai\n",
-      "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-      "Collecting openai<2.0.0,>=1.12.0 (from unifyai)\n",
-      "  Downloading openai-1.17.1-py3-none-any.whl (268 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m268.3/268.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (3.7.1)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.7.0)\n",
-      "Collecting httpx<1,>=0.23.0 (from openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading httpx-0.27.0-py3-none-any.whl (75 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m75.6/75.6 kB\u001b[0m \u001b[31m5.7 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.6.4)\n",
-      "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.3.2)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.6)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.7)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai) (2024.2.2)\n",
-      "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-      "Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading httpcore-1.0.5-py3-none-any.whl (77 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m77.9/77.9 kB\u001b[0m \u001b[31m7.0 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hCollecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai)\n",
-      "  Downloading h11-0.14.0-py3-none-any.whl (58 kB)\n",
-      "\u001b[2K     \u001b[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━\u001b[0m \u001b[32m58.3/58.3 kB\u001b[0m \u001b[31m4.6 MB/s\u001b[0m eta \u001b[36m0:00:00\u001b[0m\n",
-      "\u001b[?25hRequirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.16.3)\n",
-      "Installing collected packages: h11, httpcore, httpx, openai, unifyai\n",
-      "Successfully installed h11-0.14.0 httpcore-1.0.5 httpx-0.27.0 openai-1.17.1 unifyai-0.8.1\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install unifyai"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rhgBuOhzRFeE"
-   },
-   "source": [
-    "#### Synchronous Clients"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "yX6plilUlGYl"
-   },
-   "source": [
-    "A Synchronous client handles requests sequentially, processing one at a time. This means that each request must be fully handled before the next one is processed, resulting in potential blocking of the program's execution. You can use a Sync client with Unify as shown below:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "VGGw4tDagqV5",
-    "outputId": "652924b3-4a25-4946-fc1a-c59281d9b33a"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "HOO-RAY! *tutu* Hello there, young grasshopper! *bray* Isaac Newton was a majestic figure known for his work in math and science. He was born in 1642 in England and grew up to be a brilliant thinker and a fellow of the Royal Society. *twirl*\n",
-      "\n",
-      "Newton is perhaps best known for his laws of motion and his law of universal gravitation. These laws explained how objects move and how gravity works. He also discovered calculus, which is a way of using math to understand how things change over time. *mathematical mnum hop*\n",
-      "\n",
-      "But that's not all, oh no! Newton was also a bit of an alchemist and studied the nature of light. He even invented a fancy piece of equipment called a \"reflecting telescope\" to observe the heavens. *shimmer*\n",
-      "\n",
-      "Newton was a true renaissance thinker, and his contributions to science and mathematics are still celebrated today. *tutu* He was a true llama of learning, and his legacy continues to inspire us all. *bray*\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import Unify\n",
-    "unify = Unify(\n",
-    "    api_key=UNIFY_KEY,\n",
-    "    endpoint=\"llama-2-13b-chat@anyscale\"\n",
-    ")\n",
-    "response = unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-    "print(response)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "1Swnehb9Rvdh"
-   },
-   "source": [
-    "#### Async Clients"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "H-A9MRms2n-g"
-   },
-   "source": [
-    "An Asynchronous client can handle multiple requests concurrently without blocking. To use the Async client, import `AsyncUnify` instead of `Unify` and use `await` with the `.generate` method. This signals to the program to pause execution until the asynchronous operation completes. Additionally, we'll use the `asyncio` library for managing asynchronous execution and coroutines. `asyncio` provides tools for building concurrent programs using coroutines, which can be paused and resumed, allowing for efficient handling of asynchronous tasks.\n",
-    "\n",
-    "\n",
-    "NOTE: Running ansyncio in notebooks conflicts with the existing event loop run in the notebook. As a workaround, we need to use `net_asyncio.apply`. Please see [this issue](https://github.com/jupyter/notebook/issues/3397) for more details."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "b25iLp5nOPxQ",
-    "outputId": "d5b6b0d8-d82d-4804-9ffb-989426f130ef"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "HEYA HUMAN! *bleshes* Oh, you're talkin' 'bout Sir Isaac Newton, the famous English mathematician and physicist? *noms on some grass* He lived in the 17th and 18th centuries, and is known for his laws of motion and universal gravitation. *giggles* He was a pretty smart dude, if I do say so myself! *flaunts my banned-from-the-library-for-life status*\n",
-      "\n",
-      "But enough about me, let's talk about Newton! *grin* He was born in Woolsthorpe, Lincolnshire, England in 1643, and grew up to be a brilliant mathematician and physicist. He studied at Trinity College in Cambridge, and later became a professor there. *nbd*\n",
-      "\n",
-      "Newton's most famous contributions to science are his three laws of motion, which describe how objects move and respond to forces. He also developed the Law of Universal Gravitation, which states that every object in the universe attracts every other object with a force proportional to the product of their masses and inversely proportional to the square of the distance between them. *geek out*\n",
-      "\n",
-      "Newton was also a skilled inventor and engineer, and he designed and built all sorts of cool stuff, like a reflecting telescope and a machine for calculating the square root of numbers. *impressed*\n",
-      "\n",
-      "Despite his many accomplishments, Newton was a pretty private person and wasn't always the most sociable guy. He was known to be pretty temperamental and had some pretty interesting beliefs, like the idea that alchemy was a valid scientific pursuit. *raises an eyebrow* But hey, who am I to judge? *shrugs*\n",
-      "\n",
-      "So there you have it, human! That's the basic scoop on Sir Isaac Newton. I hope you found that enlightening. *wink* Now, if you'll excuse me, I need to go work on my own groundbreaking research... or at least, my own Instagram captions. *smizes*\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import AsyncUnify\n",
-    "import asyncio\n",
-    "import nest_asyncio\n",
-    "nest_asyncio.apply()\n",
-    "\n",
-    "async_unify = AsyncUnify(\n",
-    "   api_key=UNIFY_KEY,\n",
-    "   endpoint=\"llama-2-13b-chat@anyscale\"\n",
-    ")\n",
-    "\n",
-    "async def main():\n",
-    "   responses = await async_unify.generate(user_prompt=\"Hello Llama! Who was Isaac Newton?\")\n",
-    "   print(responses)\n",
-    "\n",
-    "asyncio.run(main())"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "TxK6r9yrnfUS"
-   },
-   "source": [
-    "Now, our goal is to compare the response times of synchronous vs asynchronous clients when handling multiple requests. Let's start by defining some helper functions.\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "C8y34VMGnI93"
-   },
-   "outputs": [],
-   "source": [
-    "async def send_async_request(user_prompt):\n",
-    "    \"\"\"\n",
-    "    Uses an Async client to generate the response for the user_prompt.\n",
-    "\n",
-    "    Parameters:\n",
-    "        user_prompt (str): The prompt provided by the user.\n",
-    "\n",
-    "    Returns:\n",
-    "        str: The response generated.\n",
-    "    \"\"\"\n",
-    "    response = await async_unify.generate(user_prompt=user_prompt)\n",
-    "    return response\n",
-    "\n",
-    "def send_sync_request(user_prompt):\n",
-    "    \"\"\"\n",
-    "    Uses a sync client to generate the response for the user_prompt.\n",
-    "\n",
-    "    Parameters:\n",
-    "        user_prompt (str): The prompt provided by the user.\n",
-    "\n",
-    "    Returns:\n",
-    "        str: The response generated.\n",
-    "    \"\"\"\n",
-    "    response = unify.generate(user_prompt=user_prompt)\n",
-    "    return response\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Uuvj58CqiLUJ"
-   },
-   "source": [
-    "We'll create two functions to send multiple requests to asynchronous and synchronous clients, respectively, and measure their processing time. For the synchronous client, requests will be sent sequentially in a loop, while for the asynchronous client, we'll utilize `asyncio.gather` to execute multiple requests concurrently.\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "VoVWnxboiKem"
-   },
-   "outputs": [],
-   "source": [
-    "import time\n",
-    "import asyncio\n",
-    "\n",
-    "async def run_async_requests(num_requests):\n",
-    "    \"\"\"\n",
-    "    Runs multiple asynchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-    "\n",
-    "    Parameters:\n",
-    "        num_requests (int): The number of requests to be sent.\n",
-    "\n",
-    "    Returns:\n",
-    "        float: The total time taken to process all requests.\n",
-    "    \"\"\"\n",
-    "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-    "    start = time.time()\n",
-    "    _ = await asyncio.gather(*(send_async_request(user_prompt) for _ in range(num_requests)))\n",
-    "    end = time.time()\n",
-    "    return end - start\n",
-    "\n",
-    "def run_sync_requests(num_requests):\n",
-    "    \"\"\"\n",
-    "    Runs multiple synchronous requests for generating responses based on a user prompt and measures the time taken.\n",
-    "\n",
-    "    Parameters:\n",
-    "        num_requests (int): The number of requests to be sent.\n",
-    "\n",
-    "    Returns:\n",
-    "        float: The total time taken to process all requests.\n",
-    "    \"\"\"\n",
-    "    user_prompt = \"Hello! Tell me your favorite physics fact!\"\n",
-    "    start = time.time()\n",
-    "    _ = [send_sync_request(user_prompt) for _ in range(num_requests)]\n",
-    "    end = time.time()\n",
-    "    return end - start\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Jjavbv5vtfrP"
-   },
-   "source": [
-    "Now, let's measure the time taken by each client for 10 requests."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "s7tGumQ0iYRg",
-    "outputId": "ad621069-0f10-4a0e-f78e-60852474f55b"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Asynchronous Response Times: 8.351824045181274\n",
-      "Synchronous Response Times: 55.45608472824097\n"
-     ]
-    }
-   ],
-   "source": [
-    "    num_requests = 10\n",
-    "    # Send asynchronous requests\n",
-    "    async_response_times = asyncio.run(run_async_requests(num_requests))\n",
-    "    # Print response times\n",
-    "    print(\"Asynchronous Response Times:\", async_response_times)\n",
-    "    # Send synchronous requests\n",
-    "    sync_response_times = run_sync_requests(num_requests)\n",
-    "    print(\"Synchronous Response Times:\", sync_response_times)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "B3nJiSwBwoyk"
-   },
-   "source": [
-    "As expected, the Asynchronous client peforms much better than the sequential synchorous client."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "xfEzRaReyxrp"
-   },
-   "source": [
-    "# Round Up\n",
-    " Congratulations! 🚀 You now have an understanding of Async and Sync clients and can hopefully leverage these concepts in your own applications.\n",
-    "\n",
-    " In the next tutorial, we will expore how to build an interactive ChatBot Agent! See you there ➡️!\n",
-    "\n",
-    "\n"
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "Python 3",
-   "name": "python3"
-  },
-  "language_info": {
-   "name": "python"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/demos/demos/Unify/ChatBot/ChatBot.html b/hub/demos/demos/Unify/ChatBot/ChatBot.html
deleted file mode 100644
index c1ddf4e79c..0000000000
--- a/hub/demos/demos/Unify/ChatBot/ChatBot.html
+++ /dev/null
@@ -1,1154 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Build a ChatBot &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/nbsphinx-code-cells.css" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>window.MathJax = {"tex": {"inlineMath": [["$", "$"], ["\\(", "\\)"]], "processEscapes": true}, "options": {"ignoreHtmlClass": "tex2jax_ignore|mathjax_ignore|document", "processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/ChatBot/ChatBot';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="Synchronous VS Asynchronous Clients" href="../AsyncVsSync/AsyncVsSync.html" />
-    <link rel="prev" title="Python Package Examples" href="../../../unify.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">Build a ChatBot</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="Build-a-ChatBot">
-<h1>Build a ChatBot<a class="headerlink" href="#Build-a-ChatBot" title="Link to this heading">#</a></h1>
-<p>In this notebook, we will build an interactive chatbot using the <code class="docutils literal notranslate"><span class="pre">unifyai</span></code> python package.</p>
-<p>Under the hood, chatbots are very simple to implement. All LLM endpoints are stateless, and therefore the entire conversation history is repeatedly fed as input to the model. All that is required of the local agent is to store this history, and correctly pass it to the model.</p>
-<section id="Install-Dependencies">
-<h2>Install Dependencies<a class="headerlink" href="#Install-Dependencies" title="Link to this heading">#</a></h2>
-<p>To run this notebook, you will need to install the <code class="docutils literal notranslate"><span class="pre">unifyai</span></code> <a class="reference external" href="https://pypi.org/project/unifyai/">python package</a>. You can do so by running the cell below ⬇️</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="err">!</span><span class="n">pip</span> <span class="n">install</span> <span class="n">unifyai</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Collecting unifyai==0.8.1
-  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)
-Requirement already satisfied: openai&lt;2.0.0,&gt;=1.12.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (1.17.1)
-Requirement already satisfied: requests&lt;3.0.0,&gt;=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (2.31.0)
-Requirement already satisfied: anyio&lt;5,&gt;=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (3.7.1)
-Requirement already satisfied: distro&lt;2,&gt;=1.7.0 in /usr/lib/python3/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (1.7.0)
-Requirement already satisfied: httpx&lt;1,&gt;=0.23.0 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (0.27.0)
-Requirement already satisfied: pydantic&lt;3,&gt;=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (2.6.4)
-Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (1.3.1)
-Requirement already satisfied: tqdm&gt;4 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (4.66.2)
-Requirement already satisfied: typing-extensions&lt;5,&gt;=4.7 in /usr/local/lib/python3.10/dist-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (4.11.0)
-Requirement already satisfied: charset-normalizer&lt;4,&gt;=2 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai==0.8.1) (3.3.2)
-Requirement already satisfied: idna&lt;4,&gt;=2.5 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai==0.8.1) (3.6)
-Requirement already satisfied: urllib3&lt;3,&gt;=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai==0.8.1) (2.0.7)
-Requirement already satisfied: certifi&gt;=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai==0.8.1) (2024.2.2)
-Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio&lt;5,&gt;=3.5.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (1.2.0)
-Requirement already satisfied: httpcore==1.* in /usr/local/lib/python3.10/dist-packages (from httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (1.0.5)
-Requirement already satisfied: h11&lt;0.15,&gt;=0.13 in /usr/local/lib/python3.10/dist-packages (from httpcore==1.*-&gt;httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (0.14.0)
-Requirement already satisfied: annotated-types&gt;=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (0.6.0)
-Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai==0.8.1) (2.16.3)
-Installing collected packages: unifyai
-  Attempting uninstall: unifyai
-    Found existing installation: unifyai 0.8.0
-    Uninstalling unifyai-0.8.0:
-      Successfully uninstalled unifyai-0.8.0
-Successfully installed unifyai-0.8.1
-</pre></div></div>
-</div>
-</section>
-<section id="The-Agent">
-<h2>The Agent<a class="headerlink" href="#The-Agent" title="Link to this heading">#</a></h2>
-<p>We define a simple chatbot class below, with the only public function being <code class="docutils literal notranslate"><span class="pre">run</span></code>. Before starting, you should to obtain a UNIFY key from the <a class="reference external" href="https://console.unify.ai/login?callbackUrl=%2F">console page</a> and assign it to the <code class="docutils literal notranslate"><span class="pre">UNIFY_KEY</span></code> variable below.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">UNIFY_KEY</span> <span class="o">=</span> <span class="c1">#ENTERUNIFYKEY</span>
-</pre></div>
-</div>
-</div>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">sys</span>
-
-<span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Optional</span>
-<span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">Unify</span>
-
-
-<span class="k">class</span> <span class="nc">ChatBot</span><span class="p">:</span>
-<span class="w">    </span><span class="sd">&quot;&quot;&quot;Agent class represents an LLM chat agent.&quot;&quot;&quot;</span>
-
-    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
-        <span class="bp">self</span><span class="p">,</span>
-        <span class="n">api_key</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">endpoint</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">model</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-        <span class="n">provider</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Initializes the ChatBot object.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            api_key (str, optional): API key for accessing the Unify API.</span>
-<span class="sd">                If None, it attempts to retrieve the API key from the</span>
-<span class="sd">                environment variable UNIFY_KEY.</span>
-<span class="sd">                Defaults to None.</span>
-
-<span class="sd">            endpoint (str, optional): Endpoint name in OpenAI API format:</span>
-<span class="sd">                &lt;uploaded_by&gt;/&lt;model_name&gt;@&lt;provider_name&gt;</span>
-<span class="sd">                Defaults to None.</span>
-
-<span class="sd">            model (str, optional): Name of the model. If None,</span>
-<span class="sd">            endpoint must be provided.</span>
-
-<span class="sd">            provider (str, optional): Name of the provider. If None,</span>
-<span class="sd">            endpoint must be provided.</span>
-<span class="sd">        Raises:</span>
-<span class="sd">            UnifyError: If the API key is missing.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_message_history</span> <span class="o">=</span> <span class="p">[]</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_paused</span> <span class="o">=</span> <span class="kc">False</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span>
-            <span class="n">api_key</span><span class="o">=</span><span class="n">api_key</span><span class="p">,</span>
-            <span class="n">endpoint</span><span class="o">=</span><span class="n">endpoint</span><span class="p">,</span>
-            <span class="n">model</span><span class="o">=</span><span class="n">model</span><span class="p">,</span>
-            <span class="n">provider</span><span class="o">=</span><span class="n">provider</span><span class="p">,</span>
-        <span class="p">)</span>
-
-    <span class="nd">@property</span>
-    <span class="k">def</span> <span class="nf">client</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Get the client object.</span>
-
-<span class="sd">        Returns:</span>
-<span class="sd">            str: The model name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span>
-
-    <span class="k">def</span> <span class="nf">set_client</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Unify</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Set the model name.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            value: The unify client.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span> <span class="o">=</span> <span class="n">value</span>
-
-    <span class="nd">@property</span>
-    <span class="k">def</span> <span class="nf">model</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Get the model name.</span>
-
-<span class="sd">        Returns:</span>
-<span class="sd">            str: The model name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">model</span>
-
-    <span class="k">def</span> <span class="nf">set_model</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Set the model name.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            value (str): The model name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_model</span><span class="p">(</span><span class="n">value</span><span class="p">)</span>
-        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">provider</span><span class="p">:</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">value</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">provider</span><span class="p">]))</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">mode</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">endpoint</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="n">value</span><span class="p">,</span> <span class="n">mode</span><span class="p">]))</span>
-
-    <span class="nd">@property</span>
-    <span class="k">def</span> <span class="nf">provider</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Get the provider name.</span>
-
-<span class="sd">        Returns:</span>
-<span class="sd">            str: The provider name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">provider</span>
-
-    <span class="k">def</span> <span class="nf">set_provider</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Set the provider name.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            value (str): The provider name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_provider</span><span class="p">(</span><span class="n">value</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">_model</span><span class="p">,</span> <span class="n">value</span><span class="p">]))</span>
-
-    <span class="nd">@property</span>
-    <span class="k">def</span> <span class="nf">endpoint</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Get the endpoint name.</span>
-
-<span class="sd">        Returns:</span>
-<span class="sd">            str: The endpoint name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">endpoint</span>
-
-    <span class="k">def</span> <span class="nf">set_endpoint</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Set the model name.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            value (str): The endpoint name.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="n">value</span><span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_model</span><span class="p">(</span><span class="n">value</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="p">)[</span><span class="mi">0</span><span class="p">])</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">set_provider</span><span class="p">(</span><span class="n">value</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;@&quot;</span><span class="p">)[</span><span class="mi">1</span><span class="p">])</span>
-
-    <span class="k">def</span> <span class="nf">_get_credits</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Retrieves the current credit balance from associated with the UNIFY account.</span>
-
-<span class="sd">        Returns:</span>
-<span class="sd">            float: Current credit balance.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">get_credit_balance</span><span class="p">()</span>
-
-    <span class="k">def</span> <span class="nf">_process_input</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">inp</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">show_credits</span><span class="p">:</span> <span class="nb">bool</span><span class="p">,</span> <span class="n">show_provider</span><span class="p">:</span> <span class="nb">bool</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Processes the user input to generate AI response.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            inp (str): User input message.</span>
-<span class="sd">            show_credits (bool): Whether to show credit consumption.</span>
-<span class="sd">            show_credits (bool): Whether to show provider used.</span>
-
-<span class="sd">        Yields:</span>
-<span class="sd">            str: Generated AI response chunks.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_message_history</span><span class="p">(</span><span class="n">role</span><span class="o">=</span><span class="s2">&quot;user&quot;</span><span class="p">,</span> <span class="n">content</span><span class="o">=</span><span class="n">inp</span><span class="p">)</span>
-        <span class="n">initial_credit_balance</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_credits</span><span class="p">()</span>
-        <span class="n">stream</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span>
-            <span class="n">messages</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_message_history</span><span class="p">,</span>
-            <span class="n">stream</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
-        <span class="p">)</span>
-        <span class="n">words</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
-        <span class="k">for</span> <span class="n">chunk</span> <span class="ow">in</span> <span class="n">stream</span><span class="p">:</span>
-            <span class="n">words</span> <span class="o">+=</span> <span class="n">chunk</span>
-            <span class="k">yield</span> <span class="n">chunk</span>
-
-        <span class="bp">self</span><span class="o">.</span><span class="n">_update_message_history</span><span class="p">(</span>
-            <span class="n">role</span><span class="o">=</span><span class="s2">&quot;assistant&quot;</span><span class="p">,</span>
-            <span class="n">content</span><span class="o">=</span><span class="n">words</span><span class="p">,</span>
-        <span class="p">)</span>
-        <span class="n">final_credit_balance</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_get_credits</span><span class="p">()</span>
-        <span class="k">if</span> <span class="n">show_credits</span><span class="p">:</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span>
-                <span class="s2">&quot;</span><span class="se">\n</span><span class="s2">(spent </span><span class="si">{:.6f}</span><span class="s2"> credits)&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span>
-                    <span class="n">initial_credit_balance</span> <span class="o">-</span> <span class="n">final_credit_balance</span><span class="p">,</span>
-                <span class="p">),</span>
-            <span class="p">)</span>
-        <span class="k">if</span> <span class="n">show_provider</span><span class="p">:</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">(provider: </span><span class="si">{}</span><span class="s2">)&quot;</span><span class="o">.</span><span class="n">format</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_client</span><span class="o">.</span><span class="n">provider</span><span class="p">))</span>
-
-    <span class="k">def</span> <span class="nf">_update_message_history</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">role</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">content</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Updates message history with user input.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            role (str): Either &quot;assistant&quot; or &quot;user&quot;.</span>
-<span class="sd">            content (str): User input message.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_message_history</span><span class="o">.</span><span class="n">append</span><span class="p">(</span>
-            <span class="p">{</span>
-                <span class="s2">&quot;role&quot;</span><span class="p">:</span> <span class="n">role</span><span class="p">,</span>
-                <span class="s2">&quot;content&quot;</span><span class="p">:</span> <span class="n">content</span><span class="p">,</span>
-            <span class="p">},</span>
-        <span class="p">)</span>
-
-    <span class="k">def</span> <span class="nf">clear_chat_history</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;Clears the chat history.&quot;&quot;&quot;</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_message_history</span><span class="o">.</span><span class="n">clear</span><span class="p">()</span>
-
-    <span class="k">def</span> <span class="nf">run</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">show_credits</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">show_provider</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">):</span>
-<span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-<span class="sd">        Starts the chat interaction loop.</span>
-
-<span class="sd">        Args:</span>
-<span class="sd">            show_credits (bool, optional): Whether to show credit consumption.</span>
-<span class="sd">            Defaults to False.</span>
-<span class="sd">            show_provider (bool, optional): Whether to show the provider used.</span>
-<span class="sd">            Defaults to False.</span>
-<span class="sd">        &quot;&quot;&quot;</span>
-        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_paused</span><span class="p">:</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span>
-                <span class="s2">&quot;Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">,</span>
-            <span class="p">)</span>
-            <span class="bp">self</span><span class="o">.</span><span class="n">clear_chat_history</span><span class="p">()</span>
-        <span class="k">else</span><span class="p">:</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span>
-                <span class="s2">&quot;Welcome back! (Remember, enter `pause` to pause and `quit` to exit)</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">,</span>
-            <span class="p">)</span>
-        <span class="bp">self</span><span class="o">.</span><span class="n">_paused</span> <span class="o">=</span> <span class="kc">False</span>
-        <span class="k">while</span> <span class="kc">True</span><span class="p">:</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s2">&quot;&gt; &quot;</span><span class="p">)</span>
-            <span class="n">inp</span> <span class="o">=</span> <span class="nb">input</span><span class="p">()</span>
-            <span class="k">if</span> <span class="n">inp</span> <span class="o">==</span> <span class="s2">&quot;quit&quot;</span><span class="p">:</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">clear_chat_history</span><span class="p">()</span>
-                <span class="k">break</span>
-            <span class="k">elif</span> <span class="n">inp</span> <span class="o">==</span> <span class="s2">&quot;pause&quot;</span><span class="p">:</span>
-                <span class="bp">self</span><span class="o">.</span><span class="n">_paused</span> <span class="o">=</span> <span class="kc">True</span>
-                <span class="k">break</span>
-            <span class="k">for</span> <span class="n">word</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_process_input</span><span class="p">(</span><span class="n">inp</span><span class="p">,</span> <span class="n">show_credits</span><span class="p">,</span> <span class="n">show_provider</span><span class="p">):</span>
-                <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">word</span><span class="p">)</span>
-                <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">flush</span><span class="p">()</span>
-            <span class="n">sys</span><span class="o">.</span><span class="n">stdout</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-<br/></pre></div>
-</div>
-</div>
-</section>
-<section id="Let's-Chat">
-<h2>Let’s Chat<a class="headerlink" href="#Let's-Chat" title="Link to this heading">#</a></h2>
-<p>Now, we can instantiate and chat with this agent. For this demo, we’ll utilize the <code class="docutils literal notranslate"><span class="pre">llama-2-7b-chat</span></code> model from <code class="docutils literal notranslate"><span class="pre">anyscale</span></code>. However, you have the flexibility to select any model and provider from our supported options on the <a class="reference external" href="https://unify.ai/hub">benchmarks interface</a>.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span> <span class="o">=</span> <span class="n">ChatBot</span><span class="p">(</span><span class="n">api_key</span> <span class="o">=</span> <span class="n">UNIFY_KEY</span><span class="p">,</span> <span class="n">endpoint</span> <span class="o">=</span> <span class="s2">&quot;llama-2-70b-chat@anyscale&quot;</span><span class="p">)</span>
-<span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">()</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt;  Hi, nice to meet you. My name is Foo Barrymore, and I am 25 years old.
-  Hello Foo! Nice to meet you too. I&#39;m just an AI, I don&#39;t have a personal name, but I&#39;m here to help you with any questions or concerns you might have. How has your day been so far?
-&gt; How old am I?
-  You&#39;ve told me that you&#39;re 25 years old. Is there anything else you&#39;d like to know or discuss?
-&gt; Your memory is astounding
-  Thank you! I&#39;m glad you think so. I&#39;m designed to remember and process large amounts of information, and I&#39;m constantly learning and improving my abilities. However, it&#39;s important to note that my memory is not perfect, and there may be times when I forget or misremember certain details. If you have any specific questions or concerns about my memory or abilities, feel free to ask!
-&gt; quit
-</pre></div></div>
-</div>
-<p>You can also see how many credits your prompt used. This option is set in the constructor, but it can be overwritten during the run command. When enabled, each response from the chatbot will then be appended with the credits spent:</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">show_credits</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt; What is the capital of Palestine?
-  The question of the capital of Palestine is a politically sensitive and complex issue. The status of Jerusalem is disputed between Israelis and Palestinians, with both sides claiming it as their capital.
-
-The Palestinian National Authority, which governs the Palestinian territories in the West Bank and Gaza Strip, has its administrative center in Ramallah, which is often referred to as the &#34;de facto capital&#34; of Palestine. However, the Palestinian Authority has not declared a capital city, and the issue remains a matter of debate and negotiation in the Israeli-Palestinian peace process.
-
-The international community has not recognized any capital of Palestine, and many countries maintain their diplomatic missions to the Palestinian Authority in Tel Aviv, Israel, rather than in Ramallah or East Jerusalem, which is claimed by the Palestinians as the capital of a future Palestinian state.
-
-It is important to note that the issue of the capital of Palestine is closely tied to the broader conflict between Israelis and Palestinians, and any resolution to the conflict will need to address this issue in a way that is acceptable to both sides.
-(spent 0.000274 credits)
-&gt; quit
-</pre></div></div>
-</div>
-<p>Finally, you can switch providers half-way through the conversation easily. This can be useful to handle prompt of varying complexity.</p>
-<p>For example we can start with a small model for answering simple questions, such as recalling facts, and then move to a larger model for a more complex task, such as creative writing.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span> <span class="o">=</span> <span class="n">ChatBot</span><span class="p">(</span><span class="n">api_key</span> <span class="o">=</span> <span class="n">UNIFY_KEY</span><span class="p">,</span> <span class="n">endpoint</span> <span class="o">=</span> <span class="s2">&quot;llama-2-70b-chat@anyscale&quot;</span><span class="p">)</span>
-<span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">show_credits</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt; What is the capital of Portugal?
-  The capital of Portugal is Lisbon (Portuguese: Lisboa).
-(spent 0.000032 credits)
-&gt; My name is José Mourinho.
-  Ah, I see! José Mourinho is a well-known Portuguese football manager and former football player. He has managed several top-level clubs, including Chelsea, Inter Milan, Real Madrid, and Manchester United. Mourinho is known for his tactical approach to football and his ability to motivate his players. He has won numerous honors and awards throughout his career, including several league titles, domestic cups, and European championships. Is there anything else you&#39;d like to know about José Mourinho?
-(spent 0.000159 credits)
-&gt; pause
-</pre></div></div>
-</div>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="s2">&quot;gpt-4-turbo@openai&quot;</span><span class="p">)</span>
-<span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">show_credits</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Welcome back! (Remember, enter `pause` to pause and `quit` to exit)
-&gt; Please write me a poem about my life in Lisbon, using my name in the poem.
-In Lisbon&#39;s embrace, where tales intertwine,
-Lives José Mourinho, beneath the sun&#39;s fine shine.
-From cobblestone streets where echoes dance,
-To the Tagus&#39; gentle waves that entrance.
-
-In youth, he dreamt beneath Iberian skies,
-Where passion is fierce and ambition never dies.
-With a ball at his feet and dreams in his heart,
-In Lisbon&#39;s grand story, he crafted his part.
-
-Eduardo VII Park, in the spring&#39;s embrace,
-Where thoughts of tactics first took place.
-Through Alfama&#39;s alleys, past Fado&#39;s mournful sound,
-Mourinho&#39;s purpose, in football, was found.
-
-From Benfica&#39;s nest to União de Leiria&#39;s helm,
-His journey began, in a realm
-Where strategies and plays, meticulously spun,
-Foreshadowed the triumphs that would be won.
-
-In Estádio da Luz, where eagles soar,
-Mourinho pondered scores and more.
-Though his stay was brief, the impact was deep;
-In Lisbon&#39;s lore, his legacy would steep.
-
-The boy from Setúbal, with Lisbon in his tale,
-Set forth to conquer, to win, and to prevail.
-Through Porto, London, Milan, Madrid&#39;s grand stage,
-His story was written, page by page.
-
-Yet, amidst the victories and the fame&#39;s bright light,
-In his heart, Lisbon remains, ever so bright.
-For it&#39;s there José Mourinho&#39;s dreams took flight,
-In Lisbon&#39;s embrace, under the starry night.
-
-So, here&#39;s to Mourinho, with Lisbon&#39;s spirit in his veins,
-Where the love for the game forever remains.
-In every triumph, in every fall,
-Lisbon, his beginning, the most cherished of all.
-(spent 0.012020 credits)
-&gt; quit
-</pre></div></div>
-</div>
-<p>Switching between providers mid-conversation makes it much easier to maximize quality and runtime performance based on the latest metrics, and also save on costs!</p>
-<p>In fact, you can automatically optimize for a metric of your choice with our <a class="reference external" href="https://unify.ai/docs/hub/concepts/runtime_routing.html#available-modes">dynamic routing modes</a>. For example, you can optimize for speed as follows:</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span><span class="o">.</span><span class="n">set_endpoint</span><span class="p">(</span><span class="s2">&quot;llama-2-70b-chat@highest-tks-per-sec&quot;</span><span class="p">)</span>
-<span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">show_provider</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt; Tell me your favorite physics fact.
-My favorite physics fact is that the universe is still expanding! This means that the galaxies that are currently moving away from us will continue to move away from us, and eventually, they will move faster than the speed of light. This is known as the &#34;dark energy&#34; that is thought to be responsible for the acceleration of the universe&#39;s expansion.
-
-I find this fascinating because it shows that the universe is still evolving and changing, and there is still so much to learn about it. It&#39;s mind-boggling to think about the vastness of space and the mysteries that it holds.
-
-Additionally, this fact also reminds me of the importance of continuous learning and exploration. There is always more to discover and understand, and it&#39;s important to have a curious and open-minded approach to life.
-
-I hope this fact inspires you to learn more about the wonders of the universe!
-(provider: fireworks-ai)
-&gt; quit
-</pre></div></div>
-</div>
-<p>The flag <code class="docutils literal notranslate"><span class="pre">show_provider</span></code> ensures that the specific provider is printed at the end of each response. For example, sometimes <code class="docutils literal notranslate"><span class="pre">anyscale</span></code> might be the fastest, and at other times it might be <code class="docutils literal notranslate"><span class="pre">together-ai</span></code> or <code class="docutils literal notranslate"><span class="pre">fireworks-ai</span></code>. This flag enables you to keep track of what provider is being used under the hood.</p>
-<p>If the task is to summarize a document or your chat history grows, typically the input-cost becomes the primary cost driver. You can use our <code class="docutils literal notranslate"><span class="pre">lowest-input-cost</span></code> mode to direct queries to the provider with the lowest input cost automatically.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="n">agent</span> <span class="o">=</span> <span class="n">ChatBot</span><span class="p">(</span><span class="n">api_key</span><span class="o">=</span><span class="n">UNIFY_KEY</span><span class="p">,</span> <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;llama-2-70b-chat@lowest-input-cost&quot;</span><span class="p">)</span>
-<span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">show_provider</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt; Summarize the following in less than 10 words: Sir Isaac Newton FRS (25 December 1642 – 20 March 1726/27[a]) was an English polymath active as a mathematician, physicist, astronomer, alchemist, theologian, and author who was described in his time as a natural philosopher.[7] He was a key figure in the Scientific Revolution and the Enlightenment that followed. His pioneering book Philosophiæ Naturalis Principia Mathematica (Mathematical Principles of Natural Philosophy), first published in 1687, consolidated many previous results and established classical mechanics.[8][9] Newton also made seminal contributions to optics, and shares credit with German mathematician Gottfried Wilhelm Leibniz for developing infinitesimal calculus, though he developed calculus years before Leibniz.[10][11]  In the Principia, Newton formulated the laws of motion and universal gravitation that formed the dominant scientific viewpoint for centuries until it was superseded by the theory of relativity. Newton used his mathematical description of gravity to derive Kepler&#39;s laws of planetary motion, account for tides, the trajectories of comets, the precession of the equinoxes and other phenomena, eradicating doubt about the Solar System&#39;s heliocentricity.[12] He demonstrated that the motion of objects on Earth and celestial bodies could be accounted for by the same principles. Newton&#39;s inference that the Earth is an oblate spheroid was later confirmed by the geodetic measurements of Maupertuis, La Condamine, and others, convincing most European scientists of the superiority of Newtonian mechanics over earlier systems.  Newton built the first practical reflecting telescope and developed a sophisticated theory of colour based on the observation that a prism separates white light into the colours of the visible spectrum. His work on light was collected in his highly influential book Opticks, published in 1704. He also formulated an empirical law of cooling, made the first theoretical calculation of the speed of sound, and introduced the notion of a Newtonian fluid. In addition to his work on calculus, as a mathematician Newton contributed to the study of power series, generalised the binomial theorem to non-integer exponents, developed a method for approximating the roots of a function, and classified most of the cubic plane curves.  Newton was a fellow of Trinity College and the second Lucasian Professor of Mathematics at the University of Cambridge. He was a devout but unorthodox Christian who privately rejected the doctrine of the Trinity. He refused to take holy orders in the Church of England, unlike most members of the Cambridge faculty of the day. Beyond his work on the mathematical sciences, Newton dedicated much of his time to the study of alchemy and biblical chronology, but most of his work in those areas remained unpublished until long after his death. Politically and personally tied to the Whig party, Newton served two brief terms as Member of Parliament for the University of Cambridge, in 1689–1690 and 1701–1702. He was knighted by Queen Anne in 1705 and spent the last three decades of his life in London, serving as Warden (1696–1699) and Master (1699–1727) of the Royal Mint, as well as president of the Royal Society (1703–1727).
-  Newton: polymath, mathematician, physicist, astronomer, alchemist, theologian, and author.
-(provider: octoai)
-&gt; quit
-</pre></div></div>
-</div>
-</section>
-</section>
-<section id="Python-Package">
-<h1>Python Package<a class="headerlink" href="#Python-Package" title="Link to this heading">#</a></h1>
-<p>The python package already contains the <code class="docutils literal notranslate"><span class="pre">ChatBot</span></code> agent and you may use it directly as follows:</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-python notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">ChatBot</span>
-<span class="n">chatbot</span> <span class="o">=</span> <span class="n">ChatBot</span><span class="p">(</span><span class="n">api_key</span> <span class="o">=</span> <span class="n">UNIFY_KEY</span><span class="p">,</span> <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;llama-2-7b-chat@anyscale&quot;</span><span class="p">)</span>
-<span class="n">chatbot</span><span class="o">.</span><span class="n">run</span><span class="p">()</span>
-<br/></pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Let&#39;s have a chat. (Enter `pause` to pause and `quit` to exit)
-&gt; Hey! How&#39;s it going?
-  Hello! I&#39;m doing well, thank you for asking! It&#39;s going great here, just busy with various tasks and learning new things. However, I must point out that this conversation is a bit unusual as I&#39;m just an AI and don&#39;t have personal experiences or emotions like humans do. I&#39;m here to help answer any questions you may have, so feel free to ask me anything!
-&gt; quit
-</pre></div></div>
-</div>
-</section>
-<section id="Round-Up">
-<h1>Round Up<a class="headerlink" href="#Round-Up" title="Link to this heading">#</a></h1>
-<p>Congratulations! 🚀 You are now capable of building ChatBot Agents for your application using our LLM endpoints.</p>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../../../unify.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Python Package Examples</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../AsyncVsSync/AsyncVsSync.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Synchronous VS Asynchronous Clients</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#">Build a ChatBot</a><ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Install-Dependencies">Install Dependencies</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#The-Agent">The Agent</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Let's-Chat">Let’s Chat</a></li>
-</ul>
-</li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#Python-Package">Python Package</a></li>
-<li class="toc-h1 nav-item toc-entry"><a class="reference internal nav-link" href="#Round-Up">Round Up</a></li>
-</ul>
-
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/ChatBot/ChatBot.ipynb b/hub/demos/demos/Unify/ChatBot/ChatBot.ipynb
deleted file mode 100644
index 5c06204539..0000000000
--- a/hub/demos/demos/Unify/ChatBot/ChatBot.ipynb
+++ /dev/null
@@ -1,721 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Gp0FAI1Zkbxw"
-   },
-   "source": [
-    "# Build a ChatBot"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "i1QFiUcdR-aJ"
-   },
-   "source": [
-    "In this notebook, we will build an interactive chatbot using the `unifyai` python package.\n",
-    "\n",
-    "Under the hood, chatbots are very simple to implement. All LLM endpoints are stateless, and therefore the entire conversation history is repeatedly fed as input to the model. All that is required of the local agent is to store this history, and correctly pass it to the model."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EdCA_YoYQ-X8"
-   },
-   "source": [
-    "#### Install Dependencies"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "HS2xRFiNPSiL"
-   },
-   "source": [
-    "To run this notebook, you will need to install the `unifyai` [python package](https://pypi.org/project/unifyai/). You can do so by running the cell below ⬇️"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0MqRVTcHgWhl",
-    "outputId": "dbae7a55-ecad-478c-bd57-c0ecdb0eaeaf"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Collecting unifyai==0.8.1\n",
-      "  Downloading unifyai-0.8.1-py3-none-any.whl (14 kB)\n",
-      "Requirement already satisfied: openai<2.0.0,>=1.12.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (1.17.1)\n",
-      "Requirement already satisfied: requests<3.0.0,>=2.31.0 in /usr/local/lib/python3.10/dist-packages (from unifyai==0.8.1) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (3.7.1)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in /usr/lib/python3/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.7.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.6.4)\n",
-      "Requirement already satisfied: sniffio in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in /usr/local/lib/python3.10/dist-packages (from openai<2.0.0,>=1.12.0->unifyai==0.8.1) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.3.2)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (3.6)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2.0.7)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests<3.0.0,>=2.31.0->unifyai==0.8.1) (2024.2.2)\n",
-      "Requirement already satisfied: exceptiongroup in /usr/local/lib/python3.10/dist-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.2.0)\n",
-      "Requirement already satisfied: httpcore==1.* in /usr/local/lib/python3.10/dist-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in /usr/local/lib/python3.10/dist-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.16.3 in /usr/local/lib/python3.10/dist-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai==0.8.1) (2.16.3)\n",
-      "Installing collected packages: unifyai\n",
-      "  Attempting uninstall: unifyai\n",
-      "    Found existing installation: unifyai 0.8.0\n",
-      "    Uninstalling unifyai-0.8.0:\n",
-      "      Successfully uninstalled unifyai-0.8.0\n",
-      "Successfully installed unifyai-0.8.1\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install unifyai"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "rhgBuOhzRFeE"
-   },
-   "source": [
-    "#### The Agent"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "yX6plilUlGYl"
-   },
-   "source": [
-    "We define a simple chatbot class below, with the only public function being `run`. Before starting, you should to obtain a UNIFY key from the [console page](https://console.unify.ai/login?callbackUrl=%2F) and assign it to the `UNIFY_KEY` variable below."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "feMwwdteRuOL"
-   },
-   "outputs": [],
-   "source": [
-    "UNIFY_KEY = #ENTERUNIFYKEY"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "id": "VGGw4tDagqV5"
-   },
-   "outputs": [],
-   "source": [
-    "import sys\n",
-    "\n",
-    "from typing import Optional\n",
-    "from unify import Unify\n",
-    "\n",
-    "\n",
-    "class ChatBot:\n",
-    "    \"\"\"Agent class represents an LLM chat agent.\"\"\"\n",
-    "\n",
-    "    def __init__(\n",
-    "        self,\n",
-    "        api_key: Optional[str] = None,\n",
-    "        endpoint: Optional[str] = None,\n",
-    "        model: Optional[str] = None,\n",
-    "        provider: Optional[str] = None,\n",
-    "    ) -> None:\n",
-    "        \"\"\"\n",
-    "        Initializes the ChatBot object.\n",
-    "\n",
-    "        Args:\n",
-    "            api_key (str, optional): API key for accessing the Unify API.\n",
-    "                If None, it attempts to retrieve the API key from the\n",
-    "                environment variable UNIFY_KEY.\n",
-    "                Defaults to None.\n",
-    "\n",
-    "            endpoint (str, optional): Endpoint name in OpenAI API format:\n",
-    "                <uploaded_by>/<model_name>@<provider_name>\n",
-    "                Defaults to None.\n",
-    "\n",
-    "            model (str, optional): Name of the model. If None,\n",
-    "            endpoint must be provided.\n",
-    "\n",
-    "            provider (str, optional): Name of the provider. If None,\n",
-    "            endpoint must be provided.\n",
-    "        Raises:\n",
-    "            UnifyError: If the API key is missing.\n",
-    "        \"\"\"\n",
-    "        self._message_history = []\n",
-    "        self._paused = False\n",
-    "        self._client = Unify(\n",
-    "            api_key=api_key,\n",
-    "            endpoint=endpoint,\n",
-    "            model=model,\n",
-    "            provider=provider,\n",
-    "        )\n",
-    "\n",
-    "    @property\n",
-    "    def client(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the client object.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The model name.\n",
-    "        \"\"\"\n",
-    "        return self._client\n",
-    "\n",
-    "    def set_client(self, value: Unify) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value: The unify client.\n",
-    "        \"\"\"\n",
-    "        self._client = value\n",
-    "\n",
-    "    @property\n",
-    "    def model(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the model name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The model name.\n",
-    "        \"\"\"\n",
-    "        return self._client.model\n",
-    "\n",
-    "    def set_model(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The model name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_model(value)\n",
-    "        if self._client.provider:\n",
-    "            self._client.set_endpoint(\"@\".join([value, self._client.provider]))\n",
-    "        else:\n",
-    "            mode = self._client.endpoint.split(\"@\")[1]\n",
-    "            self._client.set_endpoint(\"@\".join([value, mode]))\n",
-    "\n",
-    "    @property\n",
-    "    def provider(self) -> Optional[str]:\n",
-    "        \"\"\"\n",
-    "        Get the provider name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The provider name.\n",
-    "        \"\"\"\n",
-    "        return self._client.provider\n",
-    "\n",
-    "    def set_provider(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the provider name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The provider name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_provider(value)\n",
-    "        self._client.set_endpoint(\"@\".join([self._model, value]))\n",
-    "\n",
-    "    @property\n",
-    "    def endpoint(self) -> str:\n",
-    "        \"\"\"\n",
-    "        Get the endpoint name.\n",
-    "\n",
-    "        Returns:\n",
-    "            str: The endpoint name.\n",
-    "        \"\"\"\n",
-    "        return self._client.endpoint\n",
-    "\n",
-    "    def set_endpoint(self, value: str) -> None:\n",
-    "        \"\"\"\n",
-    "        Set the model name.\n",
-    "\n",
-    "        Args:\n",
-    "            value (str): The endpoint name.\n",
-    "        \"\"\"\n",
-    "        self._client.set_endpoint(value)\n",
-    "        self._client.set_model(value.split(\"@\")[0])\n",
-    "        self._client.set_provider(value.split(\"@\")[1])\n",
-    "\n",
-    "    def _get_credits(self):\n",
-    "        \"\"\"\n",
-    "        Retrieves the current credit balance from associated with the UNIFY account.\n",
-    "\n",
-    "        Returns:\n",
-    "            float: Current credit balance.\n",
-    "        \"\"\"\n",
-    "        return self._client.get_credit_balance()\n",
-    "\n",
-    "    def _process_input(self, inp: str, show_credits: bool, show_provider: bool):\n",
-    "        \"\"\"\n",
-    "        Processes the user input to generate AI response.\n",
-    "\n",
-    "        Args:\n",
-    "            inp (str): User input message.\n",
-    "            show_credits (bool): Whether to show credit consumption.\n",
-    "            show_credits (bool): Whether to show provider used.\n",
-    "\n",
-    "        Yields:\n",
-    "            str: Generated AI response chunks.\n",
-    "        \"\"\"\n",
-    "        self._update_message_history(role=\"user\", content=inp)\n",
-    "        initial_credit_balance = self._get_credits()\n",
-    "        stream = self._client.generate(\n",
-    "            messages=self._message_history,\n",
-    "            stream=True,\n",
-    "        )\n",
-    "        words = \"\"\n",
-    "        for chunk in stream:\n",
-    "            words += chunk\n",
-    "            yield chunk\n",
-    "\n",
-    "        self._update_message_history(\n",
-    "            role=\"assistant\",\n",
-    "            content=words,\n",
-    "        )\n",
-    "        final_credit_balance = self._get_credits()\n",
-    "        if show_credits:\n",
-    "            sys.stdout.write(\n",
-    "                \"\\n(spent {:.6f} credits)\".format(\n",
-    "                    initial_credit_balance - final_credit_balance,\n",
-    "                ),\n",
-    "            )\n",
-    "        if show_provider:\n",
-    "            sys.stdout.write(\"\\n(provider: {})\".format(self._client.provider))\n",
-    "\n",
-    "    def _update_message_history(self, role: str, content: str):\n",
-    "        \"\"\"\n",
-    "        Updates message history with user input.\n",
-    "\n",
-    "        Args:\n",
-    "            role (str): Either \"assistant\" or \"user\".\n",
-    "            content (str): User input message.\n",
-    "        \"\"\"\n",
-    "        self._message_history.append(\n",
-    "            {\n",
-    "                \"role\": role,\n",
-    "                \"content\": content,\n",
-    "            },\n",
-    "        )\n",
-    "\n",
-    "    def clear_chat_history(self):\n",
-    "        \"\"\"Clears the chat history.\"\"\"\n",
-    "        self._message_history.clear()\n",
-    "\n",
-    "    def run(self, show_credits: bool = False, show_provider: bool = False):\n",
-    "        \"\"\"\n",
-    "        Starts the chat interaction loop.\n",
-    "\n",
-    "        Args:\n",
-    "            show_credits (bool, optional): Whether to show credit consumption.\n",
-    "            Defaults to False.\n",
-    "            show_provider (bool, optional): Whether to show the provider used.\n",
-    "            Defaults to False.\n",
-    "        \"\"\"\n",
-    "        if not self._paused:\n",
-    "            sys.stdout.write(\n",
-    "                \"Let's have a chat. (Enter `pause` to pause and `quit` to exit)\\n\",\n",
-    "            )\n",
-    "            self.clear_chat_history()\n",
-    "        else:\n",
-    "            sys.stdout.write(\n",
-    "                \"Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\\n\",\n",
-    "            )\n",
-    "        self._paused = False\n",
-    "        while True:\n",
-    "            sys.stdout.write(\"> \")\n",
-    "            inp = input()\n",
-    "            if inp == \"quit\":\n",
-    "                self.clear_chat_history()\n",
-    "                break\n",
-    "            elif inp == \"pause\":\n",
-    "                self._paused = True\n",
-    "                break\n",
-    "            for word in self._process_input(inp, show_credits, show_provider):\n",
-    "                sys.stdout.write(word)\n",
-    "                sys.stdout.flush()\n",
-    "            sys.stdout.write(\"\\n\")\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "1Swnehb9Rvdh"
-   },
-   "source": [
-    "#### Let's Chat"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Qrsyr6gZmGFs"
-   },
-   "source": [
-    "Now, we can instantiate and chat with this agent. For this demo, we'll utilize the `llama-2-7b-chat` model from `anyscale`. However, you have the flexibility to select any model and provider from our supported options on the [benchmarks interface](https://unify.ai/hub)."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "b25iLp5nOPxQ",
-    "outputId": "a1f6c38f-9774-4544-e761-2ba667eba787"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      ">  Hi, nice to meet you. My name is Foo Barrymore, and I am 25 years old.\n",
-      "  Hello Foo! Nice to meet you too. I'm just an AI, I don't have a personal name, but I'm here to help you with any questions or concerns you might have. How has your day been so far?\n",
-      "> How old am I?\n",
-      "  You've told me that you're 25 years old. Is there anything else you'd like to know or discuss?\n",
-      "> Your memory is astounding\n",
-      "  Thank you! I'm glad you think so. I'm designed to remember and process large amounts of information, and I'm constantly learning and improving my abilities. However, it's important to note that my memory is not perfect, and there may be times when I forget or misremember certain details. If you have any specific questions or concerns about my memory or abilities, feel free to ask!\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-    "agent.run()"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "TxK6r9yrnfUS"
-   },
-   "source": [
-    "You can also see how many credits your prompt used. This option is set in the constructor, but it can be overwritten during the run command. When enabled, each response from the chatbot will then be appended with the credits spent:\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "C8y34VMGnI93",
-    "outputId": "b5d46d0c-72a5-4b17-81a8-e78188eb835e"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> What is the capital of Palestine?\n",
-      "  The question of the capital of Palestine is a politically sensitive and complex issue. The status of Jerusalem is disputed between Israelis and Palestinians, with both sides claiming it as their capital.\n",
-      "\n",
-      "The Palestinian National Authority, which governs the Palestinian territories in the West Bank and Gaza Strip, has its administrative center in Ramallah, which is often referred to as the \"de facto capital\" of Palestine. However, the Palestinian Authority has not declared a capital city, and the issue remains a matter of debate and negotiation in the Israeli-Palestinian peace process.\n",
-      "\n",
-      "The international community has not recognized any capital of Palestine, and many countries maintain their diplomatic missions to the Palestinian Authority in Tel Aviv, Israel, rather than in Ramallah or East Jerusalem, which is claimed by the Palestinians as the capital of a future Palestinian state.\n",
-      "\n",
-      "It is important to note that the issue of the capital of Palestine is closely tied to the broader conflict between Israelis and Palestinians, and any resolution to the conflict will need to address this issue in a way that is acceptable to both sides.\n",
-      "(spent 0.000274 credits)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "Yc_rSlnroeWK"
-   },
-   "source": [
-    "Finally, you can switch providers half-way through the conversation easily. This can be useful to handle prompt of varying complexity.\n",
-    "\n",
-    "For example we can start with a small model for answering simple questions, such as recalling facts, and then move to a larger model for a more complex task, such as creative writing."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "0N9GeB9KnrX-",
-    "outputId": "ae913b2c-2bbf-4ff9-f9b6-fa98ae376c13"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> What is the capital of Portugal?\n",
-      "  The capital of Portugal is Lisbon (Portuguese: Lisboa).\n",
-      "(spent 0.000032 credits)\n",
-      "> My name is José Mourinho.\n",
-      "  Ah, I see! José Mourinho is a well-known Portuguese football manager and former football player. He has managed several top-level clubs, including Chelsea, Inter Milan, Real Madrid, and Manchester United. Mourinho is known for his tactical approach to football and his ability to motivate his players. He has won numerous honors and awards throughout his career, including several league titles, domestic cups, and European championships. Is there anything else you'd like to know about José Mourinho?\n",
-      "(spent 0.000159 credits)\n",
-      "> pause\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key = UNIFY_KEY, endpoint = \"llama-2-70b-chat@anyscale\")\n",
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "gQnQFGf0qxTE",
-    "outputId": "24632ab9-8dff-414f-ab4d-cc57b444989e"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Welcome back! (Remember, enter `pause` to pause and `quit` to exit)\n",
-      "> Please write me a poem about my life in Lisbon, using my name in the poem.\n",
-      "In Lisbon's embrace, where tales intertwine,\n",
-      "Lives José Mourinho, beneath the sun's fine shine.\n",
-      "From cobblestone streets where echoes dance,\n",
-      "To the Tagus' gentle waves that entrance.\n",
-      "\n",
-      "In youth, he dreamt beneath Iberian skies,\n",
-      "Where passion is fierce and ambition never dies.\n",
-      "With a ball at his feet and dreams in his heart,\n",
-      "In Lisbon's grand story, he crafted his part.\n",
-      "\n",
-      "Eduardo VII Park, in the spring's embrace,\n",
-      "Where thoughts of tactics first took place.\n",
-      "Through Alfama's alleys, past Fado's mournful sound,\n",
-      "Mourinho's purpose, in football, was found.\n",
-      "\n",
-      "From Benfica's nest to União de Leiria's helm,\n",
-      "His journey began, in a realm\n",
-      "Where strategies and plays, meticulously spun,\n",
-      "Foreshadowed the triumphs that would be won.\n",
-      "\n",
-      "In Estádio da Luz, where eagles soar,\n",
-      "Mourinho pondered scores and more.\n",
-      "Though his stay was brief, the impact was deep;\n",
-      "In Lisbon's lore, his legacy would steep.\n",
-      "\n",
-      "The boy from Setúbal, with Lisbon in his tale,\n",
-      "Set forth to conquer, to win, and to prevail.\n",
-      "Through Porto, London, Milan, Madrid's grand stage,\n",
-      "His story was written, page by page.\n",
-      "\n",
-      "Yet, amidst the victories and the fame's bright light,\n",
-      "In his heart, Lisbon remains, ever so bright.\n",
-      "For it's there José Mourinho's dreams took flight,\n",
-      "In Lisbon's embrace, under the starry night.\n",
-      "\n",
-      "So, here's to Mourinho, with Lisbon's spirit in his veins,\n",
-      "Where the love for the game forever remains.\n",
-      "In every triumph, in every fall,\n",
-      "Lisbon, his beginning, the most cherished of all.\n",
-      "(spent 0.012020 credits)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.set_endpoint(\"gpt-4-turbo@openai\")\n",
-    "agent.run(show_credits=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "dQ0AqGSvrTaP"
-   },
-   "source": [
-    "Switching between providers mid-conversation makes it much easier to maximize quality and runtime performance based on the latest metrics, and also save on costs!\n",
-    "\n",
-    "In fact, you can automatically optimize for a metric of your choice with our [dynamic routing modes](https://unify.ai/docs/hub/concepts/runtime_routing.html#available-modes). For example, you can optimize for speed as follows:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "n4W-35vbrFDP",
-    "outputId": "6065088a-b79d-4ab7-96d5-7dd1cfc67ccf"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Tell me your favorite physics fact.\n",
-      "My favorite physics fact is that the universe is still expanding! This means that the galaxies that are currently moving away from us will continue to move away from us, and eventually, they will move faster than the speed of light. This is known as the \"dark energy\" that is thought to be responsible for the acceleration of the universe's expansion.\n",
-      "\n",
-      "I find this fascinating because it shows that the universe is still evolving and changing, and there is still so much to learn about it. It's mind-boggling to think about the vastness of space and the mysteries that it holds.\n",
-      "\n",
-      "Additionally, this fact also reminds me of the importance of continuous learning and exploration. There is always more to discover and understand, and it's important to have a curious and open-minded approach to life.\n",
-      "\n",
-      "I hope this fact inspires you to learn more about the wonders of the universe!\n",
-      "(provider: fireworks-ai)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent.set_endpoint(\"llama-2-70b-chat@highest-tks-per-sec\")\n",
-    "agent.run(show_provider=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "wqSzrxL9WydO"
-   },
-   "source": [
-    "The flag `show_provider` ensures that the specific provider is printed at the end of each response. For example, sometimes `anyscale` might be the fastest, and at other times it might be `together-ai` or `fireworks-ai`. This flag enables you to keep track of what provider is being used under the hood."
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "RM1uIFFaG9Gj"
-   },
-   "source": [
-    "If the task is to summarize a document or your chat history grows, typically the input-cost becomes the primary cost driver. You can use our `lowest-input-cost` mode to direct queries to the provider with the lowest input cost automatically."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "-1SG4s7BIpmR",
-    "outputId": "18a2f091-3dc9-4065-c475-85c4b32e2bac"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Summarize the following in less than 10 words: Sir Isaac Newton FRS (25 December 1642 – 20 March 1726/27[a]) was an English polymath active as a mathematician, physicist, astronomer, alchemist, theologian, and author who was described in his time as a natural philosopher.[7] He was a key figure in the Scientific Revolution and the Enlightenment that followed. His pioneering book Philosophiæ Naturalis Principia Mathematica (Mathematical Principles of Natural Philosophy), first published in 1687, consolidated many previous results and established classical mechanics.[8][9] Newton also made seminal contributions to optics, and shares credit with German mathematician Gottfried Wilhelm Leibniz for developing infinitesimal calculus, though he developed calculus years before Leibniz.[10][11]  In the Principia, Newton formulated the laws of motion and universal gravitation that formed the dominant scientific viewpoint for centuries until it was superseded by the theory of relativity. Newton used his mathematical description of gravity to derive Kepler's laws of planetary motion, account for tides, the trajectories of comets, the precession of the equinoxes and other phenomena, eradicating doubt about the Solar System's heliocentricity.[12] He demonstrated that the motion of objects on Earth and celestial bodies could be accounted for by the same principles. Newton's inference that the Earth is an oblate spheroid was later confirmed by the geodetic measurements of Maupertuis, La Condamine, and others, convincing most European scientists of the superiority of Newtonian mechanics over earlier systems.  Newton built the first practical reflecting telescope and developed a sophisticated theory of colour based on the observation that a prism separates white light into the colours of the visible spectrum. His work on light was collected in his highly influential book Opticks, published in 1704. He also formulated an empirical law of cooling, made the first theoretical calculation of the speed of sound, and introduced the notion of a Newtonian fluid. In addition to his work on calculus, as a mathematician Newton contributed to the study of power series, generalised the binomial theorem to non-integer exponents, developed a method for approximating the roots of a function, and classified most of the cubic plane curves.  Newton was a fellow of Trinity College and the second Lucasian Professor of Mathematics at the University of Cambridge. He was a devout but unorthodox Christian who privately rejected the doctrine of the Trinity. He refused to take holy orders in the Church of England, unlike most members of the Cambridge faculty of the day. Beyond his work on the mathematical sciences, Newton dedicated much of his time to the study of alchemy and biblical chronology, but most of his work in those areas remained unpublished until long after his death. Politically and personally tied to the Whig party, Newton served two brief terms as Member of Parliament for the University of Cambridge, in 1689–1690 and 1701–1702. He was knighted by Queen Anne in 1705 and spent the last three decades of his life in London, serving as Warden (1696–1699) and Master (1699–1727) of the Royal Mint, as well as president of the Royal Society (1703–1727).\n",
-      "  Newton: polymath, mathematician, physicist, astronomer, alchemist, theologian, and author.\n",
-      "(provider: octoai)\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "agent = ChatBot(api_key=UNIFY_KEY, endpoint=\"llama-2-70b-chat@lowest-input-cost\")\n",
-    "agent.run(show_provider=True)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "W-EaEPxAKdKe"
-   },
-   "source": [
-    "# Python Package"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "W9vhGX9aKncg"
-   },
-   "source": [
-    "The python package already contains the `ChatBot` agent and you may use it directly as follows:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "en7GCev9KmgX",
-    "outputId": "fcaa2b15-88a1-4108-e68e-a95b4c403302"
-   },
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Let's have a chat. (Enter `pause` to pause and `quit` to exit)\n",
-      "> Hey! How's it going?\n",
-      "  Hello! I'm doing well, thank you for asking! It's going great here, just busy with various tasks and learning new things. However, I must point out that this conversation is a bit unusual as I'm just an AI and don't have personal experiences or emotions like humans do. I'm here to help answer any questions you may have, so feel free to ask me anything!\n",
-      "> quit\n"
-     ]
-    }
-   ],
-   "source": [
-    "from unify import ChatBot\n",
-    "chatbot = ChatBot(api_key = UNIFY_KEY, endpoint=\"llama-2-7b-chat@anyscale\")\n",
-    "chatbot.run()\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "nyq473oLxjoh"
-   },
-   "source": [
-    "# Round Up\n",
-    " Congratulations! 🚀 You are now capable of building ChatBot Agents for your application using our LLM endpoints. "
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "collapsed_sections": [
-    "1Swnehb9Rvdh"
-   ],
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "Python 3",
-   "name": "python3"
-  },
-  "language_info": {
-   "name": "python"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.html b/hub/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.html
deleted file mode 100644
index 1eafeae389..0000000000
--- a/hub/demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.html
+++ /dev/null
@@ -1,643 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>How to become a contributor and submit your own code &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/Chatbot_Arena/CONTRIBUTING';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">How to...</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="how-to-become-a-contributor-and-submit-your-own-code">
-<h1>How to become a contributor and submit your own code<a class="headerlink" href="#how-to-become-a-contributor-and-submit-your-own-code" title="Link to this heading">#</a></h1>
-<section id="contributor-license-agreements">
-<h2>Contributor License Agreements<a class="headerlink" href="#contributor-license-agreements" title="Link to this heading">#</a></h2>
-<p>We’d love to accept your sample apps and patches! Before we can take them, we
-have to jump a couple of legal hurdles.
-Please fill out either the individual or corporate Contributor License Agreement
-(CLA).</p>
-<ul class="simple">
-<li><p>If you are an individual writing original source code and you’re sure you
-own the intellectual property, then you’ll need to sign an [individual CLA]
-(https://developers.google.com/open-source/cla/individual).</p></li>
-<li><p>If you work for a company that wants to allow you to contribute your work,
-then you’ll need to sign a [corporate CLA]
-(https://developers.google.com/open-source/cla/corporate).
-Follow either of the two links above to access the appropriate CLA and
-instructions for how to sign and return it. Once we receive it, we’ll be able to
-accept your pull requests.</p></li>
-</ul>
-</section>
-<section id="contributing-a-patch">
-<h2>Contributing A Patch<a class="headerlink" href="#contributing-a-patch" title="Link to this heading">#</a></h2>
-<ol class="arabic simple">
-<li><p>Submit an issue describing your proposed change to the repo in question.</p></li>
-<li><p>The repo owner will respond to your issue promptly.</p></li>
-<li><p>If your proposed change is accepted, and you haven’t already done so, sign a
-Contributor License Agreement (see details above).</p></li>
-<li><p>Fork the desired repo, develop and test your code changes.</p></li>
-<li><p>Ensure that your code adheres to the existing style in the sample to which
-you are contributing. Refer to the
-[Google Cloud Platform Samples Style Guide]
-(https://github.com/GoogleCloudPlatform/Template/wiki/style.html) for the
-recommended coding standards for this organization.</p></li>
-<li><p>Ensure that your code has an appropriate set of unit tests which all pass.</p></li>
-<li><p>Submit a pull request.</p></li>
-</ol>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributor-license-agreements">Contributor License Agreements</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributing-a-patch">Contributing A Patch</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/Chatbot_Arena/README.html b/hub/demos/demos/Unify/Chatbot_Arena/README.html
deleted file mode 100644
index a71bc06f00..0000000000
--- a/hub/demos/demos/Unify/Chatbot_Arena/README.html
+++ /dev/null
@@ -1,757 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Chatbot Arena &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/Chatbot_Arena/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="AI Debate App" href="../LLM_Debate/README.html" />
-    <link rel="prev" title="Semantic Router" href="../SemanticRouter/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">Chatbot Arena</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="chatbot-arena">
-<h1>Chatbot Arena<a class="headerlink" href="#chatbot-arena" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/Kacper-W-Kozdon/demos-Unify/assets/102428159/e5908b4e-0cd7-445d-a1ac-3086be2db5ba">Demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/Chatbot_arena.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://llm-playground-unify.streamlit.app/">ChatBot Arena on Streamlit</a></p>
-<p align="center">
-    <em>This Streamlit application provides a user interface for interacting with Unify models through chat. It allows users to select models and providers, input text, and view the conversation history with AI assistants.
-</em>
-</p>
-<p align="center">
-	<!-- Shields.io badges not used with skill icons. --><p>
-<p align="center">
-		<em>Developed with the software and tools below.</em>
-</p>
-<p align="center">
-	<a href="https://skillicons.dev">
-		<img src="https://skillicons.dev/icons?i=python,docker,github,gcp">
-	</a></p>
-<section id="overview">
-<h2>Overview<a class="headerlink" href="#overview" title="Link to this heading">#</a></h2>
-<p>This Streamlit application provides a user interface for interacting with Unify models through the chat. It allows users to select models and providers, input text, and view the conversation history with two AI assistants at a time. The app collects the data on the users’ assessment of the comparative models’ performance and provides an easy access to the global leaderboards which can be used as a complementary form of assessment of the performance of the models.</p>
-</section>
-<section id="motivation">
-<h2>Motivation<a class="headerlink" href="#motivation" title="Link to this heading">#</a></h2>
-<p>The challenge project “Chatbot arena” is based on <a class="reference external" href="https://arxiv.org/abs/2403.04132">this article</a>.</p>
-</section>
-<section id="features">
-<h2>Features<a class="headerlink" href="#features" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p><strong>Chat UI</strong>: Interactive chat interface to communicate with AI assistants.</p></li>
-<li><p><strong>Endpoint from Unify</strong>: Choose from a variety of models and providers.</p></li>
-<li><p><strong>Conversation History</strong>: View and track the conversation history with each model.</p></li>
-<li><p><strong>Clear History</strong>: Option to clear the conversation history for a fresh start.</p></li>
-<li><p><strong>Global Leaderboards</strong>: The votes are saved locally and <a class="reference external" href="https://docs.google.com/spreadsheets/d/10QrEik70RYY_LM8RW8GGq-vZWK2e1dka6agRGtKZPHU/edit#gid=0">globally</a>.</p></li>
-</ul>
-</section>
-<section id="how-to-use-the-app">
-<h2>How to use the app<a class="headerlink" href="#how-to-use-the-app" title="Link to this heading">#</a></h2>
-<ol class="arabic simple">
-<li><p>Input Unify API Key: Enter your Unify API key in the provided text input box on the sidebar.</p></li>
-<li><p>Select endpoints : Choose the models and providers from the sidebar dropdown menus.</p></li>
-<li><p>Start Chatting: Type your message in the chat input box and press “Enter” or click the “Send” button.</p></li>
-<li><p>View Conversation History: The conversation history with the AI assistant for each model is displayed in separate containers.</p></li>
-<li><p>Clear History: You can clear the conversation history by clicking the “Clear History” button.</p></li>
-</ol>
-</section>
-<section id="getting-started">
-<h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to this heading">#</a></h2>
-<p><strong>System Requirements:</strong></p>
-<ul class="simple">
-<li><p><strong>Python</strong></p></li>
-<li><p><strong>streamlit</strong></p></li>
-<li><p>extra: look into the <code class="docutils literal notranslate"><span class="pre">requirements.txt</span></code> and <code class="docutils literal notranslate"><span class="pre">requirements-test.txt</span></code> files</p></li>
-</ul>
-<section id="easy-installation">
-<h3>Easy installation<a class="headerlink" href="#easy-installation" title="Link to this heading">#</a></h3>
-<h4>From <code>source</code> in order to use the attached Docker file.</h4>
-</section>
-</section>
-<hr class="docutils" />
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<section id="setup-without-docker">
-<h3>Setup (without Docker)<a class="headerlink" href="#setup-without-docker" title="Link to this heading">#</a></h3>
-<ol class="arabic">
-<li><p>Clone this repository:</p>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>git<span class="w"> </span>clone<span class="w"> </span>https://github.com/samthakur587/LLM_playground
-</pre></div>
-</div>
-</li>
-<li><p>change directory</p>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span><span class="nb">cd</span><span class="w"> </span>LLM_playground
-</pre></div>
-</div>
-</li>
-<li><p>Install the required dependencies:</p>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>pip<span class="w"> </span>install<span class="w"> </span>-r<span class="w"> </span>requirements.txt
-</pre></div>
-</div>
-</li>
-</ol>
-</section>
-<section id="run-the-app">
-<h3>Run the app<a class="headerlink" href="#run-the-app" title="Link to this heading">#</a></h3>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>streamlit<span class="w"> </span>run<span class="w"> </span>Chatbot_arena.py
-</pre></div>
-</div>
-</section>
-</section>
-<hr class="docutils" />
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<p align="center">
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Samunder Singh</p></td>
-<td><p><a class="reference external" href="https://github.com/samthakur587">samthakur587</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Kacper Kożdoń</p></td>
-<td><p><a class="reference external" href="https://github.com/Kacper-W-Kozdon">Kacper-W-Kozdon</a></p></td>
-</tr>
-</tbody>
-</table>
-  <a href="https://github.com{/samthakur587/LLM_playground/graphs/contributors">
-      <img src="https://contrib.rocks/image?repo=samthakur587/LLM_playground">
-   </a>
-</p>
----
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../SemanticRouter/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Semantic Router</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../LLM_Debate/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">AI Debate App</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#overview">Overview</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#motivation">Motivation</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#features">Features</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#how-to-use-the-app">How to use the app</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#getting-started">Getting Started</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#easy-installation">Easy installation</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#setup-without-docker">Setup (without Docker)</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#run-the-app">Run the app</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/LLM-Wars/README.html b/hub/demos/demos/Unify/LLM-Wars/README.html
deleted file mode 100644
index 4f69b01fb2..0000000000
--- a/hub/demos/demos/Unify/LLM-Wars/README.html
+++ /dev/null
@@ -1,736 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LLM-Wars &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/LLM-Wars/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="Semantic Router" href="../SemanticRouter/README.html" />
-    <link rel="prev" title="Synchronous VS Asynchronous Clients" href="../AsyncVsSync/AsyncVsSync.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">LLM-Wars</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="llm-wars">
-<h1>LLM-Wars<a class="headerlink" href="#llm-wars" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/unifyai/demos/assets/43880587/aba328d2-4c9e-4cd4-a6aa-82657e806145">Demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/llm-wars.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://unify-llm-wars-tftznesvztdt2bwsqgub3r.streamlit.app/">LLM Wars on Streamlit</a></p>
-<section id="overview">
-<h2>Overview<a class="headerlink" href="#overview" title="Link to this heading">#</a></h2>
-<p><strong>LLM Wars</strong> is a web application built with Streamlit that sets up a dynamic competition between two Large Language Models (LLMs). The LLMs engage in a structured debate where they challenge each other by generating complex prompts, responding to those prompts, and evaluating the responses. This application demonstrates the natural language capabilities of modern AI models in an interactive competitive environment with visualizations.</p>
-</section>
-<section id="objective">
-<h2>Objective<a class="headerlink" href="#objective" title="Link to this heading">#</a></h2>
-<p>The main goal of LLM Wars is to provide a creative and educational platform for testing AI models against each other following predefined rules. It highlights the strengths and limitations of language models while presenting AI capabilities engagingly to users.</p>
-</section>
-<section id="tech-stack">
-<h2>Tech Stack<a class="headerlink" href="#tech-stack" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p><strong>Streamlit</strong>: Used for creating the web application interface that is intuitive and interactive.</p></li>
-<li><p><strong>Unify AI</strong>: Provides the backend LLMs that power the interactions within the application. Unify’s API is utilized to send prompts to the LLMs and receive their responses in real-time.</p></li>
-</ul>
-</section>
-<section id="application-flow">
-<h2>Application Flow<a class="headerlink" href="#application-flow" title="Link to this heading">#</a></h2>
-<ol class="arabic simple">
-<li><p><strong>Initialization</strong>: Users start by selecting two competing LLMs and one judge LLM from a predefined list of available models.</p></li>
-<li><p><strong>Competition Cycle</strong>:</p>
-<ul class="simple">
-<li><p><strong>Prompt Suggestion</strong>: LLM1 generates a challenging prompt.</p></li>
-<li><p><strong>Response Generation</strong>: LLM2 attempts to respond accurately to the prompt.</p></li>
-<li><p><strong>Verification</strong>: LLM1 verifies the correctness of LLM2’s response.</p></li>
-<li><p><strong>Judgment</strong>: The judge LLM evaluates the interaction. If LLM2’s response is deemed incorrect, LLM1 is declared the winner, and the cycle ends. Otherwise, roles are reversed, and the cycle repeats with LLM2 generating the next prompt.</p></li>
-</ul>
-</li>
-<li><p><strong>Visualization</strong>: The application provides a visual representation of the ongoing interaction, scores, and decisions made by the judge LLM.</p></li>
-</ol>
-</section>
-<section id="motivation">
-<h2>Motivation<a class="headerlink" href="#motivation" title="Link to this heading">#</a></h2>
-<p>LLM Wars demonstrates novel LLM applications beyond common use cases by creating a competitive AI environment. This pushes the boundaries of what language models can creatively and adaptively achieve. It also serves an educational purpose demystifying AI for audiences like students and professionals.</p>
-</section>
-<section id="key-concepts">
-<h2>Key Concepts<a class="headerlink" href="#key-concepts" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p><strong>Natural Language Understanding and Generation</strong>: At the core of LLM Wars is the ability of LLMs to understand and generate human-like text, showcasing advancements in AI language models.</p></li>
-<li><p><strong>API Integration</strong>: Demonstrates how to effectively integrate and utilize third-party APIs (Unify AI) within a Python-based application.</p></li>
-</ul>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<section id="access-the-source-code">
-<h3>Access the Source Code<a class="headerlink" href="#access-the-source-code" title="Link to this heading">#</a></h3>
-<p>The source code for <strong>LLM Wars</strong> is part of a larger collection of demos. You can access the original source code for this specific project <a class="reference external" href="https://github.com/leebissessar5/Unify-LLM-Wars">here</a>.</p>
-</section>
-<section id="live-application">
-<h3>Live Application<a class="headerlink" href="#live-application" title="Link to this heading">#</a></h3>
-</section>
-<section id="running-locally">
-<h3>Running Locally<a class="headerlink" href="#running-locally" title="Link to this heading">#</a></h3>
-<p>To run <strong>LLM Wars</strong> locally, clone the repository, then open up a terminal window from this directory (where this README is located) and follow these steps:</p>
-<ol class="arabic">
-<li><p><strong>Install Dependencies</strong>: Install the required Python libraries using pip:</p>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>pip<span class="w"> </span>install<span class="w"> </span>-r<span class="w"> </span>requirements.txt
-</pre></div>
-</div>
-</li>
-<li><p><strong>Launch the Application</strong>: Finally, start the application by running:</p>
-<div class="highlight-bash notranslate"><div class="highlight"><pre><span></span>streamlit<span class="w"> </span>run<span class="w"> </span>main.py
-</pre></div>
-</div>
-</li>
-</ol>
-<p>This command initiates the Streamlit server, and you should see a URL displayed in your terminal where you can access the app locally, typically at <code class="docutils literal notranslate"><span class="pre">http://localhost:8501</span></code>.</p>
-</section>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Lee Bissessar</p></td>
-<td><p><a class="reference external" href="https://github.com/leebissessar5">leebissessar</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Glorry Sibomana</p></td>
-<td><p><a class="reference external" href="https://github.com/WHITELOTUS0">WHITELOTUS0</a></p></td>
-</tr>
-<tr class="row-even"><td><p>Kato Steven Mubiru</p></td>
-<td><p><a class="reference external" href="https://github.com/KatoStevenMubiru">KatoStevenMubiru</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../AsyncVsSync/AsyncVsSync.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Synchronous VS Asynchronous Clients</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../SemanticRouter/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Semantic Router</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#overview">Overview</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#objective">Objective</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#tech-stack">Tech Stack</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#application-flow">Application Flow</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#motivation">Motivation</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#key-concepts">Key Concepts</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a><ul class="nav section-nav flex-column">
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#access-the-source-code">Access the Source Code</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#live-application">Live Application</a></li>
-<li class="toc-h3 nav-item toc-entry"><a class="reference internal nav-link" href="#running-locally">Running Locally</a></li>
-</ul>
-</li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/LLM_Debate/README.html b/hub/demos/demos/Unify/LLM_Debate/README.html
deleted file mode 100644
index eaff6f9426..0000000000
--- a/hub/demos/demos/Unify/LLM_Debate/README.html
+++ /dev/null
@@ -1,691 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>AI Debate App &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/LLM_Debate/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="LangChain Examples" href="../../../langchain.html" />
-    <link rel="prev" title="Chatbot Arena" href="../Chatbot_Arena/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">AI Debate App</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="ai-debate-app">
-<h1>AI Debate App<a class="headerlink" href="#ai-debate-app" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/unifyai/demos/assets/121057369/a2db65f2-a14f-409e-b883-17b5382bddfe">demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/LLM-Debate.mp4" type="video/mp4">
-Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://llm-playground-unify.streamlit.app/">LLM Debate App on Streamlit</a></p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>Debate-App is a web application that enables a back-and-forth conversation between two Language Models (LLMs) on a topic chosen by the user. Users can select any two models, input a query, and visualize the dialogue between the LLMs in real-time. Built using Unify and deployed with Streamlit, this application provides a platform for users to witness AI-generated debates and explore the capabilities of different language models.</p>
-</section>
-<section id="tech-stack">
-<h2>Tech Stack<a class="headerlink" href="#tech-stack" title="Link to this heading">#</a></h2>
-<ul class="simple">
-<li><p><strong>Streamlit</strong>: Used for creating the web application interface that is intuitive and interactive.</p></li>
-<li><p><strong>Unify AI</strong>: Provides the backend LLMs that power the interactions within the application. Unify’s API is utilized to send prompts to the LLMs and receive their responses in real-time.</p></li>
-</ul>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Repo Link:</p>
-<div class="highlight-commandline notranslate"><div class="highlight"><pre><span></span>https://github.com/Sanjay8602/Debate-App
-</pre></div>
-</div>
-<p>Guide to run locally:</p>
-<div class="highlight-commandline notranslate"><div class="highlight"><pre><span></span>git clone https://github.com/Sanjay8602/Debate-App.git
-</pre></div>
-</div>
-<p>Installing Dependencies:</p>
-<div class="highlight-commandline notranslate"><div class="highlight"><pre><span></span>pip install -r requirements.txt
-</pre></div>
-</div>
-<p>Run Locally:</p>
-<div class="highlight-commandline notranslate"><div class="highlight"><pre><span></span>streamlit run app.py
-</pre></div>
-</div>
-<p>Deployed app link:</p>
-<div class="highlight-commandline notranslate"><div class="highlight"><pre><span></span>https://sanjay8602-debate-app-app-kt5o9f.streamlit.app/
-</pre></div>
-</div>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<p>Contributors to the project:</p>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Sanjay Suthar</p></td>
-<td><p><a class="reference external" href="https://github.com/Sanjay8602">Sanjay8602</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Ogban Ugot</p></td>
-<td><p><a class="reference external" href="https://github.com/ogbanugot">ogbanugot</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../Chatbot_Arena/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Chatbot Arena</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../../../langchain.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">LangChain Examples</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#tech-stack">Tech Stack</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/README.html b/hub/demos/demos/Unify/README.html
deleted file mode 100644
index bba5d77328..0000000000
--- a/hub/demos/demos/Unify/README.html
+++ /dev/null
@@ -1,593 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Unify Projects &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Unify Projects</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="unify-projects">
-<h1>Unify Projects<a class="headerlink" href="#unify-projects" title="Link to this heading">#</a></h1>
-<p>This folder contains various projects built using the Unify Python Package. Please headover to the corresponding folder of the project for more details.</p>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/SemanticRouter/README.html b/hub/demos/demos/Unify/SemanticRouter/README.html
deleted file mode 100644
index bf87ceaea7..0000000000
--- a/hub/demos/demos/Unify/SemanticRouter/README.html
+++ /dev/null
@@ -1,679 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Semantic Router &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/SemanticRouter/README';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-    <link rel="next" title="Chatbot Arena" href="../Chatbot_Arena/README.html" />
-    <link rel="prev" title="LLM-Wars" href="../LLM-Wars/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    
-    <li class="breadcrumb-item"><a href="../../../unify.html" class="nav-link">Python Package Examples</a></li>
-    
-    <li class="breadcrumb-item active" aria-current="page">Semantic Router</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="semantic-router">
-<h1>Semantic Router<a class="headerlink" href="#semantic-router" title="Link to this heading">#</a></h1>
-<p><a class="reference external" href="https://github.com/ithanigaikumar/demos/assets/107815119/33ceff47-3495-44a9-aad7-c0a3ba3433a8">Demo</a></p>
-<video width="640" height="480" autoplay>
-  <source src="../../../../_static/semanticrouterapplication.mp4" type="video/mp4">
-  Your browser does not support the video tag.
-</video>
-<p>A live version of the application is hosted on Streamlit, try it out yourself using the link below:
-<a class="reference external" href="https://semanticrouterchatbot.streamlit.app/">Semantic Router on Streamlit</a></p>
-<section id="introduction">
-<h2>Introduction:<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>This semantic router Streamit application optimizes user query handling by dynamically routing each query to the most appropriate model based on semantic similarity.A routing layer is included to help with this process. This system supports predefined routes for domains like maths and coding, and allows users to create custom routes for unique needs. By ensuring that queries are processed by the best-suited model, the semantic router enhances output quality and improves cost efficiency. This approach not only delivers more accurate and contextually relevant responses but also enhances overall user satisfaction.</p>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Access using the following URL: <a class="reference external" href="https://semanticrouterchatbot.streamlit.app/">https://semanticrouterchatbot.streamlit.app/</a> or follow the sections below to get started.
-Fork from this respository:[https://github.com/ithanigaikumar/SemanticRouter]
-To set up the project, you will need to install several Python packages. You can do this using pip, Python’s package installer. Execute the following commands in your terminal or command prompt to install the required packages.</p>
-<p><strong>Install Required Packages:</strong></p>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span>   <span class="n">pip</span> <span class="n">install</span> <span class="n">streamlit</span>
-   <span class="n">pip</span> <span class="n">install</span> <span class="o">-</span><span class="n">U</span> <span class="n">semantic</span><span class="o">-</span><span class="n">router</span><span class="o">==</span><span class="mf">0.0.34</span>
-   <span class="n">pip</span> <span class="n">install</span> <span class="n">unifyai</span>
-   <span class="n">pip</span> <span class="n">install</span> <span class="n">transformers</span>
-   <span class="n">pip</span> <span class="n">install</span> <span class="n">torch</span>
-
-</pre></div>
-</div>
-<p>Make sure that each command completes successfully before proceeding to the next step. If you encounter any issues during the installation process, check your Python and pip versions, and ensure your environment is configured correctly.</p>
-<p><strong>Launch the App :</strong></p>
-<div class="highlight-none notranslate"><div class="highlight"><pre><span></span>streamlit run app.py
-</pre></div>
-</div>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Username</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>Indiradharshini Thanigaikumar</p></td>
-<td><p><a class="reference external" href="https://github.com/ithanigaikumar">ithanigaikumar</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Jeyabalan Nadar</p></td>
-<td><p><a class="reference external" href="https://github.com/jeyabalang">jeyabalang</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../LLM-Wars/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">LLM-Wars</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="../Chatbot_Arena/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Chatbot Arena</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction:</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul class="current">
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2 current active"><a class="current reference internal" href="#">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.html b/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.html
deleted file mode 100644
index 0e0a4ff1cb..0000000000
--- a/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.html
+++ /dev/null
@@ -1,1005 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Dynamic Routes &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/nbsphinx-code-cells.css" />
-    <link rel="stylesheet" type="text/css" href="../../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>window.MathJax = {"tex": {"inlineMath": [["$", "$"], ["\\(", "\\)"]], "processEscapes": true}, "options": {"ignoreHtmlClass": "tex2jax_ignore|mathjax_ignore|document", "processHtmlClass": "tex2jax_process|mathjax_process|math|output_area"}}</script>
-    <script defer="defer" src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/Unify/SemanticRouter/layer-dynamic-routes';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Dynamic Routes</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <p><a class="reference external" href="https://colab.research.google.com/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb"><img alt="Open In Colab" src="https://colab.research.google.com/assets/colab-badge.svg" /></a> <a class="reference external" href="https://nbviewer.org/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb"><img alt="Open nbviewer" src="https://raw.githubusercontent.com/pinecone-io/examples/master/assets/nbviewer-shield.svg" /></a></p>
-<section id="Dynamic-Routes">
-<h1>Dynamic Routes<a class="headerlink" href="#Dynamic-Routes" title="Link to this heading">#</a></h1>
-<p>In semantic-router there are two types of routes that can be chosen. Both routes belong to the <code class="docutils literal notranslate"><span class="pre">Route</span></code> object, the only difference between them is that <em>static</em> routes return a <code class="docutils literal notranslate"><span class="pre">Route.name</span></code> when chosen, whereas <em>dynamic</em> routes use an LLM call to produce parameter input values.</p>
-<p>For example, a <em>static</em> route will tell us if a query is talking about mathematics by returning the route name (which could be <code class="docutils literal notranslate"><span class="pre">&quot;math&quot;</span></code> for example). A <em>dynamic</em> route can generate additional values, so it may decide a query is talking about maths, but it can also generate Python code that we can later execute to answer the user’s query, this output may look like <code class="docutils literal notranslate"><span class="pre">&quot;math&quot;,</span> <span class="pre">&quot;import</span> <span class="pre">math;</span> <span class="pre">output</span> <span class="pre">=</span> <span class="pre">math.sqrt(64)</span></code>.</p>
-<p><strong>⚠️ Note: We have a fully local version of dynamic routes available at**`docs/05-local-execution.ipynb &lt;https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb&gt;`__**. The local 05 version tends to outperform the OpenAI version we demo in this notebook, so we’d recommend trying**`05 &lt;https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb&gt;`__**!</strong></p>
-<section id="Installing-the-Library">
-<h2>Installing the Library<a class="headerlink" href="#Installing-the-Library" title="Link to this heading">#</a></h2>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[12]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>-qU<span class="w"> </span><span class="s2">&quot;semantic-router[local]==0.0.20&quot;</span>
-<span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>unifyai
-<span class="o">!</span>pip<span class="w"> </span>install<span class="w"> </span>openai
-<br/><br/></pre></div>
-</div>
-</div>
-<div class="nboutput docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area stderr docutils container">
-<div class="highlight"><pre>
-  error: subprocess-exited-with-error
-
-  × Building wheel for llama-cpp-python (pyproject.toml) did not run successfully.
-  │ exit code: 1
-  ╰─&gt; [20 lines of output]
-      *** scikit-build-core 0.9.2 using CMake 3.29.2 (wheel)
-      *** Configuring CMake...
-      2024-04-29 12:24:08,789 - scikit_build_core - WARNING - Can&#39;t find a Python library, got libdir=None, ldlibrary=None, multiarch=None, masd=None
-      loading initial cache file C:\Users\indir\AppData\Local\Temp\tmppik1ey4m\build\CMakeInit.txt
-      -- Building for: NMake Makefiles
-      CMake Error at CMakeLists.txt:3 (project):
-        Running
-
-         &#39;nmake&#39; &#39;-?&#39;
-
-        failed with:
-
-         no such file or directory
-
-
-      CMake Error: CMAKE_C_COMPILER not set, after EnableLanguage
-      CMake Error: CMAKE_CXX_COMPILER not set, after EnableLanguage
-      -- Configuring incomplete, errors occurred!
-
-      *** CMake configuration failed
-      [end of output]
-
-  note: This error originates from a subprocess, and is likely not a problem with pip.
-  ERROR: Failed building wheel for llama-cpp-python
-ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects
-
-[notice] A new release of pip is available: 23.1.2 -&gt; 24.0
-[notice] To update, run: C:\Users\indir\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip
-</pre></div></div>
-</div>
-<div class="nboutput docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Requirement already satisfied: unifyai in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (0.8.1)
-Requirement already satisfied: openai&lt;2.0.0,&gt;=1.12.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from unifyai) (1.20.0)
-Requirement already satisfied: requests&lt;3.0.0,&gt;=2.31.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from unifyai) (2.31.0)
-Requirement already satisfied: anyio&lt;5,&gt;=3.5.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (4.3.0)
-Requirement already satisfied: distro&lt;2,&gt;=1.7.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.9.0)
-Requirement already satisfied: httpx&lt;1,&gt;=0.23.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (0.27.0)
-Requirement already satisfied: pydantic&lt;3,&gt;=1.9.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (2.7.0)
-Requirement already satisfied: sniffio in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.3.1)
-Requirement already satisfied: tqdm&gt;4 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (4.66.2)
-Requirement already satisfied: typing-extensions&lt;5,&gt;=4.7 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (4.11.0)
-Requirement already satisfied: charset-normalizer&lt;4,&gt;=2 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (3.2.0)
-Requirement already satisfied: idna&lt;4,&gt;=2.5 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (3.4)
-Requirement already satisfied: urllib3&lt;3,&gt;=1.21.1 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (2.0.3)
-Requirement already satisfied: certifi&gt;=2017.4.17 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from requests&lt;3.0.0,&gt;=2.31.0-&gt;unifyai) (2023.5.7)
-Requirement already satisfied: exceptiongroup&gt;=1.0.2 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from anyio&lt;5,&gt;=3.5.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.2.0)
-Requirement already satisfied: httpcore==1.* in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (1.0.5)
-Requirement already satisfied: h11&lt;0.15,&gt;=0.13 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from httpcore==1.*-&gt;httpx&lt;1,&gt;=0.23.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (0.14.0)
-Requirement already satisfied: annotated-types&gt;=0.4.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (0.6.0)
-Requirement already satisfied: pydantic-core==2.18.1 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (2.18.1)
-Requirement already satisfied: colorama in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from tqdm&gt;4-&gt;openai&lt;2.0.0,&gt;=1.12.0-&gt;unifyai) (0.4.6)
-</pre></div></div>
-</div>
-<div class="nboutput docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area stderr docutils container">
-<div class="highlight"><pre>
-
-[notice] A new release of pip is available: 23.1.2 -&gt; 24.0
-[notice] To update, run: C:\Users\indir\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip
-</pre></div></div>
-</div>
-<div class="nboutput docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Requirement already satisfied: openai in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (1.20.0)
-Requirement already satisfied: anyio&lt;5,&gt;=3.5.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (4.3.0)
-Requirement already satisfied: distro&lt;2,&gt;=1.7.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (1.9.0)
-Requirement already satisfied: httpx&lt;1,&gt;=0.23.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (0.27.0)
-Requirement already satisfied: pydantic&lt;3,&gt;=1.9.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (2.7.0)
-Requirement already satisfied: sniffio in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (1.3.1)
-Requirement already satisfied: tqdm&gt;4 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (4.66.2)
-Requirement already satisfied: typing-extensions&lt;5,&gt;=4.7 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from openai) (4.11.0)
-Requirement already satisfied: idna&gt;=2.8 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from anyio&lt;5,&gt;=3.5.0-&gt;openai) (3.4)
-Requirement already satisfied: exceptiongroup&gt;=1.0.2 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from anyio&lt;5,&gt;=3.5.0-&gt;openai) (1.2.0)
-Requirement already satisfied: certifi in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from httpx&lt;1,&gt;=0.23.0-&gt;openai) (2023.5.7)
-Requirement already satisfied: httpcore==1.* in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from httpx&lt;1,&gt;=0.23.0-&gt;openai) (1.0.5)
-Requirement already satisfied: h11&lt;0.15,&gt;=0.13 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from httpcore==1.*-&gt;httpx&lt;1,&gt;=0.23.0-&gt;openai) (0.14.0)
-Requirement already satisfied: annotated-types&gt;=0.4.0 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai) (0.6.0)
-Requirement already satisfied: pydantic-core==2.18.1 in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from pydantic&lt;3,&gt;=1.9.0-&gt;openai) (2.18.1)
-Requirement already satisfied: colorama in c:\users\indir\appdata\local\packages\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\localcache\local-packages\python310\site-packages (from tqdm&gt;4-&gt;openai) (0.4.6)
-</pre></div></div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area stderr docutils container">
-<div class="highlight"><pre>
-
-[notice] A new release of pip is available: 23.1.2 -&gt; 24.0
-[notice] To update, run: C:\Users\indir\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\python.exe -m pip install --upgrade pip
-</pre></div></div>
-</div>
-</section>
-<section id="Initializing-Routes-and-RouteLayer">
-<h2>Initializing Routes and RouteLayer<a class="headerlink" href="#Initializing-Routes-and-RouteLayer" title="Link to this heading">#</a></h2>
-<p>Dynamic routes are treated in the same way as static routes, let’s begin by initializing a <code class="docutils literal notranslate"><span class="pre">RouteLayer</span></code> consisting of static routes.</p>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[10]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">semantic_router</span> <span class="kn">import</span> <span class="n">Route</span>
-
-<span class="c1"># Define routes for Math and Coding</span>
-<span class="n">math_route</span> <span class="o">=</span> <span class="n">Route</span><span class="p">(</span>
-    <span class="n">name</span><span class="o">=</span><span class="s2">&quot;math&quot;</span><span class="p">,</span>
-    <span class="n">utterances</span><span class="o">=</span><span class="p">[</span>
-        <span class="s2">&quot;solve for x in the equation&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;what is the integral of&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;how to calculate the derivative&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;mathematical proofs&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;how do you find the percentage of this number&quot;</span>
-    <span class="p">],</span>
-<span class="p">)</span>
-
-<span class="n">coding_route</span> <span class="o">=</span> <span class="n">Route</span><span class="p">(</span>
-    <span class="n">name</span><span class="o">=</span><span class="s2">&quot;coding&quot;</span><span class="p">,</span>
-    <span class="n">utterances</span><span class="o">=</span><span class="p">[</span>
-        <span class="s2">&quot;how to write a for loop in Python&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;explain the use of classes in Java&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;what is recursion in programming&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;how do i optimise this problem using hash tables&quot;</span><span class="p">,</span>
-        <span class="s2">&quot;suggest a more efficient data structure for this problem&quot;</span>
-    <span class="p">],</span>
-<span class="p">)</span>
-
-<span class="c1"># List of all routes</span>
-<span class="n">routes</span> <span class="o">=</span> <span class="p">[</span><span class="n">math_route</span><span class="p">,</span> <span class="n">coding_route</span><span class="p">]</span>
-</pre></div>
-</div>
-</div>
-<p>We initialize our <code class="docutils literal notranslate"><span class="pre">RouteLayer</span></code> with our <code class="docutils literal notranslate"><span class="pre">encoder</span></code> and <code class="docutils literal notranslate"><span class="pre">routes</span></code>. We can use popular encoder APIs like <code class="docutils literal notranslate"><span class="pre">CohereEncoder</span></code> and <code class="docutils literal notranslate"><span class="pre">OpenAIEncoder</span></code>, or local alternatives like <code class="docutils literal notranslate"><span class="pre">FastEmbedEncoder</span></code>.</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[11]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">from</span> <span class="nn">getpass</span> <span class="kn">import</span> <span class="n">getpass</span>
-<span class="kn">from</span> <span class="nn">semantic_router</span> <span class="kn">import</span> <span class="n">RouteLayer</span>
-<span class="kn">from</span> <span class="nn">semantic_router.encoders</span> <span class="kn">import</span> <span class="n">HuggingFaceEncoder</span>
-
-<span class="n">encoder</span> <span class="o">=</span> <span class="n">HuggingFaceEncoder</span><span class="p">()</span>
-
-<span class="n">rl</span> <span class="o">=</span> <span class="n">RouteLayer</span><span class="p">(</span><span class="n">encoder</span><span class="o">=</span><span class="n">encoder</span><span class="p">,</span> <span class="n">routes</span><span class="o">=</span><span class="n">routes</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-<span class="ansi-red-intense-fg ansi-bold">---------------------------------------------------------------------------</span>
-<span class="ansi-red-intense-fg ansi-bold">ImportError</span>                               Traceback (most recent call last)
-File <span class="ansi-green-intense-fg ansi-bold">~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\semantic_router\encoders\fastembed.py:25</span>, in <span class="ansi-cyan-fg">FastEmbedEncoder._initialize_client</span><span class="ansi-blue-intense-fg ansi-bold">(self)</span>
-<span class="ansi-green-fg">     24</span> <span class="ansi-bold" style="color: rgb(0,135,0)">try</span>:
-<span class="ansi-green-intense-fg ansi-bold">---&gt; 25</span>     <span class="ansi-bold" style="color: rgb(0,135,0)">from</span> <span class="ansi-bold" style="color: rgb(0,0,255)">fastembed</span><span class="ansi-bold" style="color: rgb(0,0,255)">.</span><span class="ansi-bold" style="color: rgb(0,0,255)">embedding</span> <span class="ansi-bold" style="color: rgb(0,135,0)">import</span> FlagEmbedding <span class="ansi-bold" style="color: rgb(0,135,0)">as</span> Embedding
-<span class="ansi-green-fg">     26</span> <span class="ansi-bold" style="color: rgb(0,135,0)">except</span> <span class="ansi-bold" style="color: rgb(215,95,95)">ImportError</span>:
-
-<span class="ansi-red-intense-fg ansi-bold">ImportError</span>: cannot import name &#39;TextEmbedding&#39; from &#39;fastembed&#39; (unknown location)
-
-During handling of the above exception, another exception occurred:
-
-<span class="ansi-red-intense-fg ansi-bold">ImportError</span>                               Traceback (most recent call last)
-Cell <span class="ansi-green-intense-fg ansi-bold">In [11], line 6</span>
-<span class="ansi-green-fg">      3</span> <span class="ansi-bold" style="color: rgb(0,135,0)">from</span> <span class="ansi-bold" style="color: rgb(0,0,255)">semantic_router</span> <span class="ansi-bold" style="color: rgb(0,135,0)">import</span> RouteLayer
-<span class="ansi-green-fg">      4</span> <span class="ansi-bold" style="color: rgb(0,135,0)">from</span> <span class="ansi-bold" style="color: rgb(0,0,255)">semantic_router</span><span class="ansi-bold" style="color: rgb(0,0,255)">.</span><span class="ansi-bold" style="color: rgb(0,0,255)">encoders</span> <span class="ansi-bold" style="color: rgb(0,135,0)">import</span> FastEmbedEncoder
-<span class="ansi-green-intense-fg ansi-bold">----&gt; 6</span> encoder <span style="color: rgb(98,98,98)">=</span> <span class="ansi-yellow-bg">FastEmbedEncoder</span><span class="ansi-yellow-bg">(</span><span class="ansi-yellow-bg">name</span><span class="ansi-yellow-bg" style="color: rgb(98,98,98)">=</span><span class="ansi-yellow-bg" style="color: rgb(175,0,0)">&#34;</span><span class="ansi-yellow-bg" style="color: rgb(175,0,0)">BAAI/bge-small-en-v1.5</span><span class="ansi-yellow-bg" style="color: rgb(175,0,0)">&#34;</span><span class="ansi-yellow-bg">)</span>
-<span class="ansi-green-fg">      8</span> rl <span style="color: rgb(98,98,98)">=</span> RouteLayer(encoder<span style="color: rgb(98,98,98)">=</span>encoder, routes<span style="color: rgb(98,98,98)">=</span>routes)
-
-File <span class="ansi-green-intense-fg ansi-bold">~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\semantic_router\encoders\fastembed.py:21</span>, in <span class="ansi-cyan-fg">FastEmbedEncoder.__init__</span><span class="ansi-blue-intense-fg ansi-bold">(self, score_threshold, **data)</span>
-<span class="ansi-green-fg">     17</span> <span class="ansi-bold" style="color: rgb(0,135,0)">def</span> <span style="color: rgb(0,0,255)">__init__</span>(
-<span class="ansi-green-fg">     18</span>     <span style="color: rgb(0,135,0)">self</span>, score_threshold: <span style="color: rgb(0,135,0)">float</span> <span style="color: rgb(98,98,98)">=</span> <span style="color: rgb(98,98,98)">0.5</span>, <span style="color: rgb(98,98,98)">*</span><span style="color: rgb(98,98,98)">*</span>data
-<span class="ansi-green-fg">     19</span> ):  <span style="color: rgb(95,135,135)"># TODO default score_threshold not thoroughly tested, should optimize</span>
-<span class="ansi-green-fg">     20</span>     <span style="color: rgb(0,135,0)">super</span>()<span style="color: rgb(98,98,98)">.</span><span style="color: rgb(0,0,255)">__init__</span>(score_threshold<span style="color: rgb(98,98,98)">=</span>score_threshold, <span style="color: rgb(98,98,98)">*</span><span style="color: rgb(98,98,98)">*</span>data)
-<span class="ansi-green-intense-fg ansi-bold">---&gt; 21</span>     <span style="color: rgb(0,135,0)">self</span><span style="color: rgb(98,98,98)">.</span>_client <span style="color: rgb(98,98,98)">=</span> <span class="ansi-yellow-bg" style="color: rgb(0,135,0)">self</span><span class="ansi-yellow-bg" style="color: rgb(98,98,98)">.</span><span class="ansi-yellow-bg">_initialize_client</span><span class="ansi-yellow-bg">(</span><span class="ansi-yellow-bg">)</span>
-
-File <span class="ansi-green-intense-fg ansi-bold">~\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\LocalCache\local-packages\Python310\site-packages\semantic_router\encoders\fastembed.py:27</span>, in <span class="ansi-cyan-fg">FastEmbedEncoder._initialize_client</span><span class="ansi-blue-intense-fg ansi-bold">(self)</span>
-<span class="ansi-green-fg">     25</span>     <span class="ansi-bold" style="color: rgb(0,135,0)">from</span> <span class="ansi-bold" style="color: rgb(0,0,255)">fastembed</span><span class="ansi-bold" style="color: rgb(0,0,255)">.</span><span class="ansi-bold" style="color: rgb(0,0,255)">embedding</span> <span class="ansi-bold" style="color: rgb(0,135,0)">import</span> FlagEmbedding <span class="ansi-bold" style="color: rgb(0,135,0)">as</span> Embedding
-<span class="ansi-green-fg">     26</span> <span class="ansi-bold" style="color: rgb(0,135,0)">except</span> <span class="ansi-bold" style="color: rgb(215,95,95)">ImportError</span>:
-<span class="ansi-green-intense-fg ansi-bold">---&gt; 27</span>     <span class="ansi-bold" style="color: rgb(0,135,0)">raise</span> <span class="ansi-bold" style="color: rgb(215,95,95)">ImportError</span>(
-<span class="ansi-green-fg">     28</span>         <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">Please install fastembed to use FastEmbedEncoder. </span><span style="color: rgb(175,0,0)">&#34;</span>
-<span class="ansi-green-fg">     29</span>         <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">You can install it with: </span><span style="color: rgb(175,0,0)">&#34;</span>
-<span class="ansi-green-fg">     30</span>         <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">`pip install </span><span style="color: rgb(175,0,0)">&#39;</span><span style="color: rgb(175,0,0)">semantic-router[fastembed]</span><span style="color: rgb(175,0,0)">&#39;</span><span style="color: rgb(175,0,0)">`</span><span style="color: rgb(175,0,0)">&#34;</span>
-<span class="ansi-green-fg">     31</span>     )
-<span class="ansi-green-fg">     33</span> embedding_args <span style="color: rgb(98,98,98)">=</span> {
-<span class="ansi-green-fg">     34</span>     <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">model_name</span><span style="color: rgb(175,0,0)">&#34;</span>: <span style="color: rgb(0,135,0)">self</span><span style="color: rgb(98,98,98)">.</span>name,
-<span class="ansi-green-fg">     35</span>     <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">max_length</span><span style="color: rgb(175,0,0)">&#34;</span>: <span style="color: rgb(0,135,0)">self</span><span style="color: rgb(98,98,98)">.</span>max_length,
-<span class="ansi-green-fg">     36</span>     <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">cache_dir</span><span style="color: rgb(175,0,0)">&#34;</span>: <span style="color: rgb(0,135,0)">self</span><span style="color: rgb(98,98,98)">.</span>cache_dir,
-<span class="ansi-green-fg">     37</span>     <span style="color: rgb(175,0,0)">&#34;</span><span style="color: rgb(175,0,0)">threads</span><span style="color: rgb(175,0,0)">&#34;</span>: <span style="color: rgb(0,135,0)">self</span><span style="color: rgb(98,98,98)">.</span>threads,
-<span class="ansi-green-fg">     38</span> }
-<span class="ansi-green-fg">     40</span> embedding_args <span style="color: rgb(98,98,98)">=</span> {k: v <span class="ansi-bold" style="color: rgb(0,135,0)">for</span> k, v <span class="ansi-bold" style="color: rgb(175,0,255)">in</span> embedding_args<span style="color: rgb(98,98,98)">.</span>items() <span class="ansi-bold" style="color: rgb(0,135,0)">if</span> v <span class="ansi-bold" style="color: rgb(175,0,255)">is</span> <span class="ansi-bold" style="color: rgb(175,0,255)">not</span> <span class="ansi-bold" style="color: rgb(0,135,0)">None</span>}
-
-<span class="ansi-red-intense-fg ansi-bold">ImportError</span>: Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install &#39;semantic-router[fastembed]&#39;`
-</pre></div></div>
-</div>
-<p>We run the solely static routes layer:</p>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[4]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="n">rl</span><span class="p">(</span><span class="s2">&quot;Solve the equation 5-x=12 for x?&quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[4]:
-</pre></div>
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-RouteChoice(name=&#39;math&#39;, function_call=None, similarity_score=None)
-</pre></div></div>
-</div>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[13]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">Unify</span>
-<span class="c1"># Environment setup for API keys</span>
-<span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;UNIFY_KEY&quot;</span><span class="p">]</span> <span class="o">=</span>  <span class="n">getpass</span><span class="p">(</span><span class="s2">&quot;Enter Unify API Key: &quot;</span><span class="p">)</span>
-</pre></div>
-</div>
-</div>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[ ]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="kn">import</span> <span class="nn">os</span>
-<span class="kn">from</span> <span class="nn">unify</span> <span class="kn">import</span> <span class="n">ChatBot</span>
-
-<span class="k">def</span> <span class="nf">test_unify_endpoint</span><span class="p">():</span>
-    <span class="k">try</span><span class="p">:</span>
-        <span class="c1"># Set up the ChatBot with a known working endpoint and API key</span>
-        <span class="n">agent</span> <span class="o">=</span> <span class="n">ChatBot</span><span class="p">(</span>
-            <span class="n">api_key</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;UNIFY_KEY&quot;</span><span class="p">],</span>
-            <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;gpt-4@anyscale&quot;</span>  <span class="c1"># Adjust this if necessary</span>
-        <span class="p">)</span>
-
-        <span class="c1"># Example prompt to test the service</span>
-        <span class="n">test_prompt</span> <span class="o">=</span> <span class="s2">&quot;What is 2+2?&quot;</span>
-
-        <span class="c1"># Making a request to the Unify service</span>
-        <span class="n">response</span> <span class="o">=</span> <span class="n">agent</span><span class="o">.</span><span class="n">run</span><span class="p">(</span><span class="n">test_prompt</span><span class="p">)</span>
-        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Response from Unify:&quot;</span><span class="p">,</span> <span class="n">response</span><span class="p">)</span>
-
-    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-        <span class="nb">print</span><span class="p">(</span><span class="s2">&quot;Failed to connect to Unify endpoint:&quot;</span><span class="p">,</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">))</span>
-
-<span class="k">if</span> <span class="vm">__name__</span> <span class="o">==</span> <span class="s2">&quot;__main__&quot;</span><span class="p">:</span>
-    <span class="n">test_unify_endpoint</span><span class="p">()</span>
-<br/></pre></div>
-</div>
-</div>
-<div class="nbinput nblast docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[44]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1">#Unify process query</span>
-<span class="k">def</span> <span class="nf">process_query</span><span class="p">(</span><span class="n">query</span><span class="p">):</span>
-    <span class="n">route_choice</span> <span class="o">=</span> <span class="n">rl</span><span class="p">(</span><span class="n">query</span><span class="p">)</span>
-    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Route chosen: </span><span class="si">{</span><span class="n">route_choice</span><span class="o">.</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-
-    <span class="k">if</span> <span class="n">route_choice</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;math&quot;</span><span class="p">:</span>
-        <span class="c1"># Initialize Unify with the endpoint for math queries</span>
-        <span class="n">unify</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span>
-            <span class="n">api_key</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;UNIFY_KEY&quot;</span><span class="p">],</span>
-            <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;llama-2-13b-chat@anyscale&quot;</span>  <span class="c1"># Use the correct endpoint for math queries, other models not working</span>
-        <span class="p">)</span>
-        <span class="c1"># Generate the response using Unify</span>
-        <span class="n">response</span> <span class="o">=</span> <span class="n">unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="n">query</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">response</span>
-
-    <span class="k">elif</span> <span class="n">route_choice</span><span class="o">.</span><span class="n">name</span> <span class="o">==</span> <span class="s2">&quot;coding&quot;</span><span class="p">:</span>
-        <span class="c1"># Initialize Unify with the endpoint for coding queries</span>
-        <span class="n">unify</span> <span class="o">=</span> <span class="n">Unify</span><span class="p">(</span>
-            <span class="n">api_key</span><span class="o">=</span><span class="n">os</span><span class="o">.</span><span class="n">environ</span><span class="p">[</span><span class="s2">&quot;UNIFY_KEY&quot;</span><span class="p">],</span>
-            <span class="n">endpoint</span><span class="o">=</span><span class="s2">&quot;codellama-34b-instruct@anyscale&quot;</span>  <span class="c1"># Use the correct endpoint for coding queries</span>
-        <span class="p">)</span>
-        <span class="c1"># Generate the response using Unify</span>
-        <span class="n">response</span> <span class="o">=</span> <span class="n">unify</span><span class="o">.</span><span class="n">generate</span><span class="p">(</span><span class="n">user_prompt</span><span class="o">=</span><span class="n">query</span><span class="p">)</span>
-        <span class="k">return</span> <span class="n">response</span>
-
-    <span class="k">else</span><span class="p">:</span>
-        <span class="k">return</span> <span class="s2">&quot;This query does not fall under a supported category.&quot;</span>
-<br/><br/></pre></div>
-</div>
-</div>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[45]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="c1"># Process query test</span>
-<span class="nb">print</span><span class="p">(</span><span class="n">process_query</span><span class="p">(</span><span class="s2">&quot;Solve the equation 5-x=12 for x?&quot;</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Route chosen: math
-Sure! To solve the equation 5 - x = 12, we can add x to both sides of the equation.
-
-5 - x = 12
-
-Adding x to both sides gives us:
-
-5 = 12 + x
-
-Now we can subtract 12 from both sides:
-
-5 - 12 = x
-
-This simplifies to:
-
--7 = x
-
-So the solution to the equation 5 - x = 12 is x = -7.
-</pre></div></div>
-</div>
-<div class="nbinput docutils container">
-<div class="prompt highlight-none notranslate"><div class="highlight"><pre><span></span>[39]:
-</pre></div>
-</div>
-<div class="input_area highlight-ipython3 notranslate"><div class="highlight"><pre><span></span><span class="nb">print</span><span class="p">(</span><span class="n">process_query</span><span class="p">(</span><span class="s2">&quot;Write a for loop in python that appends numbers from 1-10 in a list&quot;</span><span class="p">))</span>
-</pre></div>
-</div>
-</div>
-<div class="nboutput nblast docutils container">
-<div class="prompt empty docutils container">
-</div>
-<div class="output_area docutils container">
-<div class="highlight"><pre>
-Route chosen: coding
-
-Here is the code:
-
-```py
-my_list = []
-for num in range(1, 11):
-    my_list.append(num)
-```
-
-This will create a list containing the numbers 1 to 10 inclusively with each number in its own cell.
-
-_Note: The range() function is used to generate a sequence of numbers. The range() function when passed only one argument (in this case, 11) will return the sequence of numbers starting from 0 and going up to, but not including, the number passed, which is 11 in this case. By passing 1 as the starting number (range(1, 11)), we get the numbers from 1 to 10._
-
-Now you have a list with numbers from 1 to 10 in it. Here are some ways to use it:
-
-```py
-print(my_list[0])  # prints the first element which is 1
-print(my_list[9])  # prints the last element which is 10
-print(my_list)  # prints the whole list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
-```
-
-Let me know if you have further questions! 😊
-</pre></div></div>
-</div>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Installing-the-Library">Installing the Library</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#Initializing-Routes-and-RouteLayer">Initializing Routes and RouteLayer</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb b/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb
deleted file mode 100644
index d207d82042..0000000000
--- a/hub/demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb
+++ /dev/null
@@ -1,479 +0,0 @@
-{
- "cells": [
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "UxqB7_Ieur0s"
-   },
-   "source": [
-    "[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb) [![Open nbviewer](https://raw.githubusercontent.com/pinecone-io/examples/master/assets/nbviewer-shield.svg)](https://nbviewer.org/github/aurelio-labs/semantic-router/blob/main/docs/02-dynamic-routes.ipynb)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "EduhQaNAur0u"
-   },
-   "source": [
-    "# Dynamic Routes"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "_4JgNeX4ur0v"
-   },
-   "source": [
-    "In semantic-router there are two types of routes that can be chosen. Both routes belong to the `Route` object, the only difference between them is that _static_ routes return a `Route.name` when chosen, whereas _dynamic_ routes use an LLM call to produce parameter input values.\n",
-    "\n",
-    "For example, a _static_ route will tell us if a query is talking about mathematics by returning the route name (which could be `\"math\"` for example). A _dynamic_ route can generate additional values, so it may decide a query is talking about maths, but it can also generate Python code that we can later execute to answer the user's query, this output may look like `\"math\", \"import math; output = math.sqrt(64)`.\n",
-    "\n",
-    "***⚠️ Note: We have a fully local version of dynamic routes available at [docs/05-local-execution.ipynb](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb). The local 05 version tends to outperform the OpenAI version we demo in this notebook, so we'd recommend trying [05](https://github.com/aurelio-labs/semantic-router/blob/main/docs/05-local-execution.ipynb)!***"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "bbmw8CO4ur0v"
-   },
-   "source": [
-    "## Installing the Library"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 12,
-   "metadata": {
-    "id": "dLElfRhgur0v"
-   },
-   "outputs": [
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "  error: subprocess-exited-with-error\n",
-      "  \n",
-      "  × Building wheel for llama-cpp-python (pyproject.toml) did not run successfully.\n",
-      "  │ exit code: 1\n",
-      "  ╰─> [20 lines of output]\n",
-      "      *** scikit-build-core 0.9.2 using CMake 3.29.2 (wheel)\n",
-      "      *** Configuring CMake...\n",
-      "      2024-04-29 12:24:08,789 - scikit_build_core - WARNING - Can't find a Python library, got libdir=None, ldlibrary=None, multiarch=None, masd=None\n",
-      "      loading initial cache file C:\\Users\\indir\\AppData\\Local\\Temp\\tmppik1ey4m\\build\\CMakeInit.txt\n",
-      "      -- Building for: NMake Makefiles\n",
-      "      CMake Error at CMakeLists.txt:3 (project):\n",
-      "        Running\n",
-      "      \n",
-      "         'nmake' '-?'\n",
-      "      \n",
-      "        failed with:\n",
-      "      \n",
-      "         no such file or directory\n",
-      "      \n",
-      "      \n",
-      "      CMake Error: CMAKE_C_COMPILER not set, after EnableLanguage\n",
-      "      CMake Error: CMAKE_CXX_COMPILER not set, after EnableLanguage\n",
-      "      -- Configuring incomplete, errors occurred!\n",
-      "      \n",
-      "      *** CMake configuration failed\n",
-      "      [end of output]\n",
-      "  \n",
-      "  note: This error originates from a subprocess, and is likely not a problem with pip.\n",
-      "  ERROR: Failed building wheel for llama-cpp-python\n",
-      "ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects\n",
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Requirement already satisfied: unifyai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (0.8.1)\n",
-      "Requirement already satisfied: openai<2.0.0,>=1.12.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (1.20.0)\n",
-      "Requirement already satisfied: requests<3.0.0,>=2.31.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from unifyai) (2.31.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.3.0)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.9.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (2.7.0)\n",
-      "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai<2.0.0,>=1.12.0->unifyai) (4.11.0)\n",
-      "Requirement already satisfied: charset-normalizer<4,>=2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.2.0)\n",
-      "Requirement already satisfied: idna<4,>=2.5 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (3.4)\n",
-      "Requirement already satisfied: urllib3<3,>=1.21.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2.0.3)\n",
-      "Requirement already satisfied: certifi>=2017.4.17 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from requests<3.0.0,>=2.31.0->unifyai) (2023.5.7)\n",
-      "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai<2.0.0,>=1.12.0->unifyai) (1.2.0)\n",
-      "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai<2.0.0,>=1.12.0->unifyai) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai<2.0.0,>=1.12.0->unifyai) (2.18.1)\n",
-      "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai<2.0.0,>=1.12.0->unifyai) (0.4.6)\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    },
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Requirement already satisfied: openai in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (1.20.0)\n",
-      "Requirement already satisfied: anyio<5,>=3.5.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.3.0)\n",
-      "Requirement already satisfied: distro<2,>=1.7.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.9.0)\n",
-      "Requirement already satisfied: httpx<1,>=0.23.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (0.27.0)\n",
-      "Requirement already satisfied: pydantic<3,>=1.9.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (2.7.0)\n",
-      "Requirement already satisfied: sniffio in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (1.3.1)\n",
-      "Requirement already satisfied: tqdm>4 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.66.2)\n",
-      "Requirement already satisfied: typing-extensions<5,>=4.7 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from openai) (4.11.0)\n",
-      "Requirement already satisfied: idna>=2.8 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (3.4)\n",
-      "Requirement already satisfied: exceptiongroup>=1.0.2 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from anyio<5,>=3.5.0->openai) (1.2.0)\n",
-      "Requirement already satisfied: certifi in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (2023.5.7)\n",
-      "Requirement already satisfied: httpcore==1.* in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpx<1,>=0.23.0->openai) (1.0.5)\n",
-      "Requirement already satisfied: h11<0.15,>=0.13 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from httpcore==1.*->httpx<1,>=0.23.0->openai) (0.14.0)\n",
-      "Requirement already satisfied: annotated-types>=0.4.0 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (0.6.0)\n",
-      "Requirement already satisfied: pydantic-core==2.18.1 in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from pydantic<3,>=1.9.0->openai) (2.18.1)\n",
-      "Requirement already satisfied: colorama in c:\\users\\indir\\appdata\\local\\packages\\pythonsoftwarefoundation.python.3.10_qbz5n2kfra8p0\\localcache\\local-packages\\python310\\site-packages (from tqdm>4->openai) (0.4.6)\n"
-     ]
-    },
-    {
-     "name": "stderr",
-     "output_type": "stream",
-     "text": [
-      "\n",
-      "[notice] A new release of pip is available: 23.1.2 -> 24.0\n",
-      "[notice] To update, run: C:\\Users\\indir\\AppData\\Local\\Microsoft\\WindowsApps\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\python.exe -m pip install --upgrade pip\n"
-     ]
-    }
-   ],
-   "source": [
-    "!pip install -qU \"semantic-router[local]==0.0.20\"\n",
-    "!pip install unifyai\n",
-    "!pip install openai\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "BixZd6Eour0w"
-   },
-   "source": [
-    "## Initializing Routes and RouteLayer"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "PxnW9qBvur0x"
-   },
-   "source": [
-    "Dynamic routes are treated in the same way as static routes, let's begin by initializing a `RouteLayer` consisting of static routes."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 10,
-   "metadata": {
-    "id": "kc9Ty6Lgur0x"
-   },
-   "outputs": [],
-   "source": [
-    "from semantic_router import Route\n",
-    "\n",
-    "# Define routes for Math and Coding\n",
-    "math_route = Route(\n",
-    "    name=\"math\",\n",
-    "    utterances=[\n",
-    "        \"solve for x in the equation\",\n",
-    "        \"what is the integral of\",\n",
-    "        \"how to calculate the derivative\",\n",
-    "        \"mathematical proofs\",\n",
-    "        \"how do you find the percentage of this number\"\n",
-    "    ],\n",
-    ")\n",
-    "\n",
-    "coding_route = Route(\n",
-    "    name=\"coding\",\n",
-    "    utterances=[\n",
-    "        \"how to write a for loop in Python\",\n",
-    "        \"explain the use of classes in Java\",\n",
-    "        \"what is recursion in programming\",\n",
-    "        \"how do i optimise this problem using hash tables\",\n",
-    "        \"suggest a more efficient data structure for this problem\"\n",
-    "    ],\n",
-    ")\n",
-    "\n",
-    "# List of all routes\n",
-    "routes = [math_route, coding_route]"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "voWyqmffur0x"
-   },
-   "source": [
-    "We initialize our `RouteLayer` with our `encoder` and `routes`. We can use popular encoder APIs like `CohereEncoder` and `OpenAIEncoder`, or local alternatives like `FastEmbedEncoder`."
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 11,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "BI9AiDspur0y",
-    "outputId": "27329a54-3f16-44a5-ac20-13a6b26afb97"
-   },
-   "outputs": [
-    {
-     "ename": "ImportError",
-     "evalue": "Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`",
-     "output_type": "error",
-     "traceback": [
-      "\u001b[1;31m---------------------------------------------------------------------------\u001b[0m",
-      "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:25\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     24\u001b[0m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[1;32m---> 25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n",
-      "\u001b[1;31mImportError\u001b[0m: cannot import name 'TextEmbedding' from 'fastembed' (unknown location)",
-      "\nDuring handling of the above exception, another exception occurred:\n",
-      "\u001b[1;31mImportError\u001b[0m                               Traceback (most recent call last)",
-      "Cell \u001b[1;32mIn [11], line 6\u001b[0m\n\u001b[0;32m      3\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m RouteLayer\n\u001b[0;32m      4\u001b[0m \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01msemantic_router\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01mencoders\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FastEmbedEncoder\n\u001b[1;32m----> 6\u001b[0m encoder \u001b[38;5;241m=\u001b[39m \u001b[43mFastEmbedEncoder\u001b[49m\u001b[43m(\u001b[49m\u001b[43mname\u001b[49m\u001b[38;5;241;43m=\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[38;5;124;43mBAAI/bge-small-en-v1.5\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[43m)\u001b[49m\n\u001b[0;32m      8\u001b[0m rl \u001b[38;5;241m=\u001b[39m RouteLayer(encoder\u001b[38;5;241m=\u001b[39mencoder, routes\u001b[38;5;241m=\u001b[39mroutes)\n",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:21\u001b[0m, in \u001b[0;36mFastEmbedEncoder.__init__\u001b[1;34m(self, score_threshold, **data)\u001b[0m\n\u001b[0;32m     17\u001b[0m \u001b[38;5;28;01mdef\u001b[39;00m \u001b[38;5;21m__init__\u001b[39m(\n\u001b[0;32m     18\u001b[0m     \u001b[38;5;28mself\u001b[39m, score_threshold: \u001b[38;5;28mfloat\u001b[39m \u001b[38;5;241m=\u001b[39m \u001b[38;5;241m0.5\u001b[39m, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata\n\u001b[0;32m     19\u001b[0m ):  \u001b[38;5;66;03m# TODO default score_threshold not thoroughly tested, should optimize\u001b[39;00m\n\u001b[0;32m     20\u001b[0m     \u001b[38;5;28msuper\u001b[39m()\u001b[38;5;241m.\u001b[39m\u001b[38;5;21m__init__\u001b[39m(score_threshold\u001b[38;5;241m=\u001b[39mscore_threshold, \u001b[38;5;241m*\u001b[39m\u001b[38;5;241m*\u001b[39mdata)\n\u001b[1;32m---> 21\u001b[0m     \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39m_client \u001b[38;5;241m=\u001b[39m \u001b[38;5;28;43mself\u001b[39;49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43m_initialize_client\u001b[49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\n",
-      "File \u001b[1;32m~\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.10_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python310\\site-packages\\semantic_router\\encoders\\fastembed.py:27\u001b[0m, in \u001b[0;36mFastEmbedEncoder._initialize_client\u001b[1;34m(self)\u001b[0m\n\u001b[0;32m     25\u001b[0m     \u001b[38;5;28;01mfrom\u001b[39;00m \u001b[38;5;21;01mfastembed\u001b[39;00m\u001b[38;5;21;01m.\u001b[39;00m\u001b[38;5;21;01membedding\u001b[39;00m \u001b[38;5;28;01mimport\u001b[39;00m FlagEmbedding \u001b[38;5;28;01mas\u001b[39;00m Embedding\n\u001b[0;32m     26\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m:\n\u001b[1;32m---> 27\u001b[0m     \u001b[38;5;28;01mraise\u001b[39;00m \u001b[38;5;167;01mImportError\u001b[39;00m(\n\u001b[0;32m     28\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mPlease install fastembed to use FastEmbedEncoder. \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     29\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mYou can install it with: \u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     30\u001b[0m         \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124m`pip install \u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124msemantic-router[fastembed]\u001b[39m\u001b[38;5;124m'\u001b[39m\u001b[38;5;124m`\u001b[39m\u001b[38;5;124m\"\u001b[39m\n\u001b[0;32m     31\u001b[0m     )\n\u001b[0;32m     33\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {\n\u001b[0;32m     34\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmodel_name\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mname,\n\u001b[0;32m     35\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mmax_length\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mmax_length,\n\u001b[0;32m     36\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mcache_dir\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mcache_dir,\n\u001b[0;32m     37\u001b[0m     \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mthreads\u001b[39m\u001b[38;5;124m\"\u001b[39m: \u001b[38;5;28mself\u001b[39m\u001b[38;5;241m.\u001b[39mthreads,\n\u001b[0;32m     38\u001b[0m }\n\u001b[0;32m     40\u001b[0m embedding_args \u001b[38;5;241m=\u001b[39m {k: v \u001b[38;5;28;01mfor\u001b[39;00m k, v \u001b[38;5;129;01min\u001b[39;00m embedding_args\u001b[38;5;241m.\u001b[39mitems() \u001b[38;5;28;01mif\u001b[39;00m v \u001b[38;5;129;01mis\u001b[39;00m \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;28;01mNone\u001b[39;00m}\n",
-      "\u001b[1;31mImportError\u001b[0m: Please install fastembed to use FastEmbedEncoder. You can install it with: `pip install 'semantic-router[fastembed]'`"
-     ]
-    }
-   ],
-   "source": [
-    "import os\n",
-    "from getpass import getpass\n",
-    "from semantic_router import RouteLayer\n",
-    "from semantic_router.encoders import HuggingFaceEncoder\n",
-    "\n",
-    "encoder = HuggingFaceEncoder()\n",
-    "\n",
-    "rl = RouteLayer(encoder=encoder, routes=routes)"
-   ]
-  },
-  {
-   "cell_type": "markdown",
-   "metadata": {
-    "id": "GuLCeIS5ur0y"
-   },
-   "source": [
-    "We run the solely static routes layer:"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 4,
-   "metadata": {
-    "colab": {
-     "base_uri": "https://localhost:8080/"
-    },
-    "id": "_rNREh7gur0y",
-    "outputId": "f3a1dc0b-d760-4efb-b634-d3547011dcb7"
-   },
-   "outputs": [
-    {
-     "data": {
-      "text/plain": [
-       "RouteChoice(name='math', function_call=None, similarity_score=None)"
-      ]
-     },
-     "execution_count": 4,
-     "metadata": {},
-     "output_type": "execute_result"
-    }
-   ],
-   "source": [
-    "rl(\"Solve the equation 5-x=12 for x?\")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 13,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "from unify import Unify\n",
-    "# Environment setup for API keys\n",
-    "os.environ[\"UNIFY_KEY\"] =  getpass(\"Enter Unify API Key: \")"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": null,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "import os\n",
-    "from unify import ChatBot\n",
-    "\n",
-    "def test_unify_endpoint():\n",
-    "    try:\n",
-    "        # Set up the ChatBot with a known working endpoint and API key\n",
-    "        agent = ChatBot(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"gpt-4@anyscale\"  # Adjust this if necessary\n",
-    "        )\n",
-    "        \n",
-    "        # Example prompt to test the service\n",
-    "        test_prompt = \"What is 2+2?\"\n",
-    "        \n",
-    "        # Making a request to the Unify service\n",
-    "        response = agent.run(test_prompt)\n",
-    "        print(\"Response from Unify:\", response)\n",
-    "        \n",
-    "    except Exception as e:\n",
-    "        print(\"Failed to connect to Unify endpoint:\", str(e))\n",
-    "\n",
-    "if __name__ == \"__main__\":\n",
-    "    test_unify_endpoint()\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 44,
-   "metadata": {},
-   "outputs": [],
-   "source": [
-    "#Unify process query\n",
-    "def process_query(query):\n",
-    "    route_choice = rl(query)\n",
-    "    print(f\"Route chosen: {route_choice.name}\")\n",
-    "\n",
-    "    if route_choice.name == \"math\":\n",
-    "        # Initialize Unify with the endpoint for math queries\n",
-    "        unify = Unify(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"llama-2-13b-chat@anyscale\"  # Use the correct endpoint for math queries, other models not working\n",
-    "        )\n",
-    "        # Generate the response using Unify\n",
-    "        response = unify.generate(user_prompt=query)\n",
-    "        return response\n",
-    "\n",
-    "    elif route_choice.name == \"coding\":\n",
-    "        # Initialize Unify with the endpoint for coding queries\n",
-    "        unify = Unify(\n",
-    "            api_key=os.environ[\"UNIFY_KEY\"],\n",
-    "            endpoint=\"codellama-34b-instruct@anyscale\"  # Use the correct endpoint for coding queries\n",
-    "        )\n",
-    "        # Generate the response using Unify\n",
-    "        response = unify.generate(user_prompt=query)\n",
-    "        return response\n",
-    "\n",
-    "    else:\n",
-    "        return \"This query does not fall under a supported category.\"\n",
-    "\n"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 45,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Route chosen: math\n",
-      "Sure! To solve the equation 5 - x = 12, we can add x to both sides of the equation.\n",
-      "\n",
-      "5 - x = 12\n",
-      "\n",
-      "Adding x to both sides gives us:\n",
-      "\n",
-      "5 = 12 + x\n",
-      "\n",
-      "Now we can subtract 12 from both sides:\n",
-      "\n",
-      "5 - 12 = x\n",
-      "\n",
-      "This simplifies to:\n",
-      "\n",
-      "-7 = x\n",
-      "\n",
-      "So the solution to the equation 5 - x = 12 is x = -7.\n"
-     ]
-    }
-   ],
-   "source": [
-    "# Process query test\n",
-    "print(process_query(\"Solve the equation 5-x=12 for x?\"))"
-   ]
-  },
-  {
-   "cell_type": "code",
-   "execution_count": 39,
-   "metadata": {},
-   "outputs": [
-    {
-     "name": "stdout",
-     "output_type": "stream",
-     "text": [
-      "Route chosen: coding\n",
-      "\n",
-      "Here is the code:\n",
-      "\n",
-      "```py\n",
-      "my_list = []\n",
-      "for num in range(1, 11):\n",
-      "    my_list.append(num)\n",
-      "```\n",
-      "\n",
-      "This will create a list containing the numbers 1 to 10 inclusively with each number in its own cell.\n",
-      "\n",
-      "_Note: The range() function is used to generate a sequence of numbers. The range() function when passed only one argument (in this case, 11) will return the sequence of numbers starting from 0 and going up to, but not including, the number passed, which is 11 in this case. By passing 1 as the starting number (range(1, 11)), we get the numbers from 1 to 10._\n",
-      "\n",
-      "Now you have a list with numbers from 1 to 10 in it. Here are some ways to use it:\n",
-      "\n",
-      "```py\n",
-      "print(my_list[0])  # prints the first element which is 1\n",
-      "print(my_list[9])  # prints the last element which is 10\n",
-      "print(my_list)  # prints the whole list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]\n",
-      "```\n",
-      "\n",
-      "Let me know if you have further questions! 😊\n"
-     ]
-    }
-   ],
-   "source": [
-    "print(process_query(\"Write a for loop in python that appends numbers from 1-10 in a list\"))"
-   ]
-  }
- ],
- "metadata": {
-  "colab": {
-   "provenance": []
-  },
-  "kernelspec": {
-   "display_name": "decision-layer",
-   "language": "python",
-   "name": "python3"
-  },
-  "language_info": {
-   "codemirror_mode": {
-    "name": "ipython",
-    "version": 3
-   },
-   "file_extension": ".py",
-   "mimetype": "text/x-python",
-   "name": "python",
-   "nbconvert_exporter": "python",
-   "pygments_lexer": "ipython3",
-   "version": "3.10.11"
-  }
- },
- "nbformat": 4,
- "nbformat_minor": 0
-}
diff --git a/hub/demos/demos/template/README_TEMPLATE.html b/hub/demos/demos/template/README_TEMPLATE.html
deleted file mode 100644
index 5327fbdc49..0000000000
--- a/hub/demos/demos/template/README_TEMPLATE.html
+++ /dev/null
@@ -1,648 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../../../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Project Title &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../../../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../../../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../../../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../../../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../../../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../../../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../../../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../../../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../../../_static/doctools.js?v=888ff710"></script>
-    <script src="../../../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../../../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../../../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../../../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/demos/template/README_TEMPLATE';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../../../genindex.html" />
-    <link rel="search" title="Search" href="../../../search.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../../../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-        
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../../../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Project Title</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="project-title">
-<h1>Project Title<a class="headerlink" href="#project-title" title="Link to this heading">#</a></h1>
-<p>The section will contain the demo video. In order to embed your video in the README as well as our docs, you need to do the following:</p>
-<ol class="arabic simple">
-<li><p>Drag the drop the video in the README. Doing that will generate a link for your video. Convert the link to a href by writing it in this format [demo](&lt;generated_link&gt;). Checkout this <a class="reference external" href="https://github.com/unifyai/demos/blob/main/Unify/LLM-Wars/README.md?plain=1#L2">example</a> incase you’re not sure what to do.</p></li>
-<li><p>Add your video the <a class="reference external" href="https://github.com/unifyai/demos/tree/main/videos">Video</a> folder with the name &lt;project_name&gt;.mp4. And add the following lines to your README:</p></li>
-</ol>
-<div class="highlight-default notranslate"><div class="highlight"><pre><span></span><span class="o">&lt;</span><span class="n">video</span> <span class="n">width</span><span class="o">=</span><span class="s2">&quot;640&quot;</span> <span class="n">height</span><span class="o">=</span><span class="s2">&quot;480&quot;</span> <span class="n">autoplay</span><span class="o">&gt;</span>
-  <span class="o">&lt;</span><span class="n">source</span> <span class="n">src</span><span class="o">=</span><span class="s2">&quot;../../../../_static/&lt;project_name&gt;.mp4&quot;</span> <span class="nb">type</span><span class="o">=</span><span class="s2">&quot;video/mp4&quot;</span><span class="o">&gt;</span>
-<span class="n">Your</span> <span class="n">browser</span> <span class="n">does</span> <span class="ow">not</span> <span class="n">support</span> <span class="n">the</span> <span class="n">video</span> <span class="n">tag</span><span class="o">.</span>
-<span class="o">&lt;/</span><span class="n">video</span><span class="o">&gt;</span>
-</pre></div>
-</div>
-<p>Incase the above is confusing, checkout this <a class="reference external" href="https://github.com/unifyai/demos/blob/main/Unify/LLM-Wars/README.md?plain=1#L4C1-L7C9">example</a></p>
-<section id="introduction">
-<h2>Introduction<a class="headerlink" href="#introduction" title="Link to this heading">#</a></h2>
-<p>Provide a brief introduction to your project here. Describe what your project demonstrates, the tech stack used, the motivation behind the project, and briefly explain the necessary concepts used. Feel free to break down this section into multiple subsections depending on your project.</p>
-</section>
-<section id="repository-and-deployment">
-<h2>Repository and Deployment<a class="headerlink" href="#repository-and-deployment" title="Link to this heading">#</a></h2>
-<p>Provide a link to the GitHub repository and instructions on how to run the app locally. If the app is deployed somewhere, provide a link to the deployed app.</p>
-</section>
-<section id="contributors">
-<h2>Contributors<a class="headerlink" href="#contributors" title="Link to this heading">#</a></h2>
-<p>List the contributors to the project in a table format. For example:</p>
-<table class="table">
-<thead>
-<tr class="row-odd"><th class="head"><p>Name</p></th>
-<th class="head"><p>GitHub Profile</p></th>
-</tr>
-</thead>
-<tbody>
-<tr class="row-even"><td><p>John Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/johndoe">johndoe</a></p></td>
-</tr>
-<tr class="row-odd"><td><p>Jane Doe</p></td>
-<td><p><a class="reference external" href="https://github.com/janedoe">janedoe</a></p></td>
-</tr>
-</tbody>
-</table>
-</section>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"><div class="sidebar-secondary-items sidebar-secondary__inner">
-
-
-  <div class="sidebar-secondary-item">
-<div
-    id="pst-page-navigation-heading-2"
-    class="page-toc tocsection onthispage">
-    <i class="fa-solid fa-list"></i> On this page
-  </div>
-  <nav class="bd-toc-nav page-toc" aria-labelledby="pst-page-navigation-heading-2">
-    <ul class="visible nav section-nav flex-column">
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#introduction">Introduction</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#repository-and-deployment">Repository and Deployment</a></li>
-<li class="toc-h2 nav-item toc-entry"><a class="reference internal nav-link" href="#contributors">Contributors</a></li>
-</ul>
-  </nav></div>
-
-</div></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../../../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../../../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/langchain.html b/hub/demos/langchain.html
deleted file mode 100644
index bb922d2ba3..0000000000
--- a/hub/demos/langchain.html
+++ /dev/null
@@ -1,625 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LangChain Examples &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/langchain';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="RAG Playground 🛝" href="demos/LangChain/RAG_playground/README.html" />
-    <link rel="prev" title="AI Debate App" href="demos/Unify/LLM_Debate/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">LangChain Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">LangChain Examples</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="langchain-examples">
-<h1>LangChain Examples<a class="headerlink" href="#langchain-examples" title="Link to this heading">#</a></h1>
-<div class="sd-container-fluid sd-sphinx-override sd-mb-4 docutils">
-<div class="sd-row sd-row-cols-1 sd-row-cols-xs-1 sd-row-cols-sm-1 sd-row-cols-md-3 sd-row-cols-lg-3 sd-g-4 sd-g-xs-4 sd-g-sm-4 sd-g-md-4 sd-g-lg-4 docutils">
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-Langchain RAG Playground</div>
-<p class="sd-card-text">Retrieval Augmented Generation with Langchain &amp; Unify.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/LangChain/RAG_playground/README.html"><span class="doc"></span></a></div>
-</div>
-</div>
-</div>
-<div class="toctree-wrapper compound">
-</div>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="demos/Unify/LLM_Debate/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">AI Debate App</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="demos/LangChain/RAG_playground/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">RAG Playground 🛝</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">LangChain Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/llamaindex.html b/hub/demos/llamaindex.html
deleted file mode 100644
index 41c73c2cbb..0000000000
--- a/hub/demos/llamaindex.html
+++ /dev/null
@@ -1,634 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>LlamaIndex Examples &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/llamaindex';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="RAG Playground" href="demos/LlamaIndex/RAGPlayground/README.html" />
-    <link rel="prev" title="RAG Playground 🛝" href="demos/LangChain/RAG_playground/README.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">LlamaIndex Examples</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="llamaindex-examples">
-<h1>LlamaIndex Examples<a class="headerlink" href="#llamaindex-examples" title="Link to this heading">#</a></h1>
-<div class="sd-container-fluid sd-sphinx-override sd-mb-4 docutils">
-<div class="sd-row sd-row-cols-1 sd-row-cols-xs-1 sd-row-cols-sm-1 sd-row-cols-md-3 sd-row-cols-lg-3 sd-g-4 sd-g-xs-4 sd-g-sm-4 sd-g-md-4 sd-g-lg-4 docutils">
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-LlamaIndex Basic Usage</div>
-<p class="sd-card-text">Learn how to use the LlamaIndex-Unify Integration.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/LlamaIndex/BasicUsage/unify.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-LlamaIndex RAG Playground</div>
-<p class="sd-card-text">Retrieval Augmented Generation Playground built with LlamaIndex.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/LlamaIndex/RAGPlayground/README.html"><span class="doc"></span></a></div>
-</div>
-</div>
-</div>
-<div class="toctree-wrapper compound">
-</div>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="demos/LangChain/RAG_playground/README.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">RAG Playground 🛝</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="demos/LlamaIndex/RAGPlayground/README.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">RAG Playground</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">LlamaIndex Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/demos/unify.html b/hub/demos/unify.html
deleted file mode 100644
index 54f3400fe9..0000000000
--- a/hub/demos/unify.html
+++ /dev/null
@@ -1,670 +0,0 @@
-
-<!DOCTYPE html>
-
-
-<html lang="en" data-content_root="../" >
-
-  <head>
-    <meta charset="utf-8" />
-    <meta name="viewport" content="width=device-width, initial-scale=1.0" /><meta name="viewport" content="width=device-width, initial-scale=1" />
-
-    <title>Python Package Examples &#8212; Unify Documentation</title>
-  
-  
-  
-  <script data-cfasync="false">
-    document.documentElement.dataset.mode = localStorage.getItem("mode") || "";
-    document.documentElement.dataset.theme = localStorage.getItem("theme") || "light";
-  </script>
-  
-  <!-- Loaded before other Sphinx assets -->
-  <link href="../_static/styles/theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/bootstrap.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-<link href="../_static/styles/pydata-sphinx-theme.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-
-  
-  <link href="../_static/vendor/fontawesome/6.5.1/css/all.min.css?digest=8d27b9dea8ad943066ae" rel="stylesheet" />
-  <link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-solid-900.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-brands-400.woff2" />
-<link rel="preload" as="font" type="font/woff2" crossorigin href="../_static/vendor/fontawesome/6.5.1/webfonts/fa-regular-400.woff2" />
-
-    <link rel="stylesheet" type="text/css" href="../_static/pygments.css?v=a746c00c" />
-    <link rel="stylesheet" type="text/css" href="../_static/copybutton.css?v=76b2166b" />
-    <link rel="stylesheet" type="text/css" href="../_static/design-style.1e8bd061cd6da7fc9cf755528e8ffc24.min.css?v=0a3b3ea7" />
-    <link rel="stylesheet" type="text/css" href="../_static/css/custom.css?v=7c465b21" />
-    <link rel="stylesheet" type="text/css" href="https://fonts.googleapis.com/css?family=Inter:100,200,300,regular,500,600,700,800,900" />
-  
-  <!-- Pre-loaded scripts that we'll load fully later -->
-  <link rel="preload" as="script" href="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae" />
-<link rel="preload" as="script" href="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae" />
-  <script src="../_static/vendor/fontawesome/6.5.1/js/all.min.js?digest=8d27b9dea8ad943066ae"></script>
-
-    <script src="../_static/documentation_options.js?v=3ce10a4d"></script>
-    <script src="../_static/doctools.js?v=888ff710"></script>
-    <script src="../_static/sphinx_highlight.js?v=dc90522c"></script>
-    <script src="../_static/clipboard.min.js?v=a7894cd8"></script>
-    <script src="../_static/copybutton.js?v=4ea706d9"></script>
-    <script src="../_static/design-tabs.js?v=36754332"></script>
-    <script async="async" src="https://www.googletagmanager.com/gtag/js?id=G-QP5BET66XH"></script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>
-                window.dataLayer = window.dataLayer || [];
-                function gtag(){ dataLayer.push(arguments); }
-                gtag('js', new Date());
-                gtag('config', 'G-QP5BET66XH');
-            </script>
-    <script>DOCUMENTATION_OPTIONS.pagename = 'demos/unify';</script>
-    <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
-    <link rel="index" title="Index" href="../genindex.html" />
-    <link rel="search" title="Search" href="../search.html" />
-    <link rel="next" title="Build a ChatBot" href="demos/Unify/ChatBot/ChatBot.html" />
-    <link rel="prev" title="Utils" href="../docs/unify/unify/unify.utils.html" />
-  <meta name="viewport" content="width=device-width, initial-scale=1"/>
-  <meta name="docsearch:language" content="en"/>
-  </head>
-  
-  
-  <body data-bs-spy="scroll" data-bs-target=".bd-toc-nav" data-offset="180" data-bs-root-margin="0px 0px -60%" data-default-mode="">
-
-  
-  
-  <a id="pst-skip-link" class="skip-link" href="#main-content">Skip to main content</a>
-  
-  <div id="pst-scroll-pixel-helper"></div>
-  
-  <button type="button" class="btn rounded-pill" id="pst-back-to-top">
-    <i class="fa-solid fa-arrow-up"></i>
-    Back to top
-  </button>
-
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__primary"
-          id="__primary"/>
-  <label class="overlay overlay-primary" for="__primary"></label>
-  
-  <input type="checkbox"
-          class="sidebar-toggle"
-          name="__secondary"
-          id="__secondary"/>
-  <label class="overlay overlay-secondary" for="__secondary"></label>
-  
-  <div class="search-button__wrapper">
-    <div class="search-button__overlay"></div>
-    <div class="search-button__search-container">
-<form class="bd-search d-flex align-items-center"
-      action="../search.html"
-      method="get">
-  <i class="fa-solid fa-magnifying-glass"></i>
-  <input type="search"
-         class="form-control"
-         name="q"
-         id="search-input"
-         placeholder="Search the docs ..."
-         aria-label="Search the docs ..."
-         autocomplete="off"
-         autocorrect="off"
-         autocapitalize="off"
-         spellcheck="false"/>
-  <span class="search-button__kbd-shortcut"><kbd class="kbd-shortcut__modifier">Ctrl</kbd>+<kbd>K</kbd></span>
-</form></div>
-  </div>
-  
-    <header class="bd-header navbar navbar-expand-lg bd-navbar"><div id="unify-navbar"></div>
-    </header>
-  
-
-  <div class="bd-container">
-    <div class="bd-container__inner bd-page-width">
-      
-      
-      
-      <div class="bd-sidebar-primary bd-sidebar">
-        
-
-  
-  <div class="sidebar-header-items sidebar-primary__section">
-    
-    
-      <div class="sidebar-header-items__center">
-        
-          <div class="navbar-item">
-<nav class="navbar-nav">
-  <ul class="bd-navbar-elements navbar-nav">
-    
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../index.html">
-                        Welcome to Unify!
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-external" href="https://api.unify.ai/v0/docs">
-                        API Reference
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
-                        Universal API
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
-                        Benchmarking
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../docs/unify/unify.html">
-                        <no title>
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item current active">
-                      <a class="nav-link nav-internal" href="#">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
-                        Connecting your stack
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
-                        Benchmarking endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
-                        Building a custom router
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
-                        On-Prem access
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../on_prem/sso.html">
-                        SSO (Single Sign On)
-                      </a>
-                    </li>
-                
-  </ul>
-</nav></div>
-        
-      </div>
-    
-    
-    
-      <div class="sidebar-header-items__end">
-        
-          <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-        
-      </div>
-    
-  </div>
-  
-    <div class="sidebar-primary-items__start sidebar-primary__section">
-        <div class="sidebar-primary-item"><nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav></div>
-    </div>
-  
-  
-  <div class="sidebar-primary-items__end sidebar-primary__section">
-  </div>
-  
-  <div id="rtd-footer-container"></div>
-
-
-      </div>
-      
-      <main id="main-content" class="bd-main">
-        
-        
-          <div class="bd-content">
-            <div class="bd-article-container">
-              
-              <div class="bd-header-article">
-<div class="header-article-items header-article__inner">
-  
-    <div class="header-article-items__start">
-      
-        <div class="header-article-item">
-
-
-
-<nav aria-label="Breadcrumb">
-  <ul class="bd-breadcrumbs">
-    
-    <li class="breadcrumb-item breadcrumb-home">
-      <a href="../index.html" class="nav-link" aria-label="Home">
-        <i class="fa-solid fa-home"></i>
-      </a>
-    </li>
-    <li class="breadcrumb-item active" aria-current="page">Python...</li>
-  </ul>
-</nav>
-</div>
-      
-    </div>
-  
-  
-</div>
-</div>
-              
-              
-              
-                
-<div id="searchbox"></div>
-                <article class="bd-article">
-                  
-  <section id="python-package-examples">
-<h1>Python Package Examples<a class="headerlink" href="#python-package-examples" title="Link to this heading">#</a></h1>
-<div class="sd-container-fluid sd-sphinx-override sd-mb-4 docutils">
-<div class="sd-row sd-row-cols-1 sd-row-cols-xs-1 sd-row-cols-sm-1 sd-row-cols-md-3 sd-row-cols-lg-3 sd-g-4 sd-g-xs-4 sd-g-sm-4 sd-g-md-4 sd-g-lg-4 docutils">
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-Building a ChatBot</div>
-<p class="sd-card-text">An interactive chatbot application.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/ChatBot/ChatBot.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-Synchronous vs Asynchronous Clients</div>
-<p class="sd-card-text">Exploring Sync vs Async Clients: Usage and Differences.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-LLM Wars</div>
-<p class="sd-card-text">LLMs face off in a Streamlit app, asking each other tough questions.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/LLM-Wars/README.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-Semantic Router</div>
-<p class="sd-card-text">LLM Routing based on semantic similarity.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/SemanticRouter/README.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-ChatBot Arena</div>
-<p class="sd-card-text">Ask any question to two anonymous LLMs and vote for the better one!</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/Chatbot_Arena/README.html"><span class="doc"></span></a></div>
-</div>
-<div class="sd-col sd-d-flex-row docutils">
-<div class="sd-card sd-sphinx-override sd-w-100 sd-shadow-sm sd-card-hover docutils">
-<div class="sd-card-body docutils">
-<div class="sd-card-title sd-font-weight-bold docutils">
-LLM Debate App</div>
-<p class="sd-card-text">Provide a topic and watch two LLMs debate on it.</p>
-</div>
-<a class="sd-stretched-link reference internal" href="demos/Unify/LLM_Debate/README.html"><span class="doc"></span></a></div>
-</div>
-</div>
-</div>
-<div class="toctree-wrapper compound">
-</div>
-</section>
-
-
-                </article>
-              
-              
-              
-              
-              
-                <footer class="prev-next-footer">
-                  
-<div class="prev-next-area">
-    <a class="left-prev"
-       href="../docs/unify/unify/unify.utils.html"
-       title="previous page">
-      <i class="fa-solid fa-angle-left"></i>
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Utils</p>
-      </div>
-    </a>
-    <a class="right-next"
-       href="demos/Unify/ChatBot/ChatBot.html"
-       title="next page">
-      <div class="prev-next-info">
-        <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Build a ChatBot</p>
-      </div>
-      <i class="fa-solid fa-angle-right"></i>
-    </a>
-</div>
-                </footer>
-              
-            </div>
-            
-            
-              
-                <div class="bd-sidebar-secondary bd-toc"></div>
-              
-            
-          </div>
-          <footer class="bd-footer-content">
-            
-          </footer>
-        
-      </main>
-    </div>
-  </div>
-  
-<script src="https://cdn.saas.unify.ai/js/unify-components-shared.js"></script>
-<script src="https://cdn.saas.unify.ai/js/unify-components.js"></script>
-<div id="navbar-contents" style="display: none;">
-  
-  <div class="navbar-header-items__end">
-    
-    <div class="navbar-item navbar-persistent--container">
-      
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn search-button search-button__button" title="Search" aria-label="Search" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <i class="fa-solid fa-magnifying-glass fa-lg"></i>
-  </button>
-`);
-</script>
-    </div>
-    
-    
-    <div class="navbar-item">
-
-<script>
-document.write(`
-  <button class="btn btn-sm navbar-btn theme-switch-button" title="light/dark" aria-label="light/dark" data-bs-placement="bottom" data-bs-toggle="tooltip">
-    <span class="theme-switch nav-link" data-mode="light"><i class="fa-solid fa-sun fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="dark"><i class="fa-solid fa-moon fa-lg"></i></span>
-    <span class="theme-switch nav-link" data-mode="auto"><i class="fa-solid fa-circle-half-stroke fa-lg"></i></span>
-  </button>
-`);
-</script></div>
-    
-  </div>
-  
-</div>
-<script>
-  const html = `<div></div>`;
-  const toc = `<nav class="bd-docs-nav bd-links"
-  aria-label="Section Navigation">
-    <div class="bd-toc-item navbar-nav">
-        <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
-<li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.exceptions.html">Exceptions</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="current nav bd-sidenav">
-<li class="toctree-l1 current active has-children"><a class="current reference internal" href="#">Python Package Examples</a><input checked="" class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/on_prem_access.html">On-Prem access</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../on_prem/sso.html">SSO (Single Sign On)</a></li>
-</ul>
-
-    </div>
-</nav>`;
-  initializeNavbar(html, true, toc);
-  Promise.all([waitForElm("unify-navbar-end"), waitForElm("unify-mobile-navbar-end")]).then(([target, mobileTarget]) => {
-    for (let elem of document.getElementById("navbar-contents").children) {
-      target.children[0].appendChild(elem.cloneNode(true));
-      mobileTarget.children[0].appendChild(elem.cloneNode(true));
-    }
-    document.getElementById("navbar-contents").remove();
-    const scripts = `
-  &lt!-- Scripts loaded after &ltbody&gt so the DOM is not blocked --&gt
-  &ltscript src="../_static/scripts/bootstrap.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-&ltscript src="../_static/scripts/pydata-sphinx-theme.js?digest=8d27b9dea8ad943066ae"&gt&lt/script&gt
-`.replace(/&lt/g, "<").replace(/&gt/g, ">");
-    const divFragment = document.createRange().createContextualFragment(scripts);
-    document.body.prepend(divFragment);
-  });
-</script>
-
-  <footer class="bd-footer">
-<div class="bd-footer__inner bd-page-width">
-  
-    <div class="footer-items__start">
-      
-        <div class="footer-item">
-
-  <p class="copyright">
-    
-      © Copyright 2020-2023, Unify.
-      <br/>
-    
-  </p>
-</div>
-      
-        <div class="footer-item">
-
-  <p class="sphinx-version">
-    Created using <a href="https://www.sphinx-doc.org/">Sphinx</a> 7.2.5.
-    <br/>
-  </p>
-</div>
-      
-    </div>
-  
-  
-  
-    <div class="footer-items__end">
-      
-        <div class="footer-item">
-<p class="theme-version">
-  Built with the <a href="https://pydata-sphinx-theme.readthedocs.io/en/stable/index.html">PyData Sphinx Theme</a> 0.15.2.
-</p></div>
-      
-    </div>
-  
-</div>
-
-  </footer>
-  </body>
-</html>
\ No newline at end of file
diff --git a/hub/docs/unify/unify.html b/hub/docs/unify/unify.html
index c24c38077c..5a346cec23 100644
--- a/hub/docs/unify/unify.html
+++ b/hub/docs/unify/unify.html
@@ -63,7 +63,7 @@
     <link rel="index" title="Index" href="../../genindex.html" />
     <link rel="search" title="Search" href="../../search.html" />
     <link rel="next" title="Chat" href="unify/unify.chat.html" />
-    <link rel="prev" title="Routing" href="../../api/router.html" />
+    <link rel="prev" title="Routing" href="../../concepts/router.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -429,7 +357,7 @@
                   
 <div class="prev-next-area">
     <a class="left-prev"
-       href="../../api/router.html"
+       href="../../concepts/router.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
@@ -508,13 +436,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.clients.html">Clients</a></li>
@@ -522,41 +450,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/docs/unify/unify/unify.chat.html b/hub/docs/unify/unify/unify.chat.html
index 233d7f19b9..e02e6afeab 100644
--- a/hub/docs/unify/unify/unify.chat.html
+++ b/hub/docs/unify/unify/unify.chat.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -705,13 +633,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -719,41 +647,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/docs/unify/unify/unify.clients.html b/hub/docs/unify/unify/unify.clients.html
index ec625c66db..09f85dc469 100644
--- a/hub/docs/unify/unify/unify.clients.html
+++ b/hub/docs/unify/unify/unify.clients.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -887,13 +815,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Clients</a></li>
@@ -901,41 +829,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/docs/unify/unify/unify.exceptions.html b/hub/docs/unify/unify/unify.exceptions.html
index 042a82aa7a..21eca10f01 100644
--- a/hub/docs/unify/unify/unify.exceptions.html
+++ b/hub/docs/unify/unify/unify.exceptions.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -581,13 +509,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -595,41 +523,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/docs/unify/unify/unify.tests.html b/hub/docs/unify/unify/unify.tests.html
index 9e5b5c256e..f5c595bb89 100644
--- a/hub/docs/unify/unify/unify.tests.html
+++ b/hub/docs/unify/unify/unify.tests.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -661,13 +589,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -675,41 +603,11 @@
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/docs/unify/unify/unify.utils.html b/hub/docs/unify/unify/unify.utils.html
index 18fa9097ed..e88bee5baa 100644
--- a/hub/docs/unify/unify/unify.utils.html
+++ b/hub/docs/unify/unify/unify.utils.html
@@ -62,7 +62,7 @@
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="../../../genindex.html" />
     <link rel="search" title="Search" href="../../../search.html" />
-    <link rel="next" title="Python Package Examples" href="../../../demos/unify.html" />
+    <link rel="next" title="Connecting your stack" href="../../../console/connecting_stack.html" />
     <link rel="prev" title="Tests" href="unify.tests.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../api/router.html">
+                      <a class="nav-link nav-internal" href="../../../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../../../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../../../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../../../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../../../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../../../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -661,11 +589,11 @@
       </div>
     </a>
     <a class="right-next"
-       href="../../../demos/unify.html"
+       href="../../../console/connecting_stack.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
-        <p class="prev-next-title">Python Package Examples</p>
+        <p class="prev-next-title">Connecting your stack</p>
       </div>
       <i class="fa-solid fa-angle-right"></i>
     </a>
@@ -756,13 +684,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../../../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="current nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="unify.clients.html">Clients</a></li>
@@ -770,41 +698,11 @@
 <li class="toctree-l1"><a class="reference internal" href="unify.tests.html">Tests</a></li>
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../../../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../../../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../../../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../../../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/genindex.html b/hub/genindex.html
index 27aec0c848..31cb2123d0 100644
--- a/hub/genindex.html
+++ b/hub/genindex.html
@@ -152,21 +152,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/unify_api.html">
+                      <a class="nav-link nav-internal" href="concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/router.html">
+                      <a class="nav-link nav-internal" href="concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -180,68 +180,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="on_prem/on_prem_access.html">
                         On-Prem access
@@ -288,13 +246,13 @@
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -302,41 +260,11 @@
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -794,13 +722,13 @@ <h2 id="U">U</h2>
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -808,41 +736,11 @@ <h2 id="U">U</h2>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/home/home.html b/hub/home/home.html
index 3b459a9e4e..161ada81be 100644
--- a/hub/home/home.html
+++ b/hub/home/home.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -507,13 +435,13 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -521,41 +449,11 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/index.html b/hub/index.html
index ee84627723..ba9a254696 100644
--- a/hub/index.html
+++ b/hub/index.html
@@ -62,7 +62,7 @@
     <link rel="icon" href="https://github.com/unifyai/unifyai.github.io/blob/main/img/externally_linked/ivy_logo_only.png?raw=true"/>
     <link rel="index" title="Index" href="genindex.html" />
     <link rel="search" title="Search" href="search.html" />
-    <link rel="next" title="Universal API" href="api/unify_api.html" />
+    <link rel="next" title="Universal API" href="concepts/unify_api.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -154,21 +154,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/unify_api.html">
+                      <a class="nav-link nav-internal" href="concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/router.html">
+                      <a class="nav-link nav-internal" href="concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -182,68 +182,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="on_prem/on_prem_access.html">
                         On-Prem access
@@ -290,13 +248,13 @@
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -304,41 +262,11 @@
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -400,10 +328,6 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
 </div>
 <div class="toctree-wrapper compound">
 </div>
-<div class="toctree-wrapper compound">
-</div>
-<div class="toctree-wrapper compound">
-</div>
 </section>
 </section>
 
@@ -418,7 +342,7 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
                   
 <div class="prev-next-area">
     <a class="right-next"
-       href="api/unify_api.html"
+       href="concepts/unify_api.html"
        title="next page">
       <div class="prev-next-info">
         <p class="prev-next-subtitle">next</p>
@@ -505,13 +429,13 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
 <li class="toctree-l1 current active"><a class="current reference internal" href="#">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -519,41 +443,11 @@ <h2>Getting Started<a class="headerlink" href="#getting-started" title="Link to
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/objects.inv b/hub/objects.inv
index 586df95169..be34c253bd 100644
Binary files a/hub/objects.inv and b/hub/objects.inv differ
diff --git a/hub/on_prem/on_prem_access.html b/hub/on_prem/on_prem_access.html
index 459174f619..fcf1ded587 100644
--- a/hub/on_prem/on_prem_access.html
+++ b/hub/on_prem/on_prem_access.html
@@ -63,7 +63,7 @@
     <link rel="index" title="Index" href="../genindex.html" />
     <link rel="search" title="Search" href="../search.html" />
     <link rel="next" title="SSO (Single Sign On)" href="sso.html" />
-    <link rel="prev" title="Routing" href="../concepts/routing.html" />
+    <link rel="prev" title="Building a custom router" href="../console/building_router.html" />
   <meta name="viewport" content="width=device-width, initial-scale=1"/>
   <meta name="docsearch:language" content="en"/>
   </head>
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item current active">
                       <a class="nav-link nav-internal" href="#">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="current nav bd-sidenav">
@@ -414,12 +342,12 @@ <h1>On-Prem access<a class="headerlink" href="#on-prem-access" title="Link to th
                   
 <div class="prev-next-area">
     <a class="left-prev"
-       href="../concepts/routing.html"
+       href="../console/building_router.html"
        title="previous page">
       <i class="fa-solid fa-angle-left"></i>
       <div class="prev-next-info">
         <p class="prev-next-subtitle">previous</p>
-        <p class="prev-next-title">Routing</p>
+        <p class="prev-next-title">Building a custom router</p>
       </div>
     </a>
     <a class="right-next"
@@ -493,13 +421,13 @@ <h1>On-Prem access<a class="headerlink" href="#on-prem-access" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -507,41 +435,11 @@ <h1>On-Prem access<a class="headerlink" href="#on-prem-access" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="current nav bd-sidenav">
diff --git a/hub/on_prem/sso.html b/hub/on_prem/sso.html
index 1b65518ff2..f777473e27 100644
--- a/hub/on_prem/sso.html
+++ b/hub/on_prem/sso.html
@@ -152,21 +152,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -180,68 +180,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="on_prem_access.html">
                         On-Prem access
@@ -288,13 +246,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -302,41 +260,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="current nav bd-sidenav">
@@ -550,13 +478,13 @@ <h1>SSO (Single Sign On)<a class="headerlink" href="#sso-single-sign-on" title="
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -564,41 +492,11 @@ <h1>SSO (Single Sign On)<a class="headerlink" href="#sso-single-sign-on" title="
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="current nav bd-sidenav">
diff --git a/hub/py-modindex.html b/hub/py-modindex.html
index b36b560503..01177d214f 100644
--- a/hub/py-modindex.html
+++ b/hub/py-modindex.html
@@ -155,21 +155,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/unify_api.html">
+                      <a class="nav-link nav-internal" href="concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/router.html">
+                      <a class="nav-link nav-internal" href="concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -183,68 +183,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="on_prem/on_prem_access.html">
                         On-Prem access
@@ -291,13 +249,13 @@
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -305,41 +263,11 @@
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -490,13 +418,13 @@ <h1>Python Module Index</h1>
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -504,41 +432,11 @@ <h1>Python Module Index</h1>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/search.html b/hub/search.html
index 11dd207838..54866807df 100644
--- a/hub/search.html
+++ b/hub/search.html
@@ -154,21 +154,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/unify_api.html">
+                      <a class="nav-link nav-internal" href="concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="api/router.html">
+                      <a class="nav-link nav-internal" href="concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -182,68 +182,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="on_prem/on_prem_access.html">
                         On-Prem access
@@ -290,13 +248,13 @@
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -304,41 +262,11 @@
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -474,13 +402,13 @@ <h1>Search</h1>
 <li class="toctree-l1"><a class="reference internal" href="index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -488,41 +416,11 @@ <h1>Search</h1>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/searchindex.js b/hub/searchindex.js
index ffcc20e2b8..28733e719b 100644
--- a/hub/searchindex.js
+++ b/hub/searchindex.js
@@ -1 +1 @@
-Search.setIndex({"docnames": ["api/benchmarks", "api/deploy_router", "api/first_request", "api/images", "api/reference", "api/router", "api/unify_api", "concepts/benchmarks", "concepts/endpoints", "concepts/on_prem_images", "concepts/routing", "demos/demos/LangChain/RAG_playground/README", "demos/demos/LangChain/README", "demos/demos/LlamaIndex/BasicUsage/unify", "demos/demos/LlamaIndex/RAGPlayground/README", "demos/demos/LlamaIndex/README", "demos/demos/README", "demos/demos/Unify/AsyncVsSync/AsyncVsSync", "demos/demos/Unify/ChatBot/ChatBot", "demos/demos/Unify/Chatbot_Arena/CONTRIBUTING", "demos/demos/Unify/Chatbot_Arena/README", "demos/demos/Unify/LLM-Wars/README", "demos/demos/Unify/LLM_Debate/README", "demos/demos/Unify/README", "demos/demos/Unify/SemanticRouter/README", "demos/demos/Unify/SemanticRouter/layer-dynamic-routes", "demos/demos/template/README_TEMPLATE", "demos/langchain", "demos/llamaindex", "demos/unify", "docs/unify/unify", "docs/unify/unify/unify.chat", "docs/unify/unify/unify.clients", "docs/unify/unify/unify.exceptions", "docs/unify/unify/unify.tests", "docs/unify/unify/unify.utils", "home/home", "index", "interfaces/building_router", "interfaces/connecting_stack", "interfaces/running_benchmarks", "on_prem/on_prem_access", "on_prem/sso", "tools/openapi", "tools/python_library"], "filenames": ["api/benchmarks.rst", "api/deploy_router.rst", "api/first_request.rst", "api/images.rst", "api/reference.rst", "api/router.rst", "api/unify_api.rst", "concepts/benchmarks.rst", "concepts/endpoints.rst", "concepts/on_prem_images.rst", "concepts/routing.rst", "demos/demos/LangChain/RAG_playground/README.md", "demos/demos/LangChain/README.md", "demos/demos/LlamaIndex/BasicUsage/unify.ipynb", "demos/demos/LlamaIndex/RAGPlayground/README.md", "demos/demos/LlamaIndex/README.md", "demos/demos/README.md", "demos/demos/Unify/AsyncVsSync/AsyncVsSync.ipynb", "demos/demos/Unify/ChatBot/ChatBot.ipynb", "demos/demos/Unify/Chatbot_Arena/CONTRIBUTING.md", "demos/demos/Unify/Chatbot_Arena/README.md", "demos/demos/Unify/LLM-Wars/README.md", "demos/demos/Unify/LLM_Debate/README.md", "demos/demos/Unify/README.md", "demos/demos/Unify/SemanticRouter/README.md", "demos/demos/Unify/SemanticRouter/layer-dynamic-routes.ipynb", "demos/demos/template/README_TEMPLATE.md", "demos/langchain.rst", "demos/llamaindex.rst", "demos/unify.rst", "docs/unify/unify.rst", "docs/unify/unify/unify.chat.rst", "docs/unify/unify/unify.clients.rst", "docs/unify/unify/unify.exceptions.rst", "docs/unify/unify/unify.tests.rst", "docs/unify/unify/unify.utils.rst", "home/home.rst", "index.rst", "interfaces/building_router.rst", "interfaces/connecting_stack.rst", "interfaces/running_benchmarks.rst", "on_prem/on_prem_access.rst", "on_prem/sso.rst", "tools/openapi.rst", "tools/python_library.rst"], "titles": ["Benchmarking", "Deploying a router", "Making your first request", "On-Prem Images", "API Reference", "Routing", "Universal API", "Benchmarks", "Model Endpoints", "On-Prem Images", "Routing", "RAG Playground \ud83d\udedd", "LangChain Projects", "LlamaIndex", "RAG Playground", "LlamaIndex Projects", "Demos", "Synchronous VS Asynchronous Clients", "Build a ChatBot", "How to become a contributor and submit your own code", "Chatbot Arena", "LLM-Wars", "AI Debate App", "Unify Projects", "Semantic Router", "Dynamic Routes", "Project Title", "LangChain Examples", "LlamaIndex Examples", "Python Package Examples", "&lt;no title&gt;", "Chat", "Clients", "Exceptions", "Tests", "Utils", "Welcome to Unify!", "Home", "Building a custom router", "Connecting your stack", "Benchmarking endpoints", "On-Prem access", "SSO (Single Sign On)", "OpenAPI Specification", "Python Library"], "terms": {"when": [0, 1, 2, 4, 5, 7, 8, 10, 17, 18, 25, 32, 36, 37, 38], "compar": [0, 7, 11, 17, 20, 36, 37, 40], "llm": [0, 1, 2, 7, 8, 10, 11, 13, 16, 18, 22, 25, 29, 31, 36, 37, 39, 40], "i": [0, 1, 2, 4, 6, 7, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 24, 25, 26, 31, 32, 35, 36, 37, 38, 39, 40, 42], "constant": 0, "tradeoff": 0, "make": [0, 1, 4, 7, 8, 10, 13, 18, 24, 25, 32, 36, 37, 38], "between": [0, 2, 5, 6, 7, 10, 17, 18, 21, 22, 25, 32, 38], "qualiti": [0, 5, 18, 24, 38], "cost": [0, 1, 5, 6, 7, 10, 11, 18, 24, 36, 37, 38, 40], "latenc": [0, 1, 5, 7, 10, 11, 36, 37, 38, 40], "stronger": 0, "model": [0, 1, 4, 5, 6, 7, 10, 11, 13, 14, 18, 20, 21, 22, 24, 25, 31, 32, 35, 36, 37, 38, 39, 40, 42], "ar": [0, 1, 2, 5, 6, 7, 8, 10, 13, 17, 18, 19, 20, 21, 24, 25, 36, 37, 38, 39, 40], "gener": [0, 1, 2, 4, 5, 6, 7, 10, 13, 17, 18, 21, 22, 25, 26, 27, 28, 32, 42], "slower": 0, "more": [0, 2, 5, 7, 8, 10, 11, 12, 13, 15, 17, 18, 23, 24, 25, 32, 40], "expens": 0, "sometim": [0, 6, 7, 8, 18], "overkil": 0, "task": [0, 1, 5, 7, 10, 13, 14, 17, 18, 38, 40], "hand": [0, 7, 40], "complic": 0, "matter": [0, 18], "further": [0, 25, 32, 38], "new": [0, 2, 5, 6, 7, 16, 18, 25, 38, 39, 40], "releas": [0, 5, 13, 25], "weekli": 0, "each": [0, 1, 5, 6, 7, 10, 13, 16, 17, 18, 20, 21, 24, 25, 29, 35, 36, 37, 38, 40], "claim": [0, 18], "state": [0, 17, 18], "art": 0, "data": [0, 1, 13, 14, 20, 25, 38], "let": [0, 1, 2, 8, 10, 13, 17, 25, 36, 37, 38, 39, 40], "you": [0, 1, 2, 4, 5, 6, 7, 8, 10, 11, 12, 13, 15, 16, 17, 18, 19, 20, 21, 24, 25, 26, 36, 37, 38, 39, 40, 42], "see": [0, 6, 10, 17, 18, 19, 21, 36, 37, 38, 40], "differ": [0, 4, 5, 7, 8, 10, 13, 16, 22, 25, 29, 38, 40], "perform": [0, 1, 7, 8, 10, 11, 13, 14, 17, 18, 20, 36, 37, 38, 40], "can": [0, 1, 2, 4, 5, 6, 7, 8, 10, 11, 13, 17, 18, 19, 20, 21, 22, 24, 25, 36, 37, 38, 39, 40, 42], "relat": [0, 7, 8, 16], "live": [0, 5, 6, 11, 14, 17, 18, 20, 22, 24], "stat": 0, "pull": [0, 16, 19, 42], "from": [0, 1, 2, 4, 5, 6, 7, 10, 11, 13, 16, 17, 18, 20, 21, 24, 25, 31, 32, 35, 36, 37, 38, 40, 42], "our": [0, 1, 2, 6, 7, 8, 10, 13, 17, 18, 25, 26, 36, 37, 38, 39, 40, 41, 42], "runtim": [0, 5, 6, 18], "come": [0, 4, 5, 6, 7, 8], "out": [0, 2, 5, 6, 8, 11, 14, 17, 18, 19, 20, 21, 22, 24], "simpli": [0, 2, 8, 13, 40], "re": [0, 17, 18, 19, 26, 36, 37, 38, 40, 42], "run": [0, 2, 6, 7, 11, 12, 13, 14, 15, 17, 18, 22, 24, 25, 26, 31, 38, 39, 42], "thei": [0, 5, 6, 7, 8, 10, 18, 21], "first": [0, 1, 4, 5, 6, 7, 13, 14, 18, 25, 36, 37, 38, 40], "creat": [0, 2, 4, 6, 7, 13, 14, 16, 17, 21, 22, 24, 25, 38, 39], "which": [0, 4, 5, 6, 7, 10, 13, 17, 18, 19, 20, 25, 38, 40, 42], "repres": [0, 18, 31], "want": [0, 1, 2, 7, 10, 13, 19, 38, 39, 40], "evalu": [0, 7, 21, 35, 40], "need": [0, 1, 2, 5, 6, 7, 8, 17, 18, 19, 24, 26, 36, 37, 38, 39, 40], "list": [0, 2, 6, 7, 8, 12, 15, 21, 25, 26, 32, 35, 38, 40], "prompt": [0, 1, 5, 6, 7, 10, 13, 17, 18, 21, 22, 24, 25, 32, 35, 36, 37, 39, 40], "option": [0, 1, 5, 7, 18, 20, 31, 32, 35, 38, 39], "includ": [0, 1, 7, 12, 15, 16, 18, 24, 25, 36, 37, 38, 39, 40], "refer": [0, 5, 7, 13, 18, 19, 39], "gold": 0, "standard": [0, 6, 7, 19, 39], "answer": [0, 5, 7, 14, 18, 25, 39], "contain": [0, 2, 5, 6, 12, 15, 16, 18, 20, 23, 25, 26, 32, 35, 39, 40], "tend": [0, 25, 40], "get": [0, 1, 5, 6, 7, 11, 13, 18, 24, 25, 31, 32, 35, 41], "accur": [0, 7, 21, 24], "The": [0, 2, 4, 5, 6, 7, 10, 11, 13, 14, 16, 17, 19, 20, 21, 25, 26, 31, 32, 35, 36, 37, 38, 39, 40, 42], "file": [0, 2, 5, 11, 14, 20, 25, 35, 39, 42], "itself": 0, "should": [0, 2, 6, 7, 12, 15, 16, 18, 21, 25, 39, 40, 42], "jsonl": [0, 5, 39], "format": [0, 4, 5, 6, 7, 8, 12, 15, 18, 26, 31, 32], "one": [0, 1, 2, 4, 5, 6, 7, 8, 10, 11, 13, 17, 21, 25, 29, 39, 40], "entri": [0, 5], "per": [0, 1, 7, 10, 18, 38], "line": [0, 2, 7, 25, 26], "exampl": [0, 1, 2, 4, 5, 6, 7, 12, 13, 15, 16, 18, 25, 26, 38, 39], "below": [0, 1, 2, 7, 10, 11, 13, 14, 17, 18, 20, 21, 22, 24, 38, 39, 40], "thi": [0, 1, 2, 4, 5, 6, 7, 8, 10, 12, 13, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 36, 37, 38, 39, 40, 42], "ref_answ": [0, 5], "second": [0, 1, 7, 10, 18, 38], "us": [0, 4, 5, 6, 7, 8, 10, 11, 12, 15, 16, 17, 18, 21, 22, 23, 24, 25, 26, 28, 31, 32, 35, 36, 37, 38, 39, 40, 42], "least": [0, 7, 13, 17, 40], "50": 0, "most": [0, 5, 7, 8, 13, 17, 18, 24, 25, 39], "result": [0, 5, 10, 14, 17, 18, 38, 39, 40], "current": [0, 1, 4, 6, 7, 18, 36, 37, 38, 40], "an": [0, 1, 5, 6, 7, 8, 10, 11, 13, 14, 17, 18, 19, 20, 21, 25, 29, 31, 32, 35, 36, 37, 38, 39], "maximum": 0, "limit": [0, 2, 5, 6, 21], "500": [0, 33], "we": [0, 1, 2, 5, 6, 7, 8, 10, 13, 16, 17, 18, 19, 25, 36, 37, 38, 39, 40], "don": [0, 4, 7, 11, 13, 18, 38], "t": [0, 1, 2, 4, 5, 7, 11, 13, 17, 18, 19, 25, 38, 40], "much": [0, 1, 5, 17, 18], "extra": [0, 20], "detail": [0, 1, 2, 4, 6, 12, 15, 17, 18, 19, 23, 38, 42], "past": [0, 18], "250": 0, "In": [0, 1, 2, 5, 6, 7, 8, 10, 17, 18, 25, 26, 36, 37, 38, 39, 40], "dashboard": [0, 5, 38, 40], "click": [0, 5, 11, 20, 38, 39, 40], "select": [0, 5, 7, 10, 11, 18, 20, 21, 22, 36, 37, 38, 40], "open": [0, 13, 18, 19, 21, 38, 40], "interfac": [0, 1, 2, 5, 6, 7, 8, 11, 13, 14, 18, 20, 21, 22, 36, 37, 39, 40], "upload": [0, 2, 5, 7, 11, 14, 35, 38, 39, 40], "finish": [0, 5, 7], "ll": [0, 1, 2, 5, 7, 8, 17, 18, 19, 36, 37, 38, 39, 40], "receiv": [0, 5, 10, 19, 21, 22, 38], "email": [0, 5, 38], "graph": [0, 5, 7, 10, 38, 40], "displai": [0, 5, 14, 20, 21, 38, 40], "x": [0, 2, 4, 6, 25, 38, 40, 42], "axi": [0, 40], "set": [0, 1, 2, 6, 7, 8, 11, 13, 18, 19, 21, 24, 25, 31, 32, 34, 38, 39], "time": [0, 1, 5, 6, 7, 10, 13, 17, 18, 20, 21, 22, 38, 40], "token": [0, 1, 5, 6, 10, 13, 32, 38, 40], "inter": [0, 1, 5, 7, 13, 18, 38], "either": [0, 6, 7, 18, 19, 36, 37, 38], "linear": 0, "log": [0, 11], "scale": [0, 7, 8], "gpt4o": 0, "judg": [0, 7, 17, 21], "cf": 0, "http": [0, 2, 4, 8, 14, 19, 20, 21, 22, 24, 25, 32, 33, 35, 42], "arxiv": 0, "org": 0, "ab": 0, "2306": 0, "05685": 0, "": [0, 1, 2, 5, 6, 7, 8, 10, 11, 13, 16, 17, 21, 22, 24, 25, 32, 36, 37, 38, 39, 40, 42], "respons": [0, 1, 2, 4, 5, 6, 7, 10, 13, 17, 18, 21, 22, 24, 25, 32, 35, 36, 37, 42], "section": [1, 2, 7, 8, 10, 12, 15, 24, 26, 36, 37, 38, 39, 40], "learn": [1, 2, 4, 5, 7, 8, 10, 13, 17, 18, 28, 36, 37, 38, 39, 40], "how": [1, 2, 5, 6, 7, 8, 10, 12, 13, 15, 17, 18, 21, 25, 26, 28, 36, 37, 38, 39, 40], "unifi": [1, 2, 4, 8, 11, 12, 15, 16, 17, 18, 20, 21, 22, 25, 27, 28, 31, 32, 33, 34, 35, 38, 39, 42], "through": [1, 2, 6, 7, 8, 18, 20, 36, 37, 38, 39, 40], "api": [1, 5, 8, 11, 13, 17, 18, 20, 21, 22, 25, 31, 32, 35, 36, 37, 38, 39, 42], "If": [1, 2, 4, 6, 7, 11, 12, 13, 15, 16, 18, 19, 21, 24, 26, 31, 32, 35, 36, 37, 38, 39, 40], "haven": [1, 2, 19, 40], "done": [1, 2, 19, 38, 40], "so": [1, 2, 6, 7, 8, 10, 13, 17, 18, 19, 25, 36, 37, 38, 39, 40], "recommend": [1, 2, 19, 25, 36, 37, 40], "request": [1, 4, 7, 8, 10, 13, 16, 17, 18, 19, 25, 33, 36, 37, 38, 40, 42], "familiar": [1, 7, 8, 10, 36, 37], "leverag": [1, 10, 14, 17], "inform": [1, 7, 8, 10, 11, 18, 36, 37, 38, 40], "benchmark": [1, 2, 5, 6, 8, 10, 11, 13, 18, 36, 37, 38, 39], "automat": [1, 6, 10, 13, 18, 38], "rout": [1, 2, 11, 18, 24, 29, 36, 37, 38, 39], "best": [1, 5, 7, 8, 10, 11, 13, 17, 24, 36, 37, 38], "provid": [1, 4, 5, 6, 7, 8, 10, 11, 12, 13, 15, 17, 18, 20, 21, 22, 26, 29, 31, 32, 35, 36, 37, 38, 39, 40], "choos": [1, 2, 5, 7, 13, 20, 38], "valu": [1, 7, 10, 18, 25, 31, 32, 35, 40], "chang": [1, 5, 10, 17, 18, 19, 20, 38, 40], "over": [1, 5, 7, 17, 18, 40], "dynam": [1, 7, 11, 18, 21, 24, 36, 37], "ensur": [1, 7, 10, 18, 19, 24, 38, 40], "alwai": [1, 10, 13, 17, 18, 40], "without": [1, 7, 10, 11, 13, 17, 36, 37], "have": [1, 2, 4, 5, 6, 7, 10, 11, 13, 16, 17, 18, 19, 25, 38, 39, 40, 42], "monitor": 1, "yourself": [1, 11, 14, 20, 21, 22, 24], "To": [1, 2, 4, 5, 6, 7, 11, 13, 17, 18, 21, 24, 25, 40, 41], "onli": [1, 2, 6, 7, 10, 13, 18, 24, 25, 36, 37, 38, 40], "provier": 1, "name": [1, 2, 4, 6, 11, 12, 14, 15, 18, 20, 21, 22, 24, 25, 26, 31, 32, 35, 38, 39, 40], "support": [1, 2, 6, 8, 11, 14, 18, 20, 21, 22, 24, 25, 26], "configur": [1, 2, 5, 10, 11, 13, 24, 25, 38, 40], "follow": [1, 4, 5, 6, 7, 11, 13, 14, 16, 18, 19, 21, 24, 26], "config": 1, "lowest": [1, 18], "input": [1, 4, 11, 18, 20, 22, 25], "output": [1, 6, 10, 13, 24, 25, 32, 40], "itl": [1, 7, 13], "ttft": [1, 7, 13, 40], "highest": [1, 18], "tk": [1, 18], "sec": [1, 18, 40], "For": [1, 2, 5, 7, 10, 12, 13, 15, 16, 17, 18, 25, 26, 38, 39, 40], "e": [1, 2, 5, 7, 10, 13, 25, 38, 40], "g": [1, 2, 7, 10, 38, 40], "python": [1, 11, 14, 16, 17, 20, 21, 23, 24, 25, 42], "packag": [1, 16, 17, 23, 24, 25], "endpoint": [1, 4, 7, 10, 11, 13, 17, 18, 20, 25, 31, 32, 35, 36, 37, 38], "import": [1, 2, 6, 7, 10, 13, 17, 18, 25, 42], "o": [1, 2, 13, 25], "assum": [1, 2, 7, 38, 39], "ad": [1, 2, 25, 40], "unify_kei": [1, 2, 17, 18, 25, 31, 32, 35], "your": [1, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20, 21, 22, 24, 26, 32, 36, 37, 42], "environ": [1, 2, 7, 11, 14, 18, 21, 24, 25, 31, 32, 35, 36, 37, 38], "variabl": [1, 2, 7, 13, 17, 18, 31, 32, 35], "otherwis": [1, 2, 21, 32, 35], "would": [1, 2, 6, 7, 13, 18, 38, 39, 40], "specifi": [1, 2, 4, 5, 6, 10, 35, 38, 39, 40], "api_kei": [1, 2, 6, 17, 18, 25, 31, 32, 35, 42], "argument": [1, 2, 4, 25], "mistral": [1, 2, 6, 13, 40], "7b": [1, 2, 6, 18, 40], "instruct": [1, 2, 6, 7, 12, 13, 14, 15, 19, 25, 26, 40], "v0": [1, 2, 4, 6, 13, 40], "3": [1, 2, 4, 6, 13, 17, 18, 25, 38, 40, 42], "explain": [1, 2, 4, 7, 8, 12, 13, 15, 17, 25, 26, 36, 37, 40, 42], "who": [1, 2, 4, 7, 17, 18, 42], "newton": [1, 2, 4, 17, 18, 42], "wa": [1, 2, 4, 17, 18, 32, 35, 42], "hi": [1, 2, 4, 6, 17, 18, 42], "entir": [1, 2, 4, 18, 40, 42], "theori": [1, 2, 4, 18, 42], "gravit": [1, 2, 4, 17, 18, 42], "give": [1, 2, 4, 7, 25, 36, 37, 42], "long": [1, 2, 4, 7, 18, 42], "pleas": [1, 2, 4, 12, 13, 15, 17, 18, 19, 23, 25, 42], "all": [1, 2, 4, 6, 7, 8, 10, 13, 17, 18, 19, 25, 33, 35, 38, 39, 40, 42], "achiev": [1, 2, 4, 10, 13, 21, 42], "addition": [1, 7, 17, 18], "multipl": [1, 7, 8, 12, 13, 15, 17, 26], "other": [1, 2, 6, 7, 10, 17, 18, 21, 25, 29, 38, 40], "featur": [1, 8, 11, 13, 36, 37], "enabl": [1, 11, 13, 18, 22, 36, 37, 38], "ani": [1, 2, 6, 7, 8, 13, 17, 18, 22, 24, 29, 36, 37, 38, 40], "whose": [1, 35], "lower": [1, 7, 32], "than": [1, 5, 7, 10, 13, 17, 18, 40], "specif": [1, 2, 4, 5, 7, 8, 18, 21, 35, 40], "just": [1, 2, 7, 18, 40], "append": [1, 4, 18, 25], "float": [1, 17, 18, 25, 32], "prefer": 1, "mode": [1, 10, 13, 18], "keep": [1, 18], "thing": [1, 17, 18], "simpl": [1, 13, 18], "alias": 1, "oc": 1, "ic": 1, "ot": 1, "illustr": [1, 10, 36, 37], "some": [1, 2, 6, 7, 10, 13, 17, 25, 36, 37, 38, 40], "0": [1, 2, 4, 6, 7, 13, 17, 18, 24, 25, 32, 38], "5input": 1, "case": [1, 2, 7, 8, 10, 21, 25, 38, 40], "ha": [1, 2, 6, 7, 13, 18, 19, 36, 37, 38], "smaller": [1, 5, 10, 13], "5": [1, 7, 13, 14, 17, 18, 25], "credit": [1, 4, 6, 13, 18, 31, 32], "million": 1, "1output": 1, "likewis": [1, 2], "scenario": [1, 7], "direct": [1, 13, 18], "offer": [1, 7, 8, 41], "1": [1, 5, 7, 13, 17, 18, 25, 32], "5ic": 1, "15itl": 1, "now": [1, 2, 7, 8, 10, 17, 18, 25, 38, 39, 40, 42], "someth": [1, 6, 13, 40], "similar": [1, 5, 24, 29], "alia": 1, "also": [1, 2, 7, 8, 13, 17, 18, 21, 24, 25, 38, 39, 40], "consid": [1, 7], "less": [1, 13, 18], "15": [1, 7, 17, 18, 25], "m": [1, 11, 13, 14, 18, 25], "depend": [1, 7, 10, 11, 12, 15, 20, 21, 22, 26, 38], "might": [1, 7, 18], "where": [1, 2, 7, 8, 10, 13, 18, 21, 32, 38, 40], "meet": [1, 6, 18, 38], "criteria": 1, "render": [1, 7], "unfulfil": 1, "404": [1, 33], "error": [1, 4, 25, 32, 33, 35], "correspond": [1, 2, 4, 12, 15, 23, 38, 40], "explan": 1, "detect": 1, "polici": [1, 7], "do": [1, 2, 7, 13, 17, 18, 24, 25, 26, 39], "like": [1, 2, 6, 7, 8, 10, 13, 17, 18, 21, 24, 25, 32, 36, 37, 38, 39, 40, 42], "won": [1, 18], "work": [1, 7, 10, 13, 17, 18, 19, 25, 36, 37, 38], "sinc": [1, 7], "price": [1, 7, 8], "yet": [1, 4, 7, 11, 18, 38], "001ic": 1, "status_cod": [1, 2], "cheapest": [1, 13], "fallback": 1, "payload": [1, 2, 6], "train": [1, 7, 40], "befor": [1, 2, 17, 18, 19, 24, 34, 38, 40], "id": [1, 2, 4, 6, 13, 38], "same": [1, 2, 5, 7, 8, 10, 13, 18, 25, 38], "call": [1, 17, 25, 38, 41], "code": [1, 2, 6, 7, 24, 25, 36, 37], "send": [1, 4, 10, 13, 17, 20, 21, 22, 36, 37, 40], "gpt": [1, 7, 13, 18, 25, 38], "claud": [1, 38, 42], "llama3": [1, 38], "anthropic_8": [1, 38], "28e": [1, 38], "03_4": [1, 38], "66e": [1, 38], "4_1": [1, 38], "00e": [1, 13, 38], "06": [1, 6, 38], "queri": [1, 4, 5, 7, 8, 10, 13, 14, 18, 22, 24, 25, 36, 37, 38, 39], "curl": [1, 2, 4, 6, 42], "among": [1, 7], "page": [1, 2, 4, 6, 7, 18, 38, 40], "That": [1, 17, 38, 39, 40], "know": [1, 2, 18, 25, 39, 40], "care": [1, 8], "about": [1, 4, 5, 7, 8, 10, 13, 14, 17, 18, 25, 40], "start": [1, 2, 7, 13, 17, 18, 21, 24, 25, 31], "applic": [1, 2, 4, 6, 7, 8, 10, 11, 13, 14, 17, 18, 20, 22, 24, 29, 33, 36, 37, 38, 42], "across": [2, 7, 8, 10, 11, 38, 39, 40], "alreadi": [2, 7, 17, 18, 19, 25, 38, 39], "sign": [2, 4, 6, 19, 36, 37], "consol": [2, 6, 11, 13, 17, 18, 38, 39, 40], "greet": 2, "There": [2, 6, 8, 18, 39, 40], "link": [2, 11, 12, 14, 15, 19, 20, 21, 22, 24, 26], "interact": [2, 4, 6, 7, 8, 17, 18, 20, 21, 22, 29, 31, 32, 36, 37], "suspect": 2, "leak": 2, "wai": [2, 6, 7, 8, 17, 18, 25, 38, 39], "safe": [2, 13], "regener": 2, "replac": [2, 6, 13], "old": [2, 18], "workflow": [2, 6], "balanc": [2, 4, 6, 7, 18, 38], "account": [2, 4, 6, 7, 13, 18, 32, 38, 40], "both": [2, 6, 7, 11, 18, 25, 38], "identifi": 2, "given": [2, 4, 7, 10, 17, 35], "go": [2, 4, 5, 6, 13, 17, 18, 25, 36, 37, 38, 40], "copi": [2, 5, 38], "top": [2, 6, 13, 14, 18, 40], "row": 2, "tabl": [2, 7, 12, 15, 25, 26, 40], "v2": 2, "show": [2, 18, 31, 38, 39, 40], "firework": [2, 6, 18], "ai": [2, 4, 6, 8, 13, 18, 20, 21, 39], "custom": [2, 7, 10, 13, 24, 33, 36, 37, 40], "abl": [2, 5, 19], "easiest": 2, "unifyai": [2, 6, 14, 17, 18, 24, 25, 42], "instal": [2, 6, 11, 14, 21, 22, 24], "pip": [2, 6, 11, 13, 14, 17, 18, 20, 21, 22, 24, 25], "script": [2, 11, 14], "insert": 2, "your_api_kei": [2, 4, 6], "env": [2, 14, 42], "project": [2, 16, 20, 21, 22, 24, 25], "pass": [2, 18, 19, 25], "client": [2, 6, 18, 29, 31, 42], "store": [2, 18], "safeti": 2, "remain": [2, 18, 32, 40], "readi": [2, 7, 36, 37, 38, 39], "method": [2, 7, 17, 18, 34], "abov": [2, 19, 25, 26], "return": [2, 6, 7, 17, 18, 19, 25, 31, 32, 34, 35, 36, 37], "string": [2, 5, 6, 7, 32], "access": [2, 6, 18, 19, 20, 24, 31, 32, 36, 37, 38, 40, 42], "coupl": [2, 19], "list_model": [2, 35], "list_provid": [2, 35], "addit": [2, 7, 16, 18, 25], "synchron": [2, 29], "asynchron": [2, 13, 29, 32], "well": [2, 6, 7, 18, 26, 38, 39], "stream": [2, 4, 6, 7, 18, 32], "check": [2, 8, 24, 40], "repo": [2, 14, 19, 22], "text": [2, 4, 6, 7, 13, 14, 20, 21], "chat": [2, 5, 6, 7, 11, 13, 17, 20, 25, 38, 42], "complet": [2, 5, 6, 13, 17, 24, 38, 40, 42], "wouldn": 2, "normal": [2, 17, 18, 25], "allow": [2, 5, 7, 8, 10, 13, 17, 19, 20, 24, 38, 40], "bypass": 2, "model_nam": [2, 18, 25, 31, 32], "provider_nam": [2, 18, 31, 32], "been": [2, 13, 18, 38], "deploi": [2, 6, 8, 12, 15, 22, 26, 36, 37, 38, 40], "languag": [2, 6, 7, 13, 21, 22], "post": [2, 6, 8, 42], "h": [2, 4, 6, 42], "accept": [2, 4, 6, 10, 18, 19, 42], "json": [2, 4, 6, 32, 35, 42], "author": [2, 4, 6, 18], "bearer": [2, 4, 6], "your_unify_kei": [2, 6], "content": [2, 4, 6, 7, 13, 18, 32, 35, 42], "type": [2, 4, 6, 8, 17, 18, 20, 25, 26, 31, 32, 34, 35, 42], "d": [2, 4, 6, 8, 13, 18, 19, 25, 36, 37, 38, 42], "messag": [2, 4, 6, 7, 13, 18, 20, 32, 42], "role": [2, 4, 6, 8, 13, 18, 21, 42], "user": [2, 4, 6, 7, 11, 13, 14, 17, 18, 20, 21, 22, 24, 25, 32, 38, 42], "true": [2, 6, 7, 13, 17, 18, 32], "Or": 2, "url": [2, 6, 21, 24], "header": [2, 6], "print": [2, 6, 13, 17, 18, 25], "200": [2, 4, 7], "chunk": [2, 6, 11, 14, 18, 32], "iter_cont": 2, "chunk_siz": 2, "1024": [2, 32], "decod": [2, 7], "utf": 2, "8": [2, 13, 17, 18, 25, 32], "els": [2, 18, 25, 40], "doc": [2, 25, 26], "avail": [2, 4, 5, 7, 10, 13, 21, 25, 35, 36, 37, 39], "here": [2, 4, 5, 7, 10, 12, 13, 15, 18, 21, 25, 26, 38], "thank": [2, 13, 18], "easili": [2, 14, 18], "integr": [2, 8, 12, 13, 14, 15, 16, 21, 25, 28, 39], "lot": 2, "switch": [2, 13, 18, 36, 37], "base_url": [2, 6, 42], "sai": [2, 6, 17], "test": [2, 7, 13, 19, 20, 21, 25, 38, 40], "word": [2, 13, 18], "showcas": [2, 21], "function": [2, 14, 17, 18, 25], "choic": [2, 4, 6, 11, 13, 18, 36, 37], "delta": [2, 6, 13], "end": [2, 6, 7, 8, 10, 13, 16, 17, 18, 21, 25], "take": [2, 7, 10, 18, 19, 38], "look": [2, 6, 7, 10, 13, 20, 25, 38, 42], "snippet": 2, "offlin": 2, "api_bas": 2, "order": [2, 17, 18, 20, 26, 40], "insert_model": 2, "next": [2, 5, 6, 7, 8, 10, 17, 21, 24, 38, 39, 40], "lorem": [3, 9, 43, 44], "ipsum": [3, 9, 43, 44], "welcom": [4, 7, 16, 18], "resourc": 4, "up": [4, 6, 11, 21, 24, 25, 32, 34], "kei": [4, 6, 7, 8, 10, 11, 13, 17, 18, 20, 25, 31, 32, 35, 36, 37, 39], "retriev": [4, 18, 27, 28, 31, 32], "authent": 4, "ok": 4, "success": [4, 32, 35], "oper": [4, 17], "associ": [4, 18, 35], "corresponding_user_id": 4, "232": [4, 6], "32": [4, 6], "401": [4, 33], "unauthor": [4, 33], "invalid": 4, "403": [4, 33], "forbidden": [4, 33], "Not": [4, 7, 33], "host": [4, 8, 10, 11, 14, 20, 21, 22, 24, 39], "openai": [4, 7, 13, 17, 18, 25, 31, 32, 39], "sure": [4, 7, 13, 19, 24, 25, 26], "its": [4, 6, 7, 18, 25, 38], "after": [4, 5, 14, 18, 25, 38], "llama": [4, 6, 13, 17, 18, 25, 38, 40], "8b": [4, 6], "anyscal": [4, 17, 18, 25], "fals": [4, 13, 18, 31, 32], "schema": 4, "object": [4, 6, 7, 10, 13, 17, 18, 25, 31, 32, 36, 37], "defin": [4, 7, 13, 17, 18, 25], "1704999905": 4, "meta": 4, "hf": 4, "xr868c": 4, "t4z": 4, "tkltfxxzsvq57wmhxb34el5zuuxsatfu": 4, "usag": [4, 6, 16, 28, 29], "completion_token": [4, 6, 13], "512": 4, "prompt_token": [4, 6, 13], "34": [4, 13, 17, 18, 24, 25], "total_token": [4, 6, 13], "546": 4, "finish_reason": [4, 6, 13], "length": [4, 7, 40], "index": [4, 6, 13], "isaac": [4, 17, 18], "1643": [4, 17], "1727": [4, 18], "assist": [4, 6, 13, 18, 20], "422": [4, 33], "unprocess": [4, 33], "entiti": [4, 33], "flexibl": [5, 13, 18], "handl": [5, 6, 10, 13, 17, 18, 24, 25], "advantag": 5, "sever": [5, 7, 10, 13, 18, 24], "reason": [5, 6, 7], "small": [5, 14, 18, 25], "faster": [5, 7, 18], "cheaper": 5, "wherea": [5, 25], "bigger": 5, "capabl": [5, 11, 14, 18, 21, 22], "often": [5, 18], "rang": [5, 7, 17, 25], "difficulti": 5, "everi": [5, 6, 7, 10, 13, 17, 18], "week": 5, "strength": [5, 21], "weak": 5, "continu": [5, 7, 17, 18], "improv": [5, 7, 16, 18, 24], "ride": 5, "wave": [5, 18], "abil": [5, 18, 21], "minimis": 5, "base": [5, 7, 13, 14, 17, 18, 20, 21, 24, 25, 29, 31, 32, 33, 34, 38], "statist": 5, "purpos": [5, 10, 13, 18, 21], "wide": [5, 7], "varieti": [5, 20, 39], "green": 5, "star": [5, 10, 40], "q": 5, "c": [5, 25], "4": [5, 7, 13, 17, 18, 25, 32, 38], "65e": 5, "03": [5, 13], "2": [5, 13, 17, 18, 25, 32], "08e": 5, "05": [5, 13, 25], "07e": 5, "paramet": [5, 6, 10, 17, 25], "stand": 5, "rel": [5, 7, 18], "weigh": 5, "customiz": [5, 7], "meaning": 5, "directli": [5, 7, 18], "restrict": 5, "them": [5, 7, 8, 13, 17, 19, 25, 38, 40], "model1": 5, "model2": 5, "model3": 5, "provider1": 5, "provider2": 5, "rate": [5, 7], "hit": 5, "move": [5, 7, 17, 18, 38], "mean": [5, 7, 10, 13, 17, 18, 42], "higher": [5, 7, 32], "singl": [5, 6, 10, 32, 36, 37], "ve": [5, 18, 39, 40], "found": [5, 13, 17, 18, 33], "those": [5, 18, 21, 39], "product": [5, 6, 7, 17], "visualis": [5, 8], "form": [5, 6, 18, 20], "xxx": 5, "yyi": 5, "accuraci": 5, "final": [5, 7, 18, 21, 38], "system": [5, 7, 13, 18, 20, 24, 32], "onc": [5, 7, 17, 19, 36, 37, 38, 39, 40, 42], "sea": 6, "own": [6, 7, 17, 25, 39], "subtl": 6, "nuanc": 6, "A": [6, 7, 8, 11, 14, 17, 20, 21, 22, 24, 25, 32, 35, 38], "common": [6, 8, 21, 39], "One": [6, 13], "program": [6, 17, 25], "three": [6, 7, 17, 18], "command": [6, 14, 18, 21, 24], "termin": [6, 21, 24], "unify_api_kei": [6, 13], "hello": [6, 16, 17, 18], "field": 6, "find": [6, 7, 8, 11, 18, 25, 40], "made": [6, 7, 18, 21], "togeth": [6, 13, 18], "1718888877": 6, "896bfc1ae84271aa": 6, "lhr": [6, 13], "25": [6, 18, 25], "13": [6, 17, 18, 25], "38": [6, 25], "7": [6, 13, 17, 18, 25], "6e": 6, "stop": [6, 13, 32], "It": [6, 7, 14, 18, 20, 21], "nice": [6, 18], "help": [6, 7, 8, 10, 13, 18, 24], "seed": [6, 7], "11563975138181362140": 6, "via": [6, 39], "number": [6, 7, 10, 17, 25, 32], "total": [6, 7, 17], "u": [6, 7, 13, 17, 18, 24, 25, 40, 41], "temperatur": [6, 11, 32], "max_token": [6, 32], "mai": [6, 7, 10, 18, 25, 38], "compat": 6, "download": [6, 17, 18, 35], "document": [6, 7, 11, 13, 14, 18], "readm": [6, 12, 15, 16, 21, 26], "sampl": [6, 7, 19, 32], "infer": [6, 7, 18], "design": [6, 14, 17, 18, 40], "exist": [6, 7, 13, 16, 17, 18, 19], "straightforward": 6, "try": [6, 7, 11, 14, 20, 21, 22, 24, 25], "rememb": [6, 18], "manag": [6, 17, 18], "spend": 6, "behind": [6, 12, 15, 26, 40], "scene": 6, "refil": 6, "get_credit": 6, "your_user_id": 6, "fine": [6, 18, 38], "tune": [6, 7, 11, 38, 40], "add": [6, 25, 26, 38, 39, 40], "relev": [6, 7, 8, 14, 24], "individu": [6, 10, 19], "outag": 6, "disrupt": 6, "combat": 6, "down": [6, 11, 12, 15, 26], "fail": [6, 25], "until": [6, 17, 18], "succe": 6, "reach": 6, "tag": [6, 11, 14, 20, 21, 22, 24, 26], "becom": [6, 10, 18], "model_a": 6, "provider_a": 6, "model_b": 6, "provider_b": 6, "actual": [6, 10, 13], "went": 6, "process": [7, 14, 17, 18, 24, 25], "discuss": [7, 10, 13, 18, 36, 37], "separ": [7, 18, 20, 40], "challeng": [7, 20, 21], "vari": [7, 13, 18, 40], "significantli": 7, "dataset": [7, 10, 35, 38, 40], "attempt": [7, 18, 21, 31, 32], "approach": [7, 18, 24], "bias": 7, "inevit": 7, "creep": 7, "target": [7, 36, 37], "assess": [7, 10, 20], "practic": [7, 18], "commun": [7, 16, 18, 20], "still": [7, 17, 18], "heavili": 7, "reli": 7, "manual": [7, 10, 38], "build": [7, 8, 10, 13, 14, 17, 25, 29, 39], "intuit": [7, 11, 21, 22], "around": 7, "expect": [7, 17], "behavior": 7, "while": [7, 8, 17, 18, 21, 32], "better": [7, 10, 13, 17, 29], "craft": [7, 18], "isn": 7, "sustain": 7, "evolv": [7, 18], "emerg": [7, 13], "rapid": 7, "pace": 7, "pipelin": [7, 10], "outlin": 7, "guid": [7, 19, 22, 36, 37], "strive": [7, 8], "systemat": 7, "rigor": 7, "repeat": [7, 21, 38], "scalabl": 7, "ident": 7, "passag": 7, "centric": 7, "variou": [7, 8, 12, 13, 15, 16, 18, 23, 38, 40], "suit": [7, 24, 40], "summar": [7, 13, 18], "etc": [7, 10], "These": [7, 17, 38], "broad": [7, 10], "categori": [7, 10, 25], "refin": 7, "subtask": 7, "technic": 7, "radic": 7, "reflect": [7, 17, 18], "believ": 7, "intend": [7, 38], "uniqu": [7, 8, 24], "assessor": 7, "requir": [7, 10, 11, 17, 18, 20, 21, 22, 24, 25, 38], "strictli": 7, "exclud": 7, "strike": 7, "modular": 7, "power": [7, 10, 13, 18, 21, 22], "review": [7, 16], "procedur": 7, "experi": [7, 18], "human": [7, 13, 17, 18, 21], "avoid": [7, 38], "introduc": [7, 18], "sent": [7, 10, 17], "Then": [7, 42], "ask": [7, 13, 14, 18, 29], "unlabel": 7, "b": [7, 36, 37], "label": [7, 39, 40], "categor": [7, 8], "irrelev": 7, "bad": [7, 33], "satisfactori": 7, "veri": [7, 10, 18, 38], "good": 7, "excel": 7, "map": 7, "numer": [7, 18], "proce": 7, "overal": [7, 24], "averag": [7, 10, 13, 40], "plot": [7, 10, 38, 40], "versu": 7, "instead": [7, 17], "alon": 7, "becaus": [7, 10, 18, 38], "expos": [7, 8, 39, 40], "As": [7, 10, 13, 17, 38, 40], "horizont": 7, "level": [7, 10, 18], "apart": 7, "despit": [7, 17], "issu": [7, 17, 18, 19, 24], "kind": 7, "bia": 7, "mitig": 7, "diversifi": 7, "step": [7, 11, 16, 21, 24, 38, 39, 42], "optim": [7, 8, 10, 14, 18, 24, 25], "plethora": 7, "discrep": 7, "complex": [7, 10, 13, 18, 21], "decis": [7, 21, 36, 37, 38], "reliabl": 7, "transpar": 7, "measur": [7, 17, 18], "openli": 7, "repositori": [7, 16], "driven": 7, "invit": 7, "everyon": 7, "audit": 7, "logic": 7, "contribut": [7, 17, 18], "extern": 7, "factor": [7, 10], "infrastructur": 7, "impact": [7, 18], "nevertheless": 7, "gaug": 7, "control": 7, "rather": [7, 18], "aim": [7, 10], "experienc": 7, "ultim": [7, 10], "subject": 7, "distort": 7, "agnost": 7, "certain": [7, 18, 38], "cold": 7, "zero": 7, "few": 7, "assumpt": 7, "possibl": [7, 10, 11, 38], "technologi": 7, "being": [7, 18], "toward": 7, "calcul": [7, 17, 18, 25], "chosen": [7, 22, 25], "cl100k_base": 7, "tiktoken": 7, "librari": [7, 17, 21], "mit": 7, "licens": 7, "adopt": 7, "fairli": 7, "specul": 7, "real": [7, 17, 18, 21, 22], "randomli": 7, "affect": [7, 10], "prefil": 7, "therefor": [7, 18, 38], "two": [7, 17, 18, 19, 20, 21, 22, 25, 29], "regim": 7, "short": 7, "sentenc": 7, "deviat": 7, "20": [7, 18, 25], "1000": 7, "100": 7, "cluster": 7, "programmat": 7, "bookcorpu": 7, "subset": 7, "appropri": [7, 10, 19, 24], "enough": [7, 17], "prefac": 7, "eo": 7, "earlier": [7, 18, 38, 40], "random": [7, 32], "discret": 7, "distribut": 7, "n": [7, 13, 18], "ones": [7, 13, 16, 40], "cap": 7, "necessari": [7, 12, 15, 25, 26, 40], "algorithm": 7, "attent": 7, "batch": 7, "runner": 7, "initi": [7, 13, 18, 21, 31, 32], "execut": [7, 17, 24, 25], "period": [7, 40], "region": [7, 40], "hong": 7, "kong": 7, "belgium": 7, "iowa": 7, "trigger": [7, 38, 40], "hour": 7, "captur": 7, "dure": [7, 18, 24, 25, 32], "arriv": 7, "packet": 7, "speed": [7, 11, 18, 36, 37, 38, 40], "insight": 7, "effici": [7, 17, 24, 25], "signifi": 7, "quicker": 7, "engag": [7, 21], "crucial": [7, 13, 17], "feedback": [7, 36, 37], "holist": 7, "view": [7, 20, 38, 40], "transmiss": 7, "consecut": 7, "valuabl": [7, 13], "tempor": 7, "within": [7, 16, 21, 22], "cohes": 7, "fluid": [7, 18], "seamless": [7, 36, 37], "taken": [7, 17], "equival": 7, "note": [7, 13, 17, 18, 25], "throughput": [7, 36, 37], "server": [7, 21, 33, 40], "doesn": 7, "boot": 7, "activ": [7, 11, 14, 18], "instanc": 7, "threshold": 7, "what": [7, 12, 15, 18, 21, 25, 26, 32, 42], "dumb": 7, "record": [7, 12, 15], "greater": 7, "ratio": 7, "10": [7, 13, 17, 18, 25], "warm": 7, "essenti": 7, "consist": [7, 8, 10, 13, 25], "potenti": [7, 17], "delai": 7, "last": [7, 13, 18, 25], "usual": [7, 8, 10], "benefici": [7, 13], "even": [7, 10, 17], "slightli": [7, 38], "On": [7, 11, 40], "aggreg": 7, "particularli": [7, 8], "concurr": [7, 17], "p90": 7, "90th": 7, "percentil": 7, "reduc": [7, 13, 38], "influenc": 7, "extrem": 7, "snapshot": 7, "shown": [7, 13, 17, 40], "ma5": 7, "smooth": 7, "techniqu": 7, "term": [7, 10, 18], "fluctuat": [7, 13], "clearer": 7, "trend": 7, "represent": [7, 21], "No": 7, "typic": [7, 18, 21], "due": [7, 13], "intern": [7, 18, 33], "quickli": [7, 10, 13], "fix": 7, "tackl": 7, "signific": 7, "network": 7, "unreli": 7, "point": [7, 18, 36, 37, 38, 40], "howev": [7, 10, 18, 38], "mind": [7, 18], "moment": [7, 10, 38], "sole": [7, 25], "focus": [7, 32], "nonetheless": 7, "public": [7, 10, 18], "face": [7, 29], "natur": [7, 17, 18, 21], "gibberish": 7, "implement": [7, 14, 18], "quantiz": 7, "compress": 7, "context": 7, "window": [7, 11, 14, 21, 38], "size": [7, 11], "stai": [7, 18], "explor": [7, 8, 16, 18, 22, 29, 38, 40], "concept": [8, 12, 15, 17, 26, 36, 37], "plai": [8, 11, 18], "critic": [8, 10], "load": [8, 14, 25], "boundari": [8, 21], "blurri": 8, "servic": [8, 10, 25, 36, 37, 42], "overlap": [8, 11], "think": [8, 18], "deploy": [8, 38], "stack": [8, 10, 12, 15, 26], "posit": [8, 16], "divers": [8, 10], "difficult": 8, "suitabl": 8, "blog": 8, "cloud": [8, 19, 39], "serv": [8, 18, 21], "metric": [8, 10, 18, 36, 37, 38, 40], "latest": [8, 18, 36, 37, 40, 42], "platform": [8, 19, 21, 22, 35, 36, 37], "mani": [8, 17, 18, 33], "said": [8, 39], "search": [8, 14, 38], "interest": [8, 17], "sort": [8, 10, 17, 40], "dive": 8, "steer": 10, "tediou": 10, "swap": 10, "pertain": 10, "motiv": [10, 12, 15, 18, 26], "With": [10, 18, 38], "router": [10, 13, 25, 29, 36, 37, 39, 40], "tweak": 10, "focu": 10, "By": [10, 24, 25, 40], "fraction": [10, 13], "idea": [10, 17], "simpler": [10, 13], "larger": [10, 13, 18, 21], "shape": 10, "datapoint": 10, "reveal": [10, 13, 40], "compromis": 10, "notic": [10, 25, 36, 37, 38], "constraint": 10, "minimum": 10, "virtual": [10, 11, 14], "infinit": 10, "construct": 10, "beyond": [10, 18, 21], "prototyp": 10, "bot": 10, "fast": 10, "inher": 10, "transient": 10, "read": [10, 36, 37], "traffic": 10, "devic": 10, "softwar": [10, 20], "hardwar": 10, "landscap": 10, "conclud": 10, "imag": [10, 13, 39, 40], "mixtral": [10, 13, 40], "8x7b": [10, 13], "dai": [10, 13, 18], "redirect": 10, "outperform": [10, 13, 25], "demo": [11, 14, 18, 20, 21, 22, 24, 25, 26], "browser": [11, 14, 20, 21, 22, 24, 26], "doe": [11, 12, 13, 14, 15, 20, 21, 22, 24, 25, 26, 38], "video": [11, 12, 13, 14, 15, 20, 21, 22, 24, 26], "version": [11, 14, 20, 21, 22, 24, 25], "streamlit": [11, 14, 20, 21, 22, 24, 29], "pdf": [11, 14], "analysi": 11, "hyperparamet": 11, "convers": [11, 14, 18, 20, 22, 32], "visit": 11, "drop": [11, 26], "menu": [11, 20], "submit": [11, 38, 40], "button": [11, 20, 38, 39], "enjoi": 11, "locat": [11, 13, 21, 25], "clone": [11, 14, 20, 21, 22], "machin": [11, 17], "txt": [11, 20, 21, 22, 25], "venv": [11, 14], "sourc": [11, 13, 14, 19, 20, 26], "bin": [11, 14], "r": [11, 13, 20, 21, 22], "rag_script": 11, "py": [11, 14, 20, 21, 22, 24, 25], "modul": 11, "github": [11, 12, 14, 15, 16, 19, 20, 21, 22, 24, 25, 26], "profil": [11, 12, 14, 15, 20, 21, 22, 26], "anthoni": 11, "okonneh": 11, "ao": 11, "oscar": 11, "arroyo": 11, "vega": 11, "oscarav": 11, "martin": 11, "oywa": 11, "folder": [12, 15, 16, 23, 26], "built": [12, 15, 16, 17, 18, 21, 22, 23, 28], "headov": [12, 15, 23], "brief": [12, 15, 18, 26], "describ": [12, 15, 17, 18, 19, 26], "demonstr": [12, 15, 16, 18, 21, 26], "tech": [12, 15, 26], "briefli": [12, 15, 26], "feel": [12, 13, 15, 16, 18, 26], "free": [12, 15, 16, 18, 26], "break": [12, 15, 18, 26], "subsect": [12, 15, 26, 40], "emb": [12, 15, 26], "app": [12, 14, 15, 19, 21, 24, 26, 29], "local": [12, 14, 15, 17, 18, 20, 22, 25, 26, 35, 39, 42], "somewher": [12, 15, 26], "john": [12, 15, 26], "johndo": [12, 15, 26], "jane": [12, 15, 26], "janedo": [12, 15, 26], "framework": 13, "connect": [13, 25], "larg": [13, 18, 21], "seamlessli": 13, "70b": [13, 18, 38], "llama_index": 13, "todai": [13, 17], "completionrespons": 13, "39": [13, 17, 18, 25], "great": [13, 18], "happi": [13, 38, 40], "question": [13, 14, 18, 19, 25, 29], "topic": [13, 22, 29], "additional_kwarg": 13, "raw": 13, "88b5fcf02e259527": 13, "logprob": 13, "none": [13, 17, 18, 25, 31, 32, 34, 35], "chatcompletionmessag": 13, "function_cal": [13, 25], "tool_cal": 13, "1716980504": 13, "system_fingerprint": 13, "completionusag": 13, "67": 13, "17": [13, 17, 18, 25], "84": 13, "56e": 13, "sso": 13, "valid": [13, 17], "turbo": [13, 18], "evidenc": 13, "geograph": 13, "cirumv": 13, "herm": 13, "gsm8k": 13, "hellaswag": 13, "mmlu": 13, "mt": 13, "bench": 13, "peform": [13, 17], "indivud": 13, "particular": 13, "router_2": 13, "58e": 13, "01_9": 13, "51e": 13, "04_3": 13, "91e": 13, "12e": 13, "01_5": 13, "04_2": 13, "78e": 13, "04": [13, 25], "ideal": 13, "wait": 13, "stream_complet": 13, "translat": 13, "german": [13, 18], "hei": [13, 17, 18], "street": [13, 18], "asap": 13, "show_provid": [13, 18, 31], "f": [13, 25], "flush": [13, 18], "hallo": 13, "gibt": 13, "einen": 13, "notfal": 13, "der": 13, "\u00fcbersetzungsstra\u00df": 13, "bitt": 13, "senden": 13, "sie": 13, "hilf": 13, "schnell": 13, "wie": 13, "m\u00f6glich": 13, "loos": 13, "phrase": 13, "liter": 13, "tri": 13, "convei": 13, "origin": [13, 19, 21, 25], "await": [13, 17], "acomplet": 13, "artifici": 13, "intellig": 13, "research": [13, 17], "organ": [13, 19], "decemb": [13, 18], "2015": 13, "goal": [13, 17, 21], "develop": [13, 17, 18, 19, 20], "highli": [13, 18], "autonom": 13, "econom": 13, "lead": 13, "spring": [13, 18], "advanc": [13, 21], "previous": [13, 38], "Its": 13, "chatgpt": 13, "deepinfra": 13, "pioneer": [13, 18], "facilit": 14, "llamaindex": [14, 16], "util": [14, 17, 18, 21, 22], "embed": [14, 25], "convert": [14, 26], "baai": [14, 25], "bge": [14, 25], "en": [14, 25], "v1": [14, 25], "rerank": 14, "reorder": 14, "enhanc": [14, 24], "st": 14, "experimental_frag": 14, "cache_resourc": 14, "extract": 14, "pdfreader": 14, "node": 14, "vectorstoreindex": 14, "from_docu": 14, "rank": 14, "com": [14, 19, 20, 22, 24, 25], "abhi2596": 14, "unifyai_rag_playground": 14, "tree": 14, "main": [14, 17, 21, 25], "poetri": 14, "linux": 14, "unix": 14, "git": [14, 20, 22], "cd": [14, 20], "abhijeet": 14, "chintakunta": 14, "langchain": 16, "discov": [16, 17, 18], "tailor": 16, "respect": [16, 17], "pr": 16, "placement": 16, "correct": [16, 21, 25], "directori": [16, 20, 21, 25], "templat": [16, 19], "anwaar": 16, "khalid": 16, "fri": 16, "grow": [17, 18], "demand": 17, "instant": 17, "grasp": 17, "implic": 17, "sync": [17, 29], "notebook": [17, 18, 25], "delv": 17, "variat": [17, 38], "assign": [17, 18], "enterunifykei": [17, 18], "cell": [17, 18, 25], "collect": [17, 18, 20, 21], "py3": [17, 18], "whl": [17, 18], "14": [17, 18, 25], "kb": [17, 18], "lt": [17, 18, 25], "gt": [17, 18, 25], "12": [17, 18, 25], "268": 17, "6": [17, 18, 25], "mb": 17, "eta": 17, "00": 17, "satisfi": [17, 18, 25], "31": [17, 18, 25], "usr": [17, 18], "lib": [17, 18], "python3": [17, 18], "dist": [17, 18], "anyio": [17, 18, 25], "distro": [17, 18, 25], "httpx": [17, 18, 25], "23": [17, 18, 25], "27": [17, 18, 25], "75": 17, "pydant": [17, 18, 25], "9": [17, 18, 25], "sniffio": [17, 18, 25], "tqdm": [17, 18, 25], "66": [17, 18, 25], "extens": [17, 18, 25], "11": [17, 18, 25, 38], "charset": [17, 18, 25], "idna": [17, 18, 25], "urllib3": [17, 18, 25], "21": [17, 18, 25], "certifi": [17, 18, 25], "2017": [17, 18, 25], "2024": [17, 18, 25], "exceptiongroup": [17, 18, 25], "httpcore": [17, 18, 25], "77": 17, "h11": [17, 18, 25], "58": 17, "annot": [17, 18, 25], "core": [17, 18, 21, 25], "16": [17, 18], "successfulli": [17, 18, 24, 25], "sequenti": 17, "must": [17, 18, 31, 32, 35], "fulli": [17, 25], "block": 17, "13b": [17, 25], "user_prompt": [17, 25, 32], "hoo": 17, "rai": 17, "tutu": 17, "young": 17, "grasshopp": 17, "brai": 17, "majest": 17, "figur": [17, 18, 40], "known": [17, 18, 25], "math": [17, 24, 25], "scienc": [17, 18], "he": [17, 18], "born": 17, "1642": [17, 18], "england": [17, 18], "grew": 17, "brilliant": 17, "thinker": 17, "fellow": [17, 18], "royal": [17, 18], "societi": [17, 18], "twirl": 17, "perhap": 17, "law": [17, 18], "motion": [17, 18], "univers": [17, 18], "graviti": [17, 18], "calculu": [17, 18], "understand": [17, 18, 21], "mathemat": [17, 18, 25], "mnum": 17, "hop": 17, "But": 17, "oh": 17, "bit": [17, 18], "alchemist": [17, 18], "studi": [17, 18], "light": [17, 18], "invent": 17, "fanci": 17, "piec": 17, "equip": 17, "telescop": [17, 18], "observ": [17, 18], "heaven": 17, "shimmer": 17, "renaiss": 17, "celebr": 17, "legaci": [17, 18], "inspir": [17, 18], "asyncunifi": [17, 32], "signal": 17, "paus": [17, 18], "asyncio": 17, "coroutin": 17, "tool": [17, 20], "resum": [17, 40], "ansyncio": 17, "conflict": [17, 18, 33], "event": 17, "loop": [17, 18, 25, 31], "workaround": 17, "net_asyncio": 17, "appli": [17, 38], "nest_asyncio": 17, "async_unifi": 17, "def": [17, 18, 25], "heya": 17, "blesh": 17, "talkin": 17, "bout": 17, "sir": [17, 18], "famou": 17, "english": [17, 18], "mathematician": [17, 18], "physicist": [17, 18], "nom": 17, "grass": 17, "17th": 17, "18th": 17, "centuri": [17, 18], "giggl": 17, "pretti": 17, "smart": 17, "dude": 17, "myself": 17, "flaunt": 17, "my": [17, 18], "ban": 17, "life": [17, 18, 42], "statu": [17, 18], "me": [17, 18, 25], "talk": [17, 25], "grin": 17, "woolsthorp": 17, "lincolnshir": 17, "triniti": [17, 18], "colleg": [17, 18], "cambridg": [17, 18], "later": [17, 18, 25], "becam": 17, "professor": [17, 18], "nbd": 17, "respond": [17, 19, 21], "forc": 17, "attract": 17, "proport": 17, "mass": 17, "invers": 17, "squar": 17, "distanc": 17, "geek": 17, "skill": 17, "inventor": 17, "engin": 17, "cool": [17, 18], "stuff": 17, "root": [17, 18], "impress": 17, "accomplish": 17, "privat": [17, 18, 40], "person": [17, 18], "wasn": 17, "sociabl": 17, "gui": 17, "temperament": 17, "had": [17, 38], "belief": 17, "alchemi": [17, 18], "scientif": [17, 18], "pursuit": 17, "rais": [17, 18, 25, 31, 32, 33, 35], "eyebrow": 17, "am": [17, 18], "shrug": 17, "basic": [17, 28], "scoop": 17, "hope": [17, 18], "enlighten": [17, 18], "wink": 17, "excus": 17, "groundbreak": 17, "instagram": 17, "caption": 17, "smize": 17, "helper": 17, "send_async_request": 17, "str": [17, 18, 25, 31, 32, 35], "send_sync_request": 17, "gather": 17, "run_async_request": 17, "num_request": 17, "int": [17, 32], "tell": [17, 18, 25], "favorit": [17, 18], "physic": [17, 18], "fact": [17, 18], "_": [17, 25], "run_sync_request": 17, "async_response_tim": 17, "sync_response_tim": 17, "351824045181274": 17, "55": 17, "45608472824097": 17, "synchor": 17, "congratul": [17, 18], "hopefulli": 17, "tutori": 17, "expor": 17, "chatbot": [17, 25, 29, 31], "agent": [17, 25, 31], "under": [18, 25, 40], "hood": 18, "stateless": 18, "histori": [18, 20, 31, 32, 40], "repeatedli": 18, "fed": 18, "correctli": [18, 24], "uninstal": 18, "class": [18, 25, 31, 32, 33, 34], "obtain": 18, "sy": 18, "__init__": [18, 25, 31, 32], "self": [18, 25], "arg": [18, 31, 32, 35], "default": [18, 25, 31, 32, 35, 38, 40], "uploaded_bi": [18, 31, 32], "unifyerror": [18, 31, 32, 33], "miss": [18, 31, 32], "_message_histori": 18, "_paus": 18, "_client": [18, 25], "properti": [18, 19, 31, 32], "set_client": [18, 31], "set_model": [18, 31, 32], "set_endpoint": [18, 31, 32], "join": 18, "split": 18, "set_provid": [18, 31, 32], "_model": 18, "_get_credit": 18, "get_credit_bal": [18, 32], "_process_input": 18, "inp": 18, "show_credit": [18, 31], "bool": [18, 31, 32], "whether": [18, 31], "consumpt": [18, 31], "yield": [18, 32, 36, 37], "_update_message_histori": 18, "initial_credit_bal": 18, "final_credit_bal": 18, "stdout": 18, "write": [18, 19, 25, 26], "spent": 18, "6f": 18, "updat": [18, 25, 40], "clear_chat_histori": [18, 31], "clear": [18, 20, 31], "enter": [18, 20, 25], "quit": 18, "exit": [18, 25], "back": [18, 22], "elif": [18, 25], "instanti": 18, "foo": 18, "barrymor": 18, "year": 18, "too": [18, 33], "concern": 18, "far": 18, "told": 18, "anyth": 18, "memori": 18, "astound": 18, "glad": 18, "amount": [18, 38], "constantli": [18, 36, 37], "perfect": 18, "forget": [18, 38], "misrememb": 18, "constructor": 18, "overwritten": [18, 38], "capit": 18, "palestin": 18, "polit": 18, "sensit": 18, "jerusalem": 18, "disput": 18, "isra": 18, "palestinian": 18, "side": [18, 25], "nation": 18, "govern": 18, "territori": 18, "west": 18, "bank": 18, "gaza": 18, "strip": 18, "administr": 18, "center": 18, "ramallah": 18, "de": 18, "facto": 18, "declar": [18, 21], "citi": 18, "debat": [18, 21, 29], "negoti": 18, "peac": 18, "recogn": 18, "countri": 18, "maintain": 18, "diplomat": 18, "mission": 18, "tel": 18, "aviv": 18, "israel": 18, "east": 18, "futur": [18, 38], "close": 18, "ti": 18, "broader": 18, "resolut": 18, "address": [18, 40], "000274": 18, "half": 18, "recal": 18, "creativ": [18, 21], "portug": 18, "lisbon": 18, "portugues": 18, "lisboa": 18, "000032": 18, "jos\u00e9": 18, "mourinho": 18, "ah": 18, "footbal": 18, "former": 18, "player": 18, "club": 18, "chelsea": 18, "milan": 18, "madrid": 18, "manchest": 18, "unit": [18, 19], "tactic": 18, "honor": 18, "award": 18, "throughout": [18, 36, 37], "career": 18, "leagu": 18, "titl": 18, "domest": 18, "cup": 18, "european": 18, "championship": 18, "000159": 18, "poem": 18, "embrac": 18, "tale": 18, "intertwin": 18, "beneath": 18, "sun": 18, "shine": 18, "cobbleston": 18, "echo": 18, "danc": 18, "tagu": 18, "gentl": 18, "entranc": 18, "youth": 18, "dreamt": 18, "iberian": 18, "ski": 18, "passion": 18, "fierc": 18, "ambit": 18, "never": 18, "di": 18, "ball": 18, "feet": 18, "dream": 18, "heart": 18, "grand": 18, "stori": 18, "part": [18, 21], "eduardo": 18, "vii": 18, "park": 18, "thought": 18, "took": 18, "place": [18, 38], "alfama": 18, "allei": 18, "fado": 18, "mourn": 18, "sound": 18, "benfica": 18, "nest": 18, "uni\u00e3o": 18, "leiria": 18, "helm": 18, "journei": 18, "began": 18, "realm": 18, "strategi": 18, "meticul": 18, "spun": 18, "foreshadow": 18, "triumph": 18, "est\u00e1dio": 18, "da": 18, "luz": 18, "eagl": 18, "soar": 18, "ponder": 18, "score": [18, 21, 40], "though": 18, "deep": 18, "lore": 18, "steep": 18, "boi": 18, "set\u00fabal": 18, "forth": [18, 22], "conquer": 18, "win": 18, "prevail": 18, "porto": 18, "london": 18, "stage": [18, 38], "written": 18, "amidst": 18, "victori": 18, "fame": 18, "bright": 18, "ever": 18, "flight": 18, "starri": 18, "night": 18, "spirit": 18, "vein": 18, "love": [18, 19, 36, 37], "game": 18, "forev": 18, "fall": [18, 25], "begin": [18, 25], "cherish": 18, "012020": 18, "mid": 18, "easier": 18, "maxim": 18, "save": [18, 20, 35, 38], "expand": [18, 40], "galaxi": 18, "awai": 18, "eventu": 18, "dark": 18, "energi": 18, "acceler": 18, "expans": 18, "fascin": 18, "boggl": 18, "vast": 18, "space": [18, 38], "mysteri": 18, "hold": 18, "remind": 18, "curiou": 18, "wonder": 18, "flag": 18, "fastest": [18, 40], "track": [18, 20, 38, 40], "primari": 18, "driver": 18, "fr": 18, "march": 18, "1726": 18, "polymath": 18, "astronom": 18, "theologian": 18, "philosoph": 18, "revolut": 18, "book": [18, 41], "philosophi\u00e6": 18, "naturali": 18, "principia": 18, "mathematica": 18, "principl": 18, "philosophi": 18, "publish": 18, "1687": 18, "consolid": 18, "previou": [18, 40], "establish": 18, "classic": 18, "mechan": 18, "semin": 18, "optic": 18, "share": 18, "gottfri": 18, "wilhelm": 18, "leibniz": 18, "infinitesim": 18, "formul": 18, "domin": 18, "viewpoint": 18, "supersed": 18, "descript": 18, "deriv": [18, 25], "kepler": 18, "planetari": 18, "tide": 18, "trajectori": 18, "comet": 18, "precess": 18, "equinox": 18, "phenomena": 18, "erad": 18, "doubt": 18, "solar": 18, "heliocentr": 18, "earth": 18, "celesti": 18, "bodi": 18, "could": [18, 25], "oblat": 18, "spheroid": 18, "confirm": 18, "geodet": 18, "maupertui": 18, "la": 18, "condamin": 18, "convinc": 18, "scientist": 18, "superior": 18, "newtonian": 18, "sophist": 18, "colour": 18, "prism": 18, "white": 18, "visibl": [18, 38], "spectrum": 18, "influenti": 18, "optick": 18, "1704": 18, "empir": 18, "theoret": 18, "notion": 18, "seri": 18, "generalis": 18, "binomi": 18, "theorem": 18, "non": 18, "integ": 18, "expon": 18, "approxim": 18, "classifi": 18, "cubic": 18, "plane": 18, "curv": 18, "lucasian": 18, "devout": 18, "unorthodox": 18, "christian": 18, "reject": 18, "doctrin": 18, "refus": 18, "holi": 18, "church": 18, "unlik": 18, "member": 18, "faculti": 18, "dedic": [18, 40], "biblic": 18, "chronologi": 18, "area": 18, "unpublish": 18, "death": 18, "whig": 18, "parti": [18, 21], "parliament": 18, "1689": 18, "1690": 18, "1701": 18, "1702": 18, "knight": 18, "queen": 18, "ann": 18, "1705": 18, "decad": 18, "warden": 18, "1696": 18, "1699": 18, "master": 18, "mint": 18, "presid": 18, "1703": 18, "octoai": 18, "busi": 18, "unusu": 18, "emot": 18, "jump": 19, "legal": 19, "hurdl": 19, "fill": 19, "corpor": 19, "cla": 19, "intellectu": 19, "googl": 19, "compani": 19, "propos": 19, "owner": 19, "promptli": 19, "fork": [19, 24], "desir": 19, "adher": [19, 39], "style": 19, "googlecloudplatform": 19, "wiki": 19, "html": 19, "global": 20, "leaderboard": 20, "complementari": 20, "articl": 20, "ui": 20, "fresh": 20, "vote": [20, 29], "box": 20, "sidebar": 20, "dropdown": [20, 38, 40], "press": [20, 38, 40], "attach": 20, "samthakur587": 20, "llm_playground": 20, "chatbot_arena": 20, "samund": 20, "singh": 20, "kacper": 20, "ko\u017cdo\u0144": 20, "w": 20, "kozdon": 20, "web": [21, 22], "competit": 21, "structur": [21, 25], "modern": 21, "visual": [21, 22, 38, 40], "educ": 21, "against": [21, 40], "predefin": [21, 24], "rule": 21, "highlight": 21, "present": 21, "engagingli": 21, "backend": [21, 22], "compet": 21, "cycl": 21, "suggest": [21, 25, 36, 37], "llm1": 21, "llm2": 21, "verif": 21, "verifi": [21, 38], "judgment": 21, "deem": 21, "incorrect": 21, "winner": 21, "revers": 21, "ongo": 21, "novel": 21, "push": 21, "adapt": 21, "demystifi": 21, "audienc": 21, "student": 21, "profession": 21, "At": 21, "effect": 21, "third": 21, "launch": [21, 24], "localhost": [21, 42], "8501": 21, "lee": 21, "bissessar": 21, "leebissessar": 21, "glorri": 21, "sibomana": 21, "whitelotus0": 21, "kato": 21, "steven": 21, "mubiru": 21, "katostevenmubiru": 21, "dialogu": 22, "wit": 22, "sanjay8602": 22, "kt5o9f": 22, "sanjai": 22, "suthar": 22, "ogban": 22, "ugot": 22, "ogbanugot": 22, "streamit": 24, "layer": [24, 25], "domain": 24, "deliv": 24, "contextu": 24, "satisfact": 24, "semanticrouterchatbot": 24, "respositori": 24, "ithanigaikumar": 24, "semanticrout": 24, "transform": 24, "torch": 24, "proceed": 24, "encount": 24, "usernam": 24, "indiradharshini": 24, "thanigaikumar": 24, "jeyabalan": 24, "nadar": 24, "jeyabalang": 24, "semant": [25, 29], "belong": 25, "static": 25, "produc": 25, "decid": [25, 38], "sqrt": 25, "64": 25, "ipynb": 25, "aurelio": 25, "lab": 25, "blob": 25, "__": 25, "qu": 25, "subprocess": 25, "wheel": 25, "cpp": 25, "pyproject": 25, "toml": 25, "did": 25, "scikit": 25, "cmake": 25, "29": [25, 38], "24": 25, "08": 25, "789": 25, "scikit_build_cor": 25, "warn": 25, "got": [25, 39], "libdir": 25, "ldlibrari": 25, "multiarch": 25, "masd": 25, "cach": 25, "indir": 25, "appdata": 25, "temp": 25, "tmppik1ey4m": 25, "cmakeinit": 25, "nmake": 25, "makefil": 25, "cmakelist": 25, "cmake_c_compil": 25, "enablelanguag": 25, "cmake_cxx_compil": 25, "incomplet": 25, "occur": [25, 32], "problem": 25, "microsoft": 25, "windowsapp": 25, "pythonsoftwarefound": 25, "10_qbz5n2kfra8p0": 25, "ex": 25, "upgrad": 25, "localcach": 25, "python310": 25, "site": 25, "2023": 25, "18": [25, 38], "colorama": 25, "treat": 25, "semantic_rout": 25, "math_rout": 25, "utter": 25, "solv": 25, "equat": 25, "proof": 25, "percentag": 25, "coding_rout": 25, "java": 25, "recurs": 25, "optimis": 25, "hash": 25, "encod": 25, "popular": [25, 40], "cohereencod": 25, "openaiencod": 25, "altern": [25, 38, 39], "fastembedencod": 25, "getpass": 25, "huggingfaceencod": 25, "rl": 25, "importerror": 25, "traceback": 25, "recent": 25, "fastemb": 25, "_initialize_cli": 25, "flagembed": 25, "26": 25, "except": 25, "cannot": 25, "textembed": 25, "unknown": 25, "anoth": 25, "score_threshold": 25, "19": 25, "todo": 25, "thoroughli": 25, "super": 25, "28": 25, "30": 25, "33": 25, "embedding_arg": 25, "35": 25, "max_length": 25, "36": 25, "cache_dir": 25, "37": 25, "thread": 25, "40": 25, "k": 25, "v": [25, 29], "item": 25, "routechoic": 25, "similarity_scor": 25, "setup": [25, 34], "test_unify_endpoint": 25, "adjust": 25, "test_prompt": 25, "__name__": 25, "__main__": 25, "44": 25, "process_queri": 25, "route_choic": 25, "codellama": 25, "34b": 25, "45": 25, "subtract": 25, "simplifi": 25, "solut": 25, "my_list": 25, "num": 25, "inclus": 25, "_note": 25, "sequenc": [25, 32, 40], "element": 25, "whole": [25, 39], "drag": 26, "href": 26, "generated_link": 26, "checkout": 26, "incas": 26, "project_nam": 26, "mp4": 26, "And": 26, "width": 26, "640": 26, "height": 26, "480": 26, "autoplai": 26, "src": 26, "_static": 26, "confus": 26, "rag": [27, 28], "playground": [27, 28], "augment": [27, 28], "async": [29, 32, 34], "war": 29, "off": [29, 38, 39], "tough": 29, "arena": 29, "anonym": 29, "watch": 29, "dar201": [31, 32], "noqa": [31, 32], "dar101": [31, 32], "system_prompt": 32, "union": 32, "asyncgener": 32, "dict": [32, 35], "dictionari": [32, 35], "max": 32, "determinist": 32, "left": 32, "badrequesterror": [32, 33, 35], "valueerror": [32, 35], "pars": [32, 35], "authenticationerror": 33, "400": 33, "conflicterror": 33, "409": 33, "internalservererror": 33, "notfounderror": 33, "permissiondeniederror": 33, "ratelimiterror": 33, "429": 33, "unprocessableentityerror": 33, "testasyncunifi": 34, "methodnam": 34, "runtest": 34, "isolatedasynciotestcas": 34, "hook": 34, "fixtur": 34, "exercis": 34, "test_generate_returns_generator_when_stream_tru": 34, "test_generate_returns_string_when_stream_fals": 34, "test_incorrect_model_name_raises_internal_server_error": 34, "test_invalid_api_key_raises_authentication_error": 34, "test_missing_api_key_raises_key_error": 34, "mock_get": 34, "testunifi": 34, "testcas": 34, "delete_dataset": 35, "delet": [35, 38], "path": 35, "info": 35, "msg": 35, "delete_evalu": 35, "remov": [35, 38, 40], "download_dataset": 35, "list_dataset": 35, "fetch": 35, "list_endpoint": 35, "empti": 35, "list_evalu": 35, "upload_dataset_from_dictionari": 35, "upload_dataset_from_fil": 35, "central": [36, 37], "plan": [36, 37], "high": [36, 37], "low": [36, 37], "unfi": [36, 37], "refactor": [36, 37], "quick": [36, 37], "mark": [36, 37], "beta": [36, 37], "iter": [36, 37], "roadmap": [36, 37], "leav": [36, 37], "variant": 38, "job": [38, 40], "schedul": 38, "behalf": [38, 39], "ahead": 38, "duplic": 38, "calls1": [38, 40], "call2": 38, "q1": 38, "q2": 38, "progress": [38, 40], "accordingli": 38, "trade": 38, "constrain": 38, "guarante": 38, "Of": 38, "cours": 38, "presum": 38, "anthrop": [38, 42], "properli": 38, "clauc": 38, "legend": [38, 40], "underneath": 38, "parent": 38, "stick": 38, "immedi": 38, "appear": [38, 40], "full": 38, "frequenc": 38, "gpt4": 38, "42": 38, "calls2": [38, 40], "ax": 38, "session": 38, "perman": 38, "anytim": 38, "besid": 38, "clipboard": 38, "along": 38, "shelf": 39, "azur": 39, "ml": 39, "catalog": 39, "vertex": 39, "garden": 39, "aw": 39, "bedrock": 39, "again": 39, "major": 39, "regardless": 39, "screen": 39, "preview": 39, "navig": 40, "methodologi": 40, "head": 40, "six": 40, "openherm": 40, "scatter": 40, "replot": 40, "similarili": 40, "granular": 40, "outsid": 40, "icon": 40, "column": 40, "pattern": 40, "fit": 40, "ip": 40, "lock": 40, "indic": 40, "pair": 40, "financ": 40, "alongsid": 40, "foundat": 40, "prem": 42, "microservic": 42, "grant": 42, "docker": 42, "dt": 42, "p": 42, "8000": 42, "env_file_path": 42, "deepinfra_api_kei": 42, "stability_api_kei": 42, "mistral_ai_api_kei": 42, "perplexity_ai_api_kei": 42, "anyscale_api_kei": 42, "octoai_api_kei": 42, "openai_api_kei": 42, "together_ai_api_kei": 42, "replicate_api_kei": 42, "lepton_ai_api_kei": 42, "fireworks_ai_api_kei": 42, "anthropic_api_kei": 42, "vertexai_service_acc_json": 42, "vertexai_gcloud_path": 42, "vertexai_project": 42, "vertexai_loc": 42, "weather": 42, "san": 42, "francisco": 42, "tokyo": 42, "pari": 42, "haiku": 42, "random_key_wont_be_us": 42}, "objects": {"unify": [[31, 0, 0, "-", "chat"], [32, 0, 0, "-", "clients"], [33, 0, 0, "-", "exceptions"], [34, 0, 0, "-", "tests"], [35, 0, 0, "-", "utils"]], "unify.chat": [[31, 1, 1, "", "ChatBot"]], "unify.chat.ChatBot": [[31, 2, 1, "", "__init__"], [31, 2, 1, "", "clear_chat_history"], [31, 3, 1, "", "client"], [31, 3, 1, "", "endpoint"], [31, 3, 1, "", "model"], [31, 3, 1, "", "provider"], [31, 2, 1, "", "run"], [31, 2, 1, "", "set_client"], [31, 2, 1, "", "set_endpoint"], [31, 2, 1, "", "set_model"], [31, 2, 1, "", "set_provider"]], "unify.clients": [[32, 1, 1, "", "AsyncUnify"], [32, 1, 1, "", "Unify"]], "unify.clients.AsyncUnify": [[32, 2, 1, "", "__init__"], [32, 3, 1, "", "endpoint"], [32, 2, 1, "", "generate"], [32, 2, 1, "", "get_credit_balance"], [32, 3, 1, "", "model"], [32, 3, 1, "", "provider"], [32, 2, 1, "", "set_endpoint"], [32, 2, 1, "", "set_model"], [32, 2, 1, "", "set_provider"]], "unify.clients.Unify": [[32, 2, 1, "", "__init__"], [32, 3, 1, "", "endpoint"], [32, 2, 1, "", "generate"], [32, 2, 1, "", "get_credit_balance"], [32, 3, 1, "", "model"], [32, 3, 1, "", "provider"], [32, 2, 1, "", "set_endpoint"], [32, 2, 1, "", "set_model"], [32, 2, 1, "", "set_provider"]], "unify.exceptions": [[33, 4, 1, "", "AuthenticationError"], [33, 4, 1, "", "BadRequestError"], [33, 4, 1, "", "ConflictError"], [33, 4, 1, "", "InternalServerError"], [33, 4, 1, "", "NotFoundError"], [33, 4, 1, "", "PermissionDeniedError"], [33, 4, 1, "", "RateLimitError"], [33, 4, 1, "", "UnifyError"], [33, 4, 1, "", "UnprocessableEntityError"]], "unify.tests": [[34, 1, 1, "", "TestAsyncUnify"], [34, 1, 1, "", "TestUnify"]], "unify.tests.TestAsyncUnify": [[34, 2, 1, "", "setUp"], [34, 2, 1, "", "test_generate_returns_generator_when_stream_true"], [34, 2, 1, "", "test_generate_returns_string_when_stream_false"], [34, 2, 1, "", "test_incorrect_model_name_raises_internal_server_error"], [34, 2, 1, "", "test_invalid_api_key_raises_authentication_error"], [34, 2, 1, "", "test_missing_api_key_raises_key_error"]], "unify.tests.TestUnify": [[34, 2, 1, "", "setUp"], [34, 2, 1, "", "test_generate_returns_generator_when_stream_true"], [34, 2, 1, "", "test_generate_returns_string_when_stream_false"], [34, 2, 1, "", "test_incorrect_model_name_raises_internal_server_error"], [34, 2, 1, "", "test_invalid_api_key_raises_authentication_error"], [34, 2, 1, "", "test_missing_api_key_raises_key_error"]], "unify.utils": [[35, 5, 1, "", "delete_dataset"], [35, 5, 1, "", "delete_evaluation"], [35, 5, 1, "", "download_dataset"], [35, 5, 1, "", "evaluate"], [35, 5, 1, "", "list_datasets"], [35, 5, 1, "", "list_endpoints"], [35, 5, 1, "", "list_evaluations"], [35, 5, 1, "", "list_models"], [35, 5, 1, "", "list_providers"], [35, 5, 1, "", "upload_dataset_from_dictionary"], [35, 5, 1, "", "upload_dataset_from_file"]]}, "objtypes": {"0": "py:module", "1": "py:class", "2": "py:method", "3": "py:property", "4": "py:exception", "5": "py:function"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "class", "Python class"], "2": ["py", "method", "Python method"], "3": ["py", "property", "Python property"], "4": ["py", "exception", "Python exception"], "5": ["py", "function", "Python function"]}, "titleterms": {"benchmark": [0, 7, 40], "prepar": [0, 5], "your": [0, 2, 19, 38, 39, 40], "dataset": [0, 5, 39], "how": [0, 19, 20], "doe": 0, "work": 0, "deploi": 1, "router": [1, 5, 24, 38], "us": [1, 2, 13, 14, 20], "base": 1, "optim": [1, 13], "metric": [1, 7], "defin": 1, "threshold": 1, "custom": [1, 5, 6, 38, 39], "round": [1, 2, 7, 8, 10, 17, 18, 38, 39, 40], "up": [1, 2, 7, 8, 10, 17, 18, 38, 39, 40], "make": 2, "first": 2, "request": [2, 6], "get": [2, 4, 20, 36, 37], "kei": [2, 14, 21], "find": 2, "model": [2, 8], "provid": 2, "queri": [2, 6], "an": 2, "endpoint": [2, 5, 6, 8, 39, 40], "python": [2, 6, 18, 29, 44], "packag": [2, 6, 18, 29], "openai": [2, 6], "api": [2, 4, 6], "format": 2, "compat": 2, "tool": 2, "sdk": 2, "open": 2, "interpret": 2, "On": [3, 9, 13, 41, 42], "prem": [3, 9, 41], "imag": [3, 9], "refer": 4, "get_credit": 4, "post": 4, "chat": [4, 18, 31], "complet": 4, "rout": [5, 10, 13, 25], "what": [5, 8, 10], "i": [5, 8, 10], "llm": [5, 6, 21], "foundat": 5, "filter": 5, "maximis": 5, "throughput": 5, "fine": 5, "tune": 5, "train": [5, 38], "beta": [5, 38, 39, 40], "univers": 6, "authent": 6, "http": 6, "unifi": [6, 13, 23, 36, 37], "bill": 6, "advanc": 6, "featur": [6, 14, 20], "fallback": 6, "qualiti": [7, 10, 13, 40], "design": 7, "principl": 7, "methodologi": 7, "overview": [7, 20, 21], "score": 7, "visual": 7, "result": 7, "consider": 7, "limit": 7, "runtim": [7, 10, 13, 40], "token": 7, "input": [7, 13], "output": 7, "comput": 7, "data": 7, "present": 7, "avail": 8, "rag": [11, 14], "playground": [11, 14], "introduct": [11, 12, 14, 15, 22, 24, 26], "usag": [11, 13], "repositori": [11, 12, 14, 15, 20, 21, 22, 24, 26], "local": [11, 21], "deploy": [11, 12, 14, 15, 20, 21, 22, 24, 26], "contributor": [11, 12, 14, 15, 19, 20, 21, 22, 24, 26], "langchain": [12, 27], "project": [12, 14, 15, 23, 26], "quick": [12, 15], "demo": [12, 15, 16], "llamaindex": [13, 15, 28], "instal": [13, 17, 18, 20, 25], "environ": 13, "setup": [13, 20], "basic": 13, "singl": [13, 42], "sign": [13, 42], "dynam": [13, 25], "stream": 13, "latenc": 13, "async": [13, 17], "call": 13, "lowest": 13, "cost": 13, "workflow": 14, "tech": [14, 21, 22], "stack": [14, 21, 22, 39], "file": 16, "structur": 16, "contribut": [16, 19], "synchron": 17, "v": 17, "asynchron": 17, "client": [17, 32], "depend": [17, 18], "build": [18, 38], "chatbot": [18, 20], "The": 18, "agent": 18, "let": 18, "": 18, "becom": 19, "submit": 19, "own": [19, 40], "code": [19, 21], "licens": 19, "agreement": 19, "A": 19, "patch": 19, "arena": 20, "motiv": [20, 21], "app": [20, 22], "start": [20, 36, 37], "easi": 20, "without": 20, "docker": 20, "run": [20, 21, 40], "war": 21, "object": 21, "applic": 21, "flow": 21, "concept": 21, "access": [21, 41], "sourc": 21, "live": 21, "ai": 22, "debat": 22, "semant": 24, "librari": [25, 44], "initi": 25, "routelay": 25, "titl": 26, "exampl": [27, 28, 29], "except": 33, "test": 34, "util": 35, "welcom": [36, 37], "connect": 39, "prerequisit": 39, "ad": 39, "sso": 42, "openapi": 43, "specif": 43}, "envversion": {"sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "nbsphinx": 4, "sphinx": 60}, "alltitles": {"Deploying a router": [[1, "deploying-a-router"]], "Using the base router": [[1, "using-the-base-router"]], "Optimizing a metric": [[1, "optimizing-a-metric"]], "Defining thresholds": [[1, "defining-thresholds"]], "Using a custom router": [[1, "using-a-custom-router"]], "Round Up": [[1, "round-up"], [2, "round-up"], [8, "round-up"], [7, "round-up"], [40, "round-up"], [39, "round-up"], [38, "round-up"], [17, "Round-Up"], [18, "Round-Up"], [10, "round-up"]], "Making your first request": [[2, "making-your-first-request"]], "Getting a key": [[2, "getting-a-key"]], "Finding a model and provider": [[2, "finding-a-model-and-provider"]], "Querying an endpoint": [[2, "querying-an-endpoint"]], "Using the Python Package": [[2, "using-the-python-package"]], "Using the OpenAI API Format": [[2, "using-the-openai-api-format"]], "Compatible Tools": [[2, "compatible-tools"]], "OpenAI SDK": [[2, "openai-sdk"]], "Open Interpreter": [[2, "open-interpreter"]], "On-Prem Images": [[9, "on-prem-images"], [3, "on-prem-images"]], "Model Endpoints": [[8, "model-endpoints"]], "What is a Model Endpoint?": [[8, "what-is-a-model-endpoint"]], "Available Endpoints": [[8, "available-endpoints"]], "API Reference": [[4, "api-reference"]], "GET /get_credits": [[4, "get-get-credits"]], "POST /chat/completions": [[4, "post-chat-completions"]], "Benchmarking": [[0, "benchmarking"]], "Preparing your dataset": [[0, "preparing-your-dataset"]], "Benchmarking your dataset": [[0, "benchmarking-your-dataset"]], "How does it work?": [[0, "how-does-it-work"]], "Routing": [[5, "routing"], [10, "routing"]], "What is LLM routing?": [[5, "what-is-llm-routing"]], "Foundation router": [[5, "foundation-router"]], "Filtering endpoints": [[5, "filtering-endpoints"]], "Maximising throughput": [[5, "maximising-throughput"]], "Fine-tuned custom router": [[5, "fine-tuned-custom-router"]], "Preparing a dataset": [[5, "preparing-a-dataset"]], "Training a router (beta)": [[5, "training-a-router-beta"]], "Benchmarks": [[7, "benchmarks"]], "Quality Benchmarks": [[7, "quality-benchmarks"]], "Design Principles": [[7, "design-principles"], [7, "id1"]], "Methodology": [[7, "methodology"], [7, "id2"]], "Overview": [[7, "overview"], [21, "overview"], [20, "overview"]], "Scoring": [[7, "scoring"]], "Visualizing Results": [[7, "visualizing-results"]], "Considerations and Limitations": [[7, "considerations-and-limitations"], [7, "id3"]], "Runtime Benchmarks": [[7, "runtime-benchmarks"]], "Tokenizer": [[7, "tokenizer"]], "Inputs and Outputs": [[7, "inputs-and-outputs"]], "Computation": [[7, "computation"]], "Metrics": [[7, "metrics"]], "Data Presentation": [[7, "data-presentation"]], "Universal API": [[6, "universal-api"]], "Authentication": [[6, "authentication"]], "Querying the API": [[6, "querying-the-api"]], "HTTP request": [[6, "http-request"]], "Unify Python Package": [[6, "unify-python-package"]], "OpenAI Python package": [[6, "openai-python-package"]], "Billing": [[6, "billing"]], "Advanced features": [[6, "advanced-features"]], "Custom endpoints": [[6, "custom-endpoints"]], "LLM Fallbacks": [[6, "llm-fallbacks"]], "OpenAPI Specification": [[43, "openapi-specification"]], "Benchmarking endpoints": [[40, "benchmarking-endpoints"]], "Quality benchmarks": [[40, "quality-benchmarks"], [40, "id4"]], "Runtime benchmarks": [[40, "runtime-benchmarks"], [40, "id2"]], "Running your own benchmarks (Beta)": [[40, "running-your-own-benchmarks-beta"]], "Python Library": [[44, "python-library"]], "SSO (Single Sign On)": [[42, "sso-single-sign-on"]], "On-Prem access": [[41, "on-prem-access"]], "Project Title": [[26, "project-title"]], "Introduction": [[26, "introduction"], [22, "introduction"], [11, "introduction"], [12, "introduction"], [15, "introduction"], [14, "introduction"]], "Repository and Deployment": [[26, "repository-and-deployment"], [22, "repository-and-deployment"], [21, "repository-and-deployment"], [20, "repository-and-deployment"], [12, "repository-and-deployment"], [15, "repository-and-deployment"], [14, "repository-and-deployment"]], "Contributors": [[26, "contributors"], [22, "contributors"], [24, "contributors"], [21, "contributors"], [20, "contributors"], [11, "contributors"], [12, "contributors"], [15, "contributors"], [14, "contributors"]], "LangChain Examples": [[27, "langchain-examples"]], "Unify Projects": [[23, "unify-projects"]], "AI Debate App": [[22, "ai-debate-app"]], "Tech Stack": [[22, "tech-stack"], [21, "tech-stack"]], "Semantic Router": [[24, "semantic-router"]], "Introduction:": [[24, "introduction"]], "Repository and deployment": [[24, "repository-and-deployment"]], "LlamaIndex Examples": [[28, "llamaindex-examples"]], "Python Package Examples": [[29, "python-package-examples"]], "LLM-Wars": [[21, "llm-wars"]], "Objective": [[21, "objective"]], "Application Flow": [[21, "application-flow"]], "Motivation": [[21, "motivation"], [20, "motivation"]], "Key Concepts": [[21, "key-concepts"]], "Access the Source Code": [[21, "access-the-source-code"]], "Live Application": [[21, "live-application"]], "Running Locally": [[21, "running-locally"]], "Dynamic Routes": [[25, "Dynamic-Routes"]], "Installing the Library": [[25, "Installing-the-Library"]], "Initializing Routes and RouteLayer": [[25, "Initializing-Routes-and-RouteLayer"]], "Chatbot Arena": [[20, "chatbot-arena"]], "Features": [[20, "features"]], "How to use the app": [[20, "how-to-use-the-app"]], "Getting Started": [[20, "getting-started"], [37, "getting-started"], [36, "getting-started"]], "Easy installation": [[20, "easy-installation"]], "Setup (without Docker)": [[20, "setup-without-docker"]], "Run the app": [[20, "run-the-app"]], "Chat": [[31, "module-unify.chat"]], "Connecting your stack": [[39, "connecting-your-stack"]], "Custom endpoints (Beta)": [[39, "custom-endpoints-beta"]], "Prerequisite": [[39, "prerequisite"]], "Adding the endpoints": [[39, "adding-the-endpoints"]], "Custom datasets": [[39, "custom-datasets"]], "Exceptions": [[33, "module-unify.exceptions"]], "Utils": [[35, "module-unify.utils"]], "Welcome to Unify!": [[37, "welcome-to-unify"], [36, "welcome-to-unify"]], "Clients": [[32, "module-unify.clients"]], "Tests": [[34, "module-unify.tests"]], "Building a custom router": [[38, "building-a-custom-router"]], "Training a custom router (Beta)": [[38, "training-a-custom-router-beta"]], "Customizing your router (Beta)": [[38, "customizing-your-router-beta"]], "How to become a contributor and submit your own code": [[19, "how-to-become-a-contributor-and-submit-your-own-code"]], "Contributor License Agreements": [[19, "contributor-license-agreements"]], "Contributing A Patch": [[19, "contributing-a-patch"]], "Synchronous VS Asynchronous Clients": [[17, "Synchronous-VS-Asynchronous-Clients"]], "Install Dependencies": [[17, "Install-Dependencies"], [18, "Install-Dependencies"]], "Synchronous Clients": [[17, "Synchronous-Clients"]], "Async Clients": [[17, "Async-Clients"]], "RAG Playground \ud83d\udedd": [[11, "rag-playground"]], "Usage": [[11, "usage"]], "Repository and Local Deployment": [[11, "repository-and-local-deployment"]], "LlamaIndex": [[13, "LlamaIndex"]], "Installation": [[13, "Installation"]], "Environment Setup": [[13, "Environment-Setup"]], "Using LlamaIndex with Unify": [[13, "Using-LlamaIndex-with-Unify"]], "Basic Usage": [[13, "Basic-Usage"]], "Single Sign-On": [[13, "Single-Sign-On"]], "Runtime Dynamic Routing": [[13, "Runtime-Dynamic-Routing"]], "Quality Routing": [[13, "Quality-Routing"]], "Streaming and optimizing for latency": [[13, "Streaming-and-optimizing-for-latency"]], "Async calls and Lowest Input Cost": [[13, "Async-calls-and-Lowest-Input-Cost"]], "LangChain Projects": [[12, "langchain-projects"]], "Quick Demo": [[12, "quick-demo"], [15, "quick-demo"]], "Demos": [[16, "demos"]], "File Structure": [[16, "file-structure"]], "Contributing": [[16, "contributing"]], "Build a ChatBot": [[18, "Build-a-ChatBot"]], "The Agent": [[18, "The-Agent"]], "Let\u2019s Chat": [[18, "Let's-Chat"]], "Python Package": [[18, "Python-Package"]], "LlamaIndex Projects": [[15, "llamaindex-projects"]], "What is routing?": [[10, "what-is-routing"]], "Quality routing": [[10, "quality-routing"]], "Runtime routing": [[10, "runtime-routing"]], "RAG Playground": [[14, "rag-playground"]], "Key Features": [[14, "key-features"]], "Project Workflow": [[14, "project-workflow"]], "Tech Stack Used": [[14, "tech-stack-used"]]}, "indexentries": {"chatbot (class in unify.chat)": [[31, "unify.chat.ChatBot"]], "__init__() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.__init__"]], "clear_chat_history() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.clear_chat_history"]], "client (unify.chat.chatbot property)": [[31, "unify.chat.ChatBot.client"]], "endpoint (unify.chat.chatbot property)": [[31, "unify.chat.ChatBot.endpoint"]], "model (unify.chat.chatbot property)": [[31, "unify.chat.ChatBot.model"]], "module": [[31, "module-unify.chat"], [32, "module-unify.clients"], [33, "module-unify.exceptions"], [34, "module-unify.tests"], [35, "module-unify.utils"]], "provider (unify.chat.chatbot property)": [[31, "unify.chat.ChatBot.provider"]], "run() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.run"]], "set_client() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.set_client"]], "set_endpoint() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.set_endpoint"]], "set_model() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.set_model"]], "set_provider() (unify.chat.chatbot method)": [[31, "unify.chat.ChatBot.set_provider"]], "unify.chat": [[31, "module-unify.chat"]], "asyncunify (class in unify.clients)": [[32, "unify.clients.AsyncUnify"]], "unify (class in unify.clients)": [[32, "unify.clients.Unify"]], "__init__() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.__init__"]], "__init__() (unify.clients.unify method)": [[32, "unify.clients.Unify.__init__"]], "endpoint (unify.clients.asyncunify property)": [[32, "unify.clients.AsyncUnify.endpoint"]], "endpoint (unify.clients.unify property)": [[32, "unify.clients.Unify.endpoint"]], "generate() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.generate"]], "generate() (unify.clients.unify method)": [[32, "unify.clients.Unify.generate"]], "get_credit_balance() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.get_credit_balance"]], "get_credit_balance() (unify.clients.unify method)": [[32, "unify.clients.Unify.get_credit_balance"]], "model (unify.clients.asyncunify property)": [[32, "unify.clients.AsyncUnify.model"]], "model (unify.clients.unify property)": [[32, "unify.clients.Unify.model"]], "provider (unify.clients.asyncunify property)": [[32, "unify.clients.AsyncUnify.provider"]], "provider (unify.clients.unify property)": [[32, "unify.clients.Unify.provider"]], "set_endpoint() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.set_endpoint"]], "set_endpoint() (unify.clients.unify method)": [[32, "unify.clients.Unify.set_endpoint"]], "set_model() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.set_model"]], "set_model() (unify.clients.unify method)": [[32, "unify.clients.Unify.set_model"]], "set_provider() (unify.clients.asyncunify method)": [[32, "unify.clients.AsyncUnify.set_provider"]], "set_provider() (unify.clients.unify method)": [[32, "unify.clients.Unify.set_provider"]], "unify.clients": [[32, "module-unify.clients"]], "authenticationerror": [[33, "unify.exceptions.AuthenticationError"]], "badrequesterror": [[33, "unify.exceptions.BadRequestError"]], "conflicterror": [[33, "unify.exceptions.ConflictError"]], "internalservererror": [[33, "unify.exceptions.InternalServerError"]], "notfounderror": [[33, "unify.exceptions.NotFoundError"]], "permissiondeniederror": [[33, "unify.exceptions.PermissionDeniedError"]], "ratelimiterror": [[33, "unify.exceptions.RateLimitError"]], "unifyerror": [[33, "unify.exceptions.UnifyError"]], "unprocessableentityerror": [[33, "unify.exceptions.UnprocessableEntityError"]], "unify.exceptions": [[33, "module-unify.exceptions"]], "testasyncunify (class in unify.tests)": [[34, "unify.tests.TestAsyncUnify"]], "testunify (class in unify.tests)": [[34, "unify.tests.TestUnify"]], "setup() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.setUp"]], "setup() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.setUp"]], "test_generate_returns_generator_when_stream_true() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.test_generate_returns_generator_when_stream_true"]], "test_generate_returns_generator_when_stream_true() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.test_generate_returns_generator_when_stream_true"]], "test_generate_returns_string_when_stream_false() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.test_generate_returns_string_when_stream_false"]], "test_generate_returns_string_when_stream_false() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.test_generate_returns_string_when_stream_false"]], "test_incorrect_model_name_raises_internal_server_error() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.test_incorrect_model_name_raises_internal_server_error"]], "test_incorrect_model_name_raises_internal_server_error() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.test_incorrect_model_name_raises_internal_server_error"]], "test_invalid_api_key_raises_authentication_error() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.test_invalid_api_key_raises_authentication_error"]], "test_invalid_api_key_raises_authentication_error() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.test_invalid_api_key_raises_authentication_error"]], "test_missing_api_key_raises_key_error() (unify.tests.testasyncunify method)": [[34, "unify.tests.TestAsyncUnify.test_missing_api_key_raises_key_error"]], "test_missing_api_key_raises_key_error() (unify.tests.testunify method)": [[34, "unify.tests.TestUnify.test_missing_api_key_raises_key_error"]], "unify.tests": [[34, "module-unify.tests"]], "delete_dataset() (in module unify.utils)": [[35, "unify.utils.delete_dataset"]], "delete_evaluation() (in module unify.utils)": [[35, "unify.utils.delete_evaluation"]], "download_dataset() (in module unify.utils)": [[35, "unify.utils.download_dataset"]], "evaluate() (in module unify.utils)": [[35, "unify.utils.evaluate"]], "list_datasets() (in module unify.utils)": [[35, "unify.utils.list_datasets"]], "list_endpoints() (in module unify.utils)": [[35, "unify.utils.list_endpoints"]], "list_evaluations() (in module unify.utils)": [[35, "unify.utils.list_evaluations"]], "list_models() (in module unify.utils)": [[35, "unify.utils.list_models"]], "list_providers() (in module unify.utils)": [[35, "unify.utils.list_providers"]], "unify.utils": [[35, "module-unify.utils"]], "upload_dataset_from_dictionary() (in module unify.utils)": [[35, "unify.utils.upload_dataset_from_dictionary"]], "upload_dataset_from_file() (in module unify.utils)": [[35, "unify.utils.upload_dataset_from_file"]]}})
\ No newline at end of file
+Search.setIndex({"docnames": ["concepts/benchmarks", "concepts/deploy_router", "concepts/first_request", "concepts/images", "concepts/reference", "concepts/router", "concepts/unify_api", "console/building_router", "console/connecting_stack", "console/running_benchmarks", "docs/unify/unify", "docs/unify/unify/unify.chat", "docs/unify/unify/unify.clients", "docs/unify/unify/unify.exceptions", "docs/unify/unify/unify.tests", "docs/unify/unify/unify.utils", "home/home", "index", "on_prem/on_prem_access", "on_prem/sso", "tools/openapi", "tools/python_library"], "filenames": ["concepts/benchmarks.rst", "concepts/deploy_router.rst", "concepts/first_request.rst", "concepts/images.rst", "concepts/reference.rst", "concepts/router.rst", "concepts/unify_api.rst", "console/building_router.rst", "console/connecting_stack.rst", "console/running_benchmarks.rst", "docs/unify/unify.rst", "docs/unify/unify/unify.chat.rst", "docs/unify/unify/unify.clients.rst", "docs/unify/unify/unify.exceptions.rst", "docs/unify/unify/unify.tests.rst", "docs/unify/unify/unify.utils.rst", "home/home.rst", "index.rst", "on_prem/on_prem_access.rst", "on_prem/sso.rst", "tools/openapi.rst", "tools/python_library.rst"], "titles": ["Benchmarking", "Deploying a router", "Making your first request", "On-Prem Images", "API Reference", "Routing", "Universal API", "Building a custom router", "Connecting your stack", "Benchmarking endpoints", "&lt;no title&gt;", "Chat", "Clients", "Exceptions", "Tests", "Utils", "Welcome to Unify!", "Home", "On-Prem access", "SSO (Single Sign On)", "OpenAPI Specification", "Python Library"], "terms": {"when": [0, 1, 2, 4, 5, 7, 12, 16, 17], "compar": [0, 9, 16, 17], "llm": [0, 1, 2, 8, 9, 11, 16, 17], "i": [0, 1, 2, 4, 6, 7, 8, 9, 11, 12, 15, 16, 17, 19], "constant": 0, "tradeoff": 0, "make": [0, 1, 4, 7, 12, 16, 17], "between": [0, 2, 5, 6, 7, 12], "qualiti": [0, 5, 7], "cost": [0, 1, 5, 6, 7, 9, 16, 17], "latenc": [0, 1, 5, 7, 9, 16, 17], "stronger": 0, "model": [0, 1, 4, 5, 6, 7, 8, 9, 11, 12, 15, 16, 17, 19], "ar": [0, 1, 2, 5, 6, 7, 8, 9, 16, 17], "gener": [0, 1, 2, 4, 5, 6, 12, 19], "slower": 0, "more": [0, 2, 5, 9, 12], "expens": 0, "sometim": [0, 6], "overkil": 0, "task": [0, 1, 5, 7, 9], "hand": [0, 9], "complic": 0, "matter": 0, "further": [0, 7, 12], "new": [0, 2, 5, 6, 7, 8, 9], "releas": [0, 5], "weekli": 0, "each": [0, 1, 5, 6, 7, 9, 15, 16, 17], "claim": 0, "state": 0, "art": 0, "data": [0, 1, 7], "let": [0, 1, 2, 7, 8, 9, 16, 17], "you": [0, 1, 2, 4, 5, 6, 7, 8, 9, 16, 17, 19], "see": [0, 6, 7, 9, 16, 17], "differ": [0, 4, 5, 7, 9], "perform": [0, 1, 7, 9, 16, 17], "can": [0, 1, 2, 4, 5, 6, 7, 8, 9, 16, 17, 19], "relat": 0, "live": [0, 5, 6], "stat": 0, "pull": [0, 19], "from": [0, 1, 2, 4, 5, 6, 7, 9, 11, 12, 15, 16, 17, 19], "our": [0, 1, 2, 6, 7, 8, 9, 16, 17, 18, 19], "runtim": [0, 5, 6], "come": [0, 4, 5, 6], "out": [0, 2, 5, 6], "simpli": [0, 2, 9], "re": [0, 7, 9, 16, 17, 19], "run": [0, 2, 6, 7, 8, 11, 19], "thei": [0, 5, 6], "first": [0, 1, 4, 5, 6, 7, 9, 16, 17], "creat": [0, 2, 4, 6, 7, 8], "which": [0, 4, 5, 6, 7, 9, 19], "repres": [0, 11], "want": [0, 1, 2, 7, 8, 9], "evalu": [0, 9, 15], "need": [0, 1, 2, 5, 6, 7, 8, 9, 16, 17], "list": [0, 2, 6, 7, 9, 12, 15], "prompt": [0, 1, 5, 6, 8, 9, 12, 15, 16, 17], "option": [0, 1, 5, 7, 8, 11, 12, 15], "includ": [0, 1, 7, 8, 9, 16, 17], "refer": [0, 5, 8], "gold": 0, "standard": [0, 6, 8], "answer": [0, 5, 8], "contain": [0, 2, 5, 6, 8, 9, 12, 15], "tend": [0, 9], "get": [0, 1, 5, 6, 11, 12, 15, 18], "accur": 0, "The": [0, 2, 4, 5, 6, 7, 8, 9, 11, 12, 15, 16, 17, 19], "file": [0, 2, 5, 8, 15, 19], "itself": 0, "should": [0, 2, 6, 8, 9, 19], "jsonl": [0, 5, 8], "format": [0, 4, 5, 6, 11, 12], "one": [0, 1, 2, 4, 5, 6, 8, 9], "entri": [0, 5], "per": [0, 1, 7], "line": [0, 2], "exampl": [0, 1, 2, 4, 5, 6, 7, 8], "below": [0, 1, 2, 7, 8, 9], "thi": [0, 1, 2, 4, 5, 6, 7, 8, 9, 16, 17, 19], "ref_answ": [0, 5], "second": [0, 1, 7], "us": [0, 4, 5, 6, 7, 8, 9, 11, 12, 15, 16, 17, 19], "least": [0, 9], "50": 0, "most": [0, 5, 8], "result": [0, 5, 7, 8, 9], "current": [0, 1, 4, 6, 7, 9, 16, 17], "an": [0, 1, 5, 6, 7, 8, 11, 12, 15, 16, 17], "maximum": 0, "limit": [0, 2, 5, 6], "500": [0, 13], "we": [0, 1, 2, 5, 6, 7, 8, 9, 16, 17], "don": [0, 4, 7], "t": [0, 1, 2, 4, 5, 7, 9], "much": [0, 1, 5], "extra": 0, "detail": [0, 1, 2, 4, 6, 7, 19], "past": 0, "250": 0, "In": [0, 1, 2, 5, 6, 7, 8, 9, 16, 17], "dashboard": [0, 5, 7, 9], "click": [0, 5, 7, 8, 9], "select": [0, 5, 7, 9, 16, 17], "open": [0, 7, 9], "interfac": [0, 1, 2, 5, 6, 8, 9, 16, 17], "upload": [0, 2, 5, 7, 8, 9, 15], "finish": [0, 5], "ll": [0, 1, 2, 5, 7, 8, 9, 16, 17], "receiv": [0, 5, 7], "email": [0, 5, 7], "graph": [0, 5, 7, 9], "displai": [0, 5, 7, 9], "x": [0, 2, 4, 6, 7, 9, 19], "axi": [0, 9], "set": [0, 1, 2, 6, 7, 8, 11, 12, 14], "time": [0, 1, 5, 6, 7, 9], "token": [0, 1, 5, 6, 7, 9, 12], "inter": [0, 1, 5, 7], "either": [0, 6, 7, 16, 17], "linear": 0, "log": 0, "scale": 0, "gpt4o": 0, "judg": 0, "cf": 0, "http": [0, 2, 4, 12, 13, 15, 19], "arxiv": 0, "org": 0, "ab": 0, "2306": 0, "05685": 0, "": [0, 1, 2, 5, 6, 7, 8, 9, 12, 16, 17, 19], "respons": [0, 1, 2, 4, 5, 6, 12, 15, 16, 17, 19], "section": [1, 2, 7, 8, 9, 16, 17], "learn": [1, 2, 4, 5, 7, 8, 9, 16, 17], "how": [1, 2, 5, 6, 7, 8, 9, 16, 17], "unifi": [1, 2, 4, 7, 8, 11, 12, 13, 14, 15, 19], "through": [1, 2, 6, 7, 8, 9, 16, 17], "api": [1, 5, 7, 8, 11, 12, 15, 16, 17, 19], "If": [1, 2, 4, 6, 7, 8, 9, 11, 12, 15, 16, 17], "haven": [1, 2, 9], "done": [1, 2, 7, 9], "so": [1, 2, 6, 7, 8, 9, 16, 17], "recommend": [1, 2, 9, 16, 17], "request": [1, 4, 7, 9, 13, 16, 17, 19], "familiar": [1, 16, 17], "leverag": 1, "inform": [1, 7, 9, 16, 17], "benchmark": [1, 2, 5, 6, 7, 8, 16, 17], "automat": [1, 6, 7], "rout": [1, 2, 7, 8, 16, 17], "best": [1, 5, 7, 16, 17], "provid": [1, 4, 5, 6, 7, 8, 9, 11, 12, 15, 16, 17], "choos": [1, 2, 5, 7], "valu": [1, 9, 11, 12, 15], "chang": [1, 5, 7, 9], "over": [1, 5, 9], "dynam": [1, 16, 17], "ensur": [1, 7, 9], "alwai": [1, 9], "without": [1, 16, 17], "have": [1, 2, 4, 5, 6, 7, 8, 9, 19], "monitor": 1, "yourself": 1, "To": [1, 2, 4, 5, 6, 9, 18], "onli": [1, 2, 6, 7, 9, 16, 17], "provier": 1, "name": [1, 2, 4, 6, 7, 8, 9, 11, 12, 15], "support": [1, 2, 6], "configur": [1, 2, 5, 7, 9], "follow": [1, 4, 5, 6], "config": 1, "lowest": 1, "input": [1, 4], "output": [1, 6, 9, 12], "itl": 1, "ttft": [1, 9], "highest": 1, "tk": 1, "sec": [1, 9], "For": [1, 2, 5, 7, 8, 9], "e": [1, 2, 5, 7, 9], "g": [1, 2, 7, 9], "python": [1, 19], "packag": 1, "endpoint": [1, 4, 7, 11, 12, 15, 16, 17], "import": [1, 2, 6, 19], "o": [1, 2], "assum": [1, 2, 7, 8], "ad": [1, 2, 9], "unify_kei": [1, 2, 11, 12, 15], "your": [1, 4, 5, 6, 12, 16, 17, 19], "environ": [1, 2, 7, 11, 12, 15, 16, 17], "variabl": [1, 2, 11, 12, 15], "otherwis": [1, 2, 12, 15], "would": [1, 2, 6, 7, 8, 9], "specifi": [1, 2, 4, 5, 6, 7, 8, 9, 15], "api_kei": [1, 2, 6, 11, 12, 15, 19], "argument": [1, 2, 4], "mistral": [1, 2, 6, 9], "7b": [1, 2, 6, 9], "instruct": [1, 2, 6, 9], "v0": [1, 2, 4, 6, 9], "3": [1, 2, 4, 6, 7, 9, 19], "explain": [1, 2, 4, 9, 16, 17, 19], "who": [1, 2, 4, 19], "newton": [1, 2, 4, 19], "wa": [1, 2, 4, 12, 15, 19], "hi": [1, 2, 4, 6, 19], "entir": [1, 2, 4, 9, 19], "theori": [1, 2, 4, 19], "gravit": [1, 2, 4, 19], "give": [1, 2, 4, 16, 17, 19], "long": [1, 2, 4, 19], "pleas": [1, 2, 4, 19], "all": [1, 2, 4, 6, 7, 8, 9, 13, 15, 19], "achiev": [1, 2, 4, 19], "addition": 1, "multipl": 1, "other": [1, 2, 6, 7, 9], "featur": [1, 16, 17], "enabl": [1, 7, 16, 17], "ani": [1, 2, 6, 7, 9, 16, 17], "whose": [1, 15], "lower": [1, 12], "than": [1, 5, 9], "specif": [1, 2, 4, 5, 9, 15], "just": [1, 2, 9], "append": [1, 4], "float": [1, 12], "prefer": 1, "mode": 1, "keep": 1, "thing": 1, "simpl": 1, "alias": 1, "oc": 1, "ic": 1, "ot": 1, "illustr": [1, 16, 17], "some": [1, 2, 6, 7, 9, 16, 17], "0": [1, 2, 4, 6, 7, 12], "5input": 1, "case": [1, 2, 7, 9], "ha": [1, 2, 6, 7, 16, 17], "smaller": [1, 5], "5": 1, "credit": [1, 4, 6, 11, 12], "million": 1, "1output": 1, "likewis": [1, 2], "scenario": 1, "direct": 1, "offer": [1, 18], "1": [1, 5, 12], "5ic": 1, "15itl": 1, "now": [1, 2, 7, 8, 9, 19], "someth": [1, 6, 9], "similar": [1, 5], "alia": 1, "also": [1, 2, 7, 8, 9], "consid": 1, "less": 1, "15": 1, "m": 1, "depend": [1, 7], "might": 1, "where": [1, 2, 7, 9, 12], "meet": [1, 6, 7], "criteria": 1, "render": 1, "unfulfil": 1, "404": [1, 13], "error": [1, 4, 12, 13, 15], "correspond": [1, 2, 4, 7, 9], "explan": 1, "detect": 1, "polici": 1, "do": [1, 2, 8], "like": [1, 2, 6, 7, 8, 9, 12, 16, 17, 19], "won": 1, "work": [1, 7, 16, 17], "sinc": 1, "price": 1, "yet": [1, 4, 7], "001ic": 1, "status_cod": [1, 2], "cheapest": 1, "fallback": 1, "payload": [1, 2, 6], "train": [1, 9], "befor": [1, 2, 7, 9, 14], "id": [1, 2, 4, 6, 7], "same": [1, 2, 5, 7], "call": [1, 7, 18], "code": [1, 2, 6, 16, 17], "send": [1, 4, 9, 16, 17], "gpt": [1, 7], "claud": [1, 7, 19], "llama3": [1, 7], "anthropic_8": [1, 7], "28e": [1, 7], "03_4": [1, 7], "66e": [1, 7], "4_1": [1, 7], "00e": [1, 7], "06": [1, 6, 7], "queri": [1, 4, 5, 7, 8, 16, 17], "curl": [1, 2, 4, 6, 19], "among": 1, "page": [1, 2, 4, 6, 7, 9], "That": [1, 7, 8, 9], "know": [1, 2, 8, 9], "care": 1, "about": [1, 4, 5, 9], "start": [1, 2, 11], "applic": [1, 2, 4, 6, 7, 13, 16, 17, 19], "across": [2, 7, 8, 9], "alreadi": [2, 7, 8], "sign": [2, 4, 6, 16, 17], "consol": [2, 6, 7, 8, 9], "greet": 2, "There": [2, 6, 8, 9], "link": 2, "interact": [2, 4, 6, 11, 12, 16, 17], "suspect": 2, "leak": 2, "wai": [2, 6, 7, 8], "safe": 2, "regener": 2, "replac": [2, 6], "old": 2, "workflow": [2, 6], "balanc": [2, 4, 6, 7], "account": [2, 4, 6, 7, 9, 12], "both": [2, 6, 7], "identifi": 2, "given": [2, 4, 15], "go": [2, 4, 5, 6, 7, 9, 16, 17], "copi": [2, 5, 7], "top": [2, 6, 9], "row": 2, "tabl": [2, 9], "v2": 2, "show": [2, 7, 8, 9, 11], "firework": [2, 6], "ai": [2, 4, 6, 8], "custom": [2, 9, 13, 16, 17], "abl": [2, 5], "easiest": 2, "unifyai": [2, 6, 19], "instal": [2, 6], "pip": [2, 6], "script": 2, "insert": 2, "your_api_kei": [2, 4, 6], "env": [2, 19], "project": 2, "pass": 2, "client": [2, 6, 11, 19], "store": 2, "safeti": 2, "remain": [2, 9, 12], "readi": [2, 7, 8, 16, 17], "method": [2, 14], "abov": 2, "return": [2, 6, 11, 12, 14, 15, 16, 17], "string": [2, 5, 6, 12], "access": [2, 6, 7, 9, 11, 12, 16, 17, 19], "coupl": 2, "list_model": [2, 15], "list_provid": [2, 15], "addit": 2, "synchron": 2, "asynchron": [2, 12], "well": [2, 6, 7, 8], "stream": [2, 4, 6, 12], "check": [2, 9], "repo": 2, "text": [2, 4, 6], "chat": [2, 5, 6, 7, 19], "complet": [2, 5, 6, 7, 9, 19], "wouldn": 2, "normal": 2, "allow": [2, 5, 7, 9], "bypass": 2, "model_nam": [2, 11, 12], "provider_nam": [2, 11, 12], "been": [2, 7], "deploi": [2, 6, 7, 9, 16, 17], "languag": [2, 6], "post": [2, 6, 19], "h": [2, 4, 6, 19], "accept": [2, 4, 6, 19], "json": [2, 4, 6, 12, 15, 19], "author": [2, 4, 6], "bearer": [2, 4, 6], "your_unify_kei": [2, 6], "content": [2, 4, 6, 12, 15, 19], "type": [2, 4, 6, 11, 12, 14, 15, 19], "d": [2, 4, 6, 7, 16, 17, 19], "messag": [2, 4, 6, 12, 19], "role": [2, 4, 6, 19], "user": [2, 4, 6, 7, 12, 19], "true": [2, 6, 12], "Or": 2, "url": [2, 6], "header": [2, 6], "print": [2, 6], "200": [2, 4], "chunk": [2, 6, 12], "iter_cont": 2, "chunk_siz": 2, "1024": [2, 12], "decod": 2, "utf": 2, "8": [2, 12], "els": [2, 9], "doc": 2, "avail": [2, 4, 5, 8, 15, 16, 17], "here": [2, 4, 5, 7], "thank": 2, "easili": 2, "integr": [2, 8], "lot": 2, "switch": [2, 16, 17], "base_url": [2, 6, 19], "sai": [2, 6], "test": [2, 7, 9], "word": 2, "showcas": 2, "function": 2, "choic": [2, 4, 6, 16, 17], "delta": [2, 6], "end": [2, 6], "take": [2, 7], "look": [2, 6, 7, 19], "snippet": 2, "offlin": 2, "api_bas": 2, "order": [2, 9], "insert_model": 2, "next": [2, 5, 6, 7, 8, 9], "lorem": [3, 20, 21], "ipsum": [3, 20, 21], "welcom": 4, "resourc": 4, "up": [4, 6, 12, 14], "kei": [4, 6, 8, 11, 12, 15, 16, 17], "retriev": [4, 11, 12], "authent": 4, "ok": 4, "success": [4, 12, 15], "oper": 4, "associ": [4, 15], "corresponding_user_id": 4, "232": [4, 6], "32": [4, 6], "401": [4, 13], "unauthor": [4, 13], "invalid": 4, "403": [4, 13], "forbidden": [4, 13], "Not": [4, 13], "host": [4, 8], "openai": [4, 8, 11, 12], "sure": 4, "its": [4, 6, 7], "after": [4, 5, 7], "llama": [4, 6, 7, 9], "8b": [4, 6], "anyscal": 4, "fals": [4, 11, 12], "schema": 4, "object": [4, 6, 11, 12, 16, 17], "defin": 4, "1704999905": 4, "meta": 4, "hf": 4, "xr868c": 4, "t4z": 4, "tkltfxxzsvq57wmhxb34el5zuuxsatfu": 4, "usag": [4, 6], "completion_token": [4, 6], "512": 4, "prompt_token": [4, 6], "34": 4, "total_token": [4, 6], "546": 4, "finish_reason": [4, 6], "length": [4, 9], "index": [4, 6], "isaac": 4, "1643": 4, "1727": 4, "assist": [4, 6], "422": [4, 13], "unprocess": [4, 13], "entiti": [4, 13], "flexibl": 5, "handl": [5, 6], "advantag": 5, "sever": 5, "reason": [5, 6], "small": 5, "faster": 5, "cheaper": 5, "wherea": 5, "bigger": 5, "capabl": 5, "often": 5, "rang": 5, "difficulti": 5, "everi": [5, 6], "week": 5, "strength": 5, "weak": 5, "continu": 5, "improv": 5, "ride": 5, "wave": 5, "abil": 5, "minimis": 5, "base": [5, 7, 11, 12, 13, 14], "statist": 5, "purpos": 5, "wide": 5, "varieti": [5, 8], "green": 5, "star": [5, 9], "q": 5, "c": 5, "4": [5, 7, 12], "65e": 5, "03": 5, "2": [5, 12], "08e": 5, "05": 5, "07e": 5, "paramet": [5, 6], "stand": 5, "rel": 5, "weigh": 5, "customiz": 5, "meaning": 5, "directli": 5, "restrict": 5, "them": [5, 7, 9], "model1": 5, "model2": 5, "model3": 5, "provider1": 5, "provider2": 5, "rate": 5, "hit": 5, "move": [5, 7], "mean": [5, 19], "higher": [5, 12], "singl": [5, 6, 12, 16, 17], "ve": [5, 8, 9], "found": [5, 13], "those": [5, 8], "product": [5, 6], "visualis": 5, "form": [5, 6], "xxx": 5, "yyi": 5, "accuraci": 5, "final": [5, 7], "system": [5, 12], "onc": [5, 7, 8, 9, 16, 17, 19], "sea": 6, "own": [6, 8], "subtl": 6, "nuanc": 6, "A": [6, 7, 12, 15], "common": [6, 8], "One": 6, "program": 6, "three": 6, "command": 6, "termin": 6, "unify_api_kei": 6, "hello": 6, "field": 6, "find": [6, 9], "made": 6, "togeth": 6, "1718888877": 6, "896bfc1ae84271aa": 6, "lhr": 6, "25": 6, "13": 6, "38": 6, "7": 6, "6e": 6, "stop": [6, 12], "It": 6, "nice": 6, "help": 6, "seed": 6, "11563975138181362140": 6, "via": [6, 8], "number": [6, 12], "total": 6, "u": [6, 9, 18], "temperatur": [6, 12], "max_token": [6, 12], "mai": [6, 7], "compat": 6, "download": [6, 15], "document": 6, "readm": 6, "sampl": [6, 12], "infer": 6, "design": [6, 9], "exist": 6, "straightforward": 6, "try": 6, "rememb": 6, "manag": 6, "spend": 6, "behind": [6, 9], "scene": 6, "refil": 6, "get_credit": 6, "your_user_id": 6, "fine": [6, 7], "tune": [6, 7, 9], "add": [6, 7, 8, 9], "relev": 6, "individu": 6, "outag": 6, "disrupt": 6, "combat": 6, "down": 6, "fail": 6, "until": 6, "succe": 6, "reach": 6, "tag": 6, "becom": 6, "model_a": 6, "provider_a": 6, "model_b": 6, "provider_b": 6, "actual": 6, "went": 6, "window": 7, "dataset": [7, 9, 15], "intend": 7, "earlier": [7, 9], "variant": 7, "dropdown": [7, 9], "notic": [7, 16, 17], "becaus": 7, "doe": 7, "button": [7, 8], "submit": [7, 9], "job": [7, 9], "schedul": 7, "behalf": [7, 8], "ahead": 7, "duplic": 7, "previous": 7, "calls1": [7, 9], "call2": 7, "q1": 7, "q2": 7, "repeat": 7, "howev": 7, "70b": 7, "trigger": [7, 9], "manual": 7, "track": [7, 9], "progress": [7, 9], "With": 7, "stage": 7, "accordingli": 7, "visual": [7, 9], "step": [7, 8, 19], "explor": [7, 9], "variou": [7, 9], "possibl": 7, "trade": 7, "off": [7, 8], "speed": [7, 9, 16, 17], "variat": 7, "These": 7, "As": [7, 9], "point": [7, 9, 16, 17], "plot": [7, 9], "view": [7, 9], "constrain": 7, "search": 7, "space": 7, "certain": 7, "deploy": 7, "guarante": 7, "requir": 7, "Of": 7, "cours": 7, "visibl": 7, "remov": [7, 9, 15], "presum": 7, "anthrop": [7, 19], "properli": 7, "save": [7, 15], "moment": 7, "therefor": 7, "appli": 7, "altern": [7, 8], "had": 7, "overwritten": 7, "clauc": 7, "place": 7, "legend": [7, 9], "underneath": 7, "parent": 7, "slightli": 7, "reduc": 7, "amount": 7, "decid": 7, "stick": 7, "decis": [7, 16, 17], "avoid": 7, "immedi": 7, "futur": 7, "appear": [7, 9], "full": 7, "frequenc": 7, "gpt4": 7, "42": 7, "29": 7, "calls2": [7, 9], "18": 7, "11": 7, "metric": [7, 9, 16, 17], "ax": 7, "verifi": 7, "session": 7, "perman": 7, "veri": 7, "happi": [7, 9], "forget": 7, "delet": [7, 15], "anytim": 7, "press": [7, 9], "besid": 7, "clipboard": 7, "along": 7, "default": [7, 9, 11, 12, 15], "shelf": 8, "azur": 8, "ml": 8, "catalog": 8, "vertex": 8, "garden": 8, "aw": 8, "bedrock": 8, "whole": 8, "again": 8, "major": 8, "cloud": 8, "regardless": 8, "expos": [8, 9], "adher": 8, "got": 8, "said": 8, "screen": 8, "local": [8, 15, 19], "build": 8, "label": [8, 9], "preview": 8, "imag": [8, 9], "router": [8, 9, 16, 17], "navig": 9, "ones": 9, "methodologi": 9, "head": 9, "By": 9, "six": 9, "openherm": 9, "shown": 9, "On": 9, "against": 9, "scatter": 9, "replot": 9, "similarili": 9, "score": 9, "updat": 9, "averag": 9, "granular": 9, "outsid": 9, "popular": 9, "period": 9, "suit": 9, "dedic": 9, "region": 9, "sequenc": [9, 12], "latest": [9, 16, 17, 19], "sort": 9, "icon": 9, "column": 9, "reveal": 9, "pattern": 9, "figur": 9, "fit": 9, "resum": 9, "previou": 9, "privat": 9, "server": [9, 13], "vari": 9, "fastest": 9, "under": 9, "ip": 9, "address": 9, "lock": 9, "indic": 9, "necessari": 9, "subsect": 9, "separ": 9, "expand": 9, "pair": 9, "histori": [9, 11, 12], "mixtral": 9, "financ": 9, "alongsid": 9, "foundat": 9, "class": [11, 12, 13, 14], "chatbot": 11, "none": [11, 12, 14, 15], "agent": 11, "__init__": [11, 12], "initi": [11, 12], "arg": [11, 12, 15], "str": [11, 12, 15], "uploaded_bi": [11, 12], "must": [11, 12, 15], "attempt": [11, 12], "rais": [11, 12, 13, 15], "unifyerror": [11, 12, 13], "miss": [11, 12], "clear_chat_histori": 11, "clear": 11, "properti": [11, 12], "dar201": [11, 12], "noqa": [11, 12], "show_credit": 11, "show_provid": 11, "loop": 11, "bool": [11, 12], "whether": 11, "consumpt": 11, "set_client": 11, "dar101": [11, 12], "set_endpoint": [11, 12], "set_model": [11, 12], "set_provid": [11, 12], "asyncunifi": 12, "async": [12, 14], "user_prompt": 12, "system_prompt": 12, "union": 12, "asyncgener": 12, "dict": [12, 15], "dictionari": [12, 15], "convers": 12, "int": 12, "max": 12, "what": [12, 19], "random": 12, "while": 12, "focus": 12, "determinist": 12, "yield": [12, 16, 17], "occur": 12, "dure": 12, "get_credit_bal": 12, "left": 12, "badrequesterror": [12, 13, 15], "valueerror": [12, 15], "pars": [12, 15], "authenticationerror": 13, "400": 13, "bad": 13, "conflicterror": 13, "409": 13, "conflict": 13, "internalservererror": 13, "intern": 13, "notfounderror": 13, "permissiondeniederror": 13, "ratelimiterror": 13, "429": 13, "too": 13, "mani": 13, "unprocessableentityerror": 13, "testasyncunifi": 14, "methodnam": 14, "runtest": 14, "isolatedasynciotestcas": 14, "setup": 14, "hook": 14, "fixtur": 14, "exercis": 14, "test_generate_returns_generator_when_stream_tru": 14, "test_generate_returns_string_when_stream_fals": 14, "test_incorrect_model_name_raises_internal_server_error": 14, "test_invalid_api_key_raises_authentication_error": 14, "test_missing_api_key_raises_key_error": 14, "mock_get": 14, "testunifi": 14, "testcas": 14, "delete_dataset": 15, "platform": [15, 16, 17], "path": 15, "info": 15, "msg": 15, "delete_evalu": 15, "download_dataset": 15, "list_dataset": 15, "fetch": 15, "list_endpoint": 15, "empti": 15, "list_evalu": 15, "upload_dataset_from_dictionari": 15, "upload_dataset_from_fil": 15, "central": [16, 17], "plan": [16, 17], "servic": [16, 17, 19], "b": [16, 17], "target": [16, 17], "high": [16, 17], "throughput": [16, 17], "low": [16, 17], "unfi": [16, 17], "seamless": [16, 17], "refactor": [16, 17], "concept": [16, 17], "quick": [16, 17], "read": [16, 17], "guid": [16, 17], "throughout": [16, 17], "mark": [16, 17], "beta": [16, 17], "constantli": [16, 17], "iter": [16, 17], "roadmap": [16, 17], "leav": [16, 17], "feedback": [16, 17], "suggest": [16, 17], "love": [16, 17], "discuss": [16, 17], "book": 18, "prem": 19, "microservic": 19, "grant": 19, "docker": 19, "Then": 19, "dt": 19, "p": 19, "8000": 19, "env_file_path": 19, "deepinfra_api_kei": 19, "stability_api_kei": 19, "mistral_ai_api_kei": 19, "perplexity_ai_api_kei": 19, "anyscale_api_kei": 19, "octoai_api_kei": 19, "openai_api_kei": 19, "together_ai_api_kei": 19, "replicate_api_kei": 19, "lepton_ai_api_kei": 19, "fireworks_ai_api_kei": 19, "anthropic_api_kei": 19, "vertexai_service_acc_json": 19, "vertexai_gcloud_path": 19, "vertexai_project": 19, "vertexai_loc": 19, "weather": 19, "san": 19, "francisco": 19, "tokyo": 19, "pari": 19, "localhost": 19, "haiku": 19, "random_key_wont_be_us": 19, "life": 19}, "objects": {"unify": [[11, 0, 0, "-", "chat"], [12, 0, 0, "-", "clients"], [13, 0, 0, "-", "exceptions"], [14, 0, 0, "-", "tests"], [15, 0, 0, "-", "utils"]], "unify.chat": [[11, 1, 1, "", "ChatBot"]], "unify.chat.ChatBot": [[11, 2, 1, "", "__init__"], [11, 2, 1, "", "clear_chat_history"], [11, 3, 1, "", "client"], [11, 3, 1, "", "endpoint"], [11, 3, 1, "", "model"], [11, 3, 1, "", "provider"], [11, 2, 1, "", "run"], [11, 2, 1, "", "set_client"], [11, 2, 1, "", "set_endpoint"], [11, 2, 1, "", "set_model"], [11, 2, 1, "", "set_provider"]], "unify.clients": [[12, 1, 1, "", "AsyncUnify"], [12, 1, 1, "", "Unify"]], "unify.clients.AsyncUnify": [[12, 2, 1, "", "__init__"], [12, 3, 1, "", "endpoint"], [12, 2, 1, "", "generate"], [12, 2, 1, "", "get_credit_balance"], [12, 3, 1, "", "model"], [12, 3, 1, "", "provider"], [12, 2, 1, "", "set_endpoint"], [12, 2, 1, "", "set_model"], [12, 2, 1, "", "set_provider"]], "unify.clients.Unify": [[12, 2, 1, "", "__init__"], [12, 3, 1, "", "endpoint"], [12, 2, 1, "", "generate"], [12, 2, 1, "", "get_credit_balance"], [12, 3, 1, "", "model"], [12, 3, 1, "", "provider"], [12, 2, 1, "", "set_endpoint"], [12, 2, 1, "", "set_model"], [12, 2, 1, "", "set_provider"]], "unify.exceptions": [[13, 4, 1, "", "AuthenticationError"], [13, 4, 1, "", "BadRequestError"], [13, 4, 1, "", "ConflictError"], [13, 4, 1, "", "InternalServerError"], [13, 4, 1, "", "NotFoundError"], [13, 4, 1, "", "PermissionDeniedError"], [13, 4, 1, "", "RateLimitError"], [13, 4, 1, "", "UnifyError"], [13, 4, 1, "", "UnprocessableEntityError"]], "unify.tests": [[14, 1, 1, "", "TestAsyncUnify"], [14, 1, 1, "", "TestUnify"]], "unify.tests.TestAsyncUnify": [[14, 2, 1, "", "setUp"], [14, 2, 1, "", "test_generate_returns_generator_when_stream_true"], [14, 2, 1, "", "test_generate_returns_string_when_stream_false"], [14, 2, 1, "", "test_incorrect_model_name_raises_internal_server_error"], [14, 2, 1, "", "test_invalid_api_key_raises_authentication_error"], [14, 2, 1, "", "test_missing_api_key_raises_key_error"]], "unify.tests.TestUnify": [[14, 2, 1, "", "setUp"], [14, 2, 1, "", "test_generate_returns_generator_when_stream_true"], [14, 2, 1, "", "test_generate_returns_string_when_stream_false"], [14, 2, 1, "", "test_incorrect_model_name_raises_internal_server_error"], [14, 2, 1, "", "test_invalid_api_key_raises_authentication_error"], [14, 2, 1, "", "test_missing_api_key_raises_key_error"]], "unify.utils": [[15, 5, 1, "", "delete_dataset"], [15, 5, 1, "", "delete_evaluation"], [15, 5, 1, "", "download_dataset"], [15, 5, 1, "", "evaluate"], [15, 5, 1, "", "list_datasets"], [15, 5, 1, "", "list_endpoints"], [15, 5, 1, "", "list_evaluations"], [15, 5, 1, "", "list_models"], [15, 5, 1, "", "list_providers"], [15, 5, 1, "", "upload_dataset_from_dictionary"], [15, 5, 1, "", "upload_dataset_from_file"]]}, "objtypes": {"0": "py:module", "1": "py:class", "2": "py:method", "3": "py:property", "4": "py:exception", "5": "py:function"}, "objnames": {"0": ["py", "module", "Python module"], "1": ["py", "class", "Python class"], "2": ["py", "method", "Python method"], "3": ["py", "property", "Python property"], "4": ["py", "exception", "Python exception"], "5": ["py", "function", "Python function"]}, "titleterms": {"benchmark": [0, 9], "prepar": [0, 5], "your": [0, 2, 7, 8, 9], "dataset": [0, 5, 8], "how": 0, "doe": 0, "work": 0, "deploi": 1, "router": [1, 5, 7], "us": [1, 2], "base": 1, "optim": 1, "metric": 1, "defin": 1, "threshold": 1, "custom": [1, 5, 6, 7, 8], "round": [1, 2, 7, 8, 9], "up": [1, 2, 7, 8, 9], "make": 2, "first": 2, "request": [2, 6], "get": [2, 4, 16, 17], "kei": 2, "find": 2, "model": 2, "provid": 2, "queri": [2, 6], "an": 2, "endpoint": [2, 5, 6, 8, 9], "python": [2, 6, 21], "packag": [2, 6], "openai": [2, 6], "api": [2, 4, 6], "format": 2, "compat": 2, "tool": 2, "sdk": 2, "open": 2, "interpret": 2, "On": [3, 18, 19], "prem": [3, 18], "imag": 3, "refer": 4, "get_credit": 4, "post": 4, "chat": [4, 11], "complet": 4, "rout": 5, "what": 5, "i": 5, "llm": [5, 6], "foundat": 5, "filter": 5, "maximis": 5, "throughput": 5, "fine": 5, "tune": 5, "train": [5, 7], "beta": [5, 7, 8, 9], "univers": 6, "authent": 6, "http": 6, "unifi": [6, 16, 17], "bill": 6, "advanc": 6, "featur": 6, "fallback": 6, "build": 7, "connect": 8, "stack": 8, "prerequisit": 8, "ad": 8, "qualiti": 9, "runtim": 9, "run": 9, "own": 9, "client": 12, "except": 13, "test": 14, "util": 15, "welcom": [16, 17], "start": [16, 17], "access": 18, "sso": 19, "singl": 19, "sign": 19, "openapi": 20, "specif": 20, "librari": 21}, "envversion": {"sphinx.domains.c": 3, "sphinx.domains.changeset": 1, "sphinx.domains.citation": 1, "sphinx.domains.cpp": 9, "sphinx.domains.index": 1, "sphinx.domains.javascript": 3, "sphinx.domains.math": 2, "sphinx.domains.python": 4, "sphinx.domains.rst": 2, "sphinx.domains.std": 2, "nbsphinx": 4, "sphinx": 60}, "alltitles": {"Universal API": [[6, "universal-api"]], "Authentication": [[6, "authentication"]], "Querying the API": [[6, "querying-the-api"]], "HTTP request": [[6, "http-request"]], "Unify Python Package": [[6, "unify-python-package"]], "OpenAI Python package": [[6, "openai-python-package"]], "Billing": [[6, "billing"]], "Advanced features": [[6, "advanced-features"]], "Custom endpoints": [[6, "custom-endpoints"]], "LLM Fallbacks": [[6, "llm-fallbacks"]], "Routing": [[5, "routing"]], "What is LLM routing?": [[5, "what-is-llm-routing"]], "Foundation router": [[5, "foundation-router"]], "Filtering endpoints": [[5, "filtering-endpoints"]], "Maximising throughput": [[5, "maximising-throughput"]], "Fine-tuned custom router": [[5, "fine-tuned-custom-router"]], "Preparing a dataset": [[5, "preparing-a-dataset"]], "Training a router (beta)": [[5, "training-a-router-beta"]], "Connecting your stack": [[8, "connecting-your-stack"]], "Custom endpoints (Beta)": [[8, "custom-endpoints-beta"]], "Prerequisite": [[8, "prerequisite"]], "Adding the endpoints": [[8, "adding-the-endpoints"]], "Custom datasets": [[8, "custom-datasets"]], "Round Up": [[8, "round-up"], [9, "round-up"], [7, "round-up"], [1, "round-up"], [2, "round-up"]], "Benchmarking endpoints": [[9, "benchmarking-endpoints"]], "Quality benchmarks": [[9, "quality-benchmarks"], [9, "id4"]], "Runtime benchmarks": [[9, "runtime-benchmarks"], [9, "id2"]], "Running your own benchmarks (Beta)": [[9, "running-your-own-benchmarks-beta"]], "Building a custom router": [[7, "building-a-custom-router"]], "Training a custom router (Beta)": [[7, "training-a-custom-router-beta"]], "Customizing your router (Beta)": [[7, "customizing-your-router-beta"]], "OpenAPI Specification": [[20, "openapi-specification"]], "Python Library": [[21, "python-library"]], "API Reference": [[4, "api-reference"]], "GET /get_credits": [[4, "get-get-credits"]], "POST /chat/completions": [[4, "post-chat-completions"]], "Deploying a router": [[1, "deploying-a-router"]], "Using the base router": [[1, "using-the-base-router"]], "Optimizing a metric": [[1, "optimizing-a-metric"]], "Defining thresholds": [[1, "defining-thresholds"]], "Using a custom router": [[1, "using-a-custom-router"]], "Making your first request": [[2, "making-your-first-request"]], "Getting a key": [[2, "getting-a-key"]], "Finding a model and provider": [[2, "finding-a-model-and-provider"]], "Querying an endpoint": [[2, "querying-an-endpoint"]], "Using the Python Package": [[2, "using-the-python-package"]], "Using the OpenAI API Format": [[2, "using-the-openai-api-format"]], "Compatible Tools": [[2, "compatible-tools"]], "OpenAI SDK": [[2, "openai-sdk"]], "Open Interpreter": [[2, "open-interpreter"]], "On-Prem Images": [[3, "on-prem-images"]], "Benchmarking": [[0, "benchmarking"]], "Preparing your dataset": [[0, "preparing-your-dataset"]], "Benchmarking your dataset": [[0, "benchmarking-your-dataset"]], "How does it work?": [[0, "how-does-it-work"]], "SSO (Single Sign On)": [[19, "sso-single-sign-on"]], "Welcome to Unify!": [[17, "welcome-to-unify"], [16, "welcome-to-unify"]], "Getting Started": [[17, "getting-started"], [16, "getting-started"]], "Utils": [[15, "module-unify.utils"]], "On-Prem access": [[18, "on-prem-access"]], "Clients": [[12, "module-unify.clients"]], "Chat": [[11, "module-unify.chat"]], "Exceptions": [[13, "module-unify.exceptions"]], "Tests": [[14, "module-unify.tests"]]}, "indexentries": {"chatbot (class in unify.chat)": [[11, "unify.chat.ChatBot"]], "__init__() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.__init__"]], "clear_chat_history() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.clear_chat_history"]], "client (unify.chat.chatbot property)": [[11, "unify.chat.ChatBot.client"]], "endpoint (unify.chat.chatbot property)": [[11, "unify.chat.ChatBot.endpoint"]], "model (unify.chat.chatbot property)": [[11, "unify.chat.ChatBot.model"]], "module": [[11, "module-unify.chat"], [12, "module-unify.clients"], [13, "module-unify.exceptions"], [14, "module-unify.tests"], [15, "module-unify.utils"]], "provider (unify.chat.chatbot property)": [[11, "unify.chat.ChatBot.provider"]], "run() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.run"]], "set_client() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.set_client"]], "set_endpoint() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.set_endpoint"]], "set_model() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.set_model"]], "set_provider() (unify.chat.chatbot method)": [[11, "unify.chat.ChatBot.set_provider"]], "unify.chat": [[11, "module-unify.chat"]], "asyncunify (class in unify.clients)": [[12, "unify.clients.AsyncUnify"]], "unify (class in unify.clients)": [[12, "unify.clients.Unify"]], "__init__() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.__init__"]], "__init__() (unify.clients.unify method)": [[12, "unify.clients.Unify.__init__"]], "endpoint (unify.clients.asyncunify property)": [[12, "unify.clients.AsyncUnify.endpoint"]], "endpoint (unify.clients.unify property)": [[12, "unify.clients.Unify.endpoint"]], "generate() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.generate"]], "generate() (unify.clients.unify method)": [[12, "unify.clients.Unify.generate"]], "get_credit_balance() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.get_credit_balance"]], "get_credit_balance() (unify.clients.unify method)": [[12, "unify.clients.Unify.get_credit_balance"]], "model (unify.clients.asyncunify property)": [[12, "unify.clients.AsyncUnify.model"]], "model (unify.clients.unify property)": [[12, "unify.clients.Unify.model"]], "provider (unify.clients.asyncunify property)": [[12, "unify.clients.AsyncUnify.provider"]], "provider (unify.clients.unify property)": [[12, "unify.clients.Unify.provider"]], "set_endpoint() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.set_endpoint"]], "set_endpoint() (unify.clients.unify method)": [[12, "unify.clients.Unify.set_endpoint"]], "set_model() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.set_model"]], "set_model() (unify.clients.unify method)": [[12, "unify.clients.Unify.set_model"]], "set_provider() (unify.clients.asyncunify method)": [[12, "unify.clients.AsyncUnify.set_provider"]], "set_provider() (unify.clients.unify method)": [[12, "unify.clients.Unify.set_provider"]], "unify.clients": [[12, "module-unify.clients"]], "authenticationerror": [[13, "unify.exceptions.AuthenticationError"]], "badrequesterror": [[13, "unify.exceptions.BadRequestError"]], "conflicterror": [[13, "unify.exceptions.ConflictError"]], "internalservererror": [[13, "unify.exceptions.InternalServerError"]], "notfounderror": [[13, "unify.exceptions.NotFoundError"]], "permissiondeniederror": [[13, "unify.exceptions.PermissionDeniedError"]], "ratelimiterror": [[13, "unify.exceptions.RateLimitError"]], "unifyerror": [[13, "unify.exceptions.UnifyError"]], "unprocessableentityerror": [[13, "unify.exceptions.UnprocessableEntityError"]], "unify.exceptions": [[13, "module-unify.exceptions"]], "testasyncunify (class in unify.tests)": [[14, "unify.tests.TestAsyncUnify"]], "testunify (class in unify.tests)": [[14, "unify.tests.TestUnify"]], "setup() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.setUp"]], "setup() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.setUp"]], "test_generate_returns_generator_when_stream_true() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.test_generate_returns_generator_when_stream_true"]], "test_generate_returns_generator_when_stream_true() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.test_generate_returns_generator_when_stream_true"]], "test_generate_returns_string_when_stream_false() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.test_generate_returns_string_when_stream_false"]], "test_generate_returns_string_when_stream_false() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.test_generate_returns_string_when_stream_false"]], "test_incorrect_model_name_raises_internal_server_error() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.test_incorrect_model_name_raises_internal_server_error"]], "test_incorrect_model_name_raises_internal_server_error() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.test_incorrect_model_name_raises_internal_server_error"]], "test_invalid_api_key_raises_authentication_error() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.test_invalid_api_key_raises_authentication_error"]], "test_invalid_api_key_raises_authentication_error() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.test_invalid_api_key_raises_authentication_error"]], "test_missing_api_key_raises_key_error() (unify.tests.testasyncunify method)": [[14, "unify.tests.TestAsyncUnify.test_missing_api_key_raises_key_error"]], "test_missing_api_key_raises_key_error() (unify.tests.testunify method)": [[14, "unify.tests.TestUnify.test_missing_api_key_raises_key_error"]], "unify.tests": [[14, "module-unify.tests"]], "delete_dataset() (in module unify.utils)": [[15, "unify.utils.delete_dataset"]], "delete_evaluation() (in module unify.utils)": [[15, "unify.utils.delete_evaluation"]], "download_dataset() (in module unify.utils)": [[15, "unify.utils.download_dataset"]], "evaluate() (in module unify.utils)": [[15, "unify.utils.evaluate"]], "list_datasets() (in module unify.utils)": [[15, "unify.utils.list_datasets"]], "list_endpoints() (in module unify.utils)": [[15, "unify.utils.list_endpoints"]], "list_evaluations() (in module unify.utils)": [[15, "unify.utils.list_evaluations"]], "list_models() (in module unify.utils)": [[15, "unify.utils.list_models"]], "list_providers() (in module unify.utils)": [[15, "unify.utils.list_providers"]], "unify.utils": [[15, "module-unify.utils"]], "upload_dataset_from_dictionary() (in module unify.utils)": [[15, "unify.utils.upload_dataset_from_dictionary"]], "upload_dataset_from_file() (in module unify.utils)": [[15, "unify.utils.upload_dataset_from_file"]]}})
\ No newline at end of file
diff --git a/hub/tools/openapi.html b/hub/tools/openapi.html
index 3ced79e909..bb5b0b3870 100644
--- a/hub/tools/openapi.html
+++ b/hub/tools/openapi.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -475,13 +403,13 @@ <h1>OpenAPI Specification<a class="headerlink" href="#openapi-specification" tit
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -489,41 +417,11 @@ <h1>OpenAPI Specification<a class="headerlink" href="#openapi-specification" tit
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
diff --git a/hub/tools/python_library.html b/hub/tools/python_library.html
index da1395e3c7..04ae536071 100644
--- a/hub/tools/python_library.html
+++ b/hub/tools/python_library.html
@@ -153,21 +153,21 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/unify_api.html">
+                      <a class="nav-link nav-internal" href="../concepts/unify_api.html">
                         Universal API
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/benchmarks.html">
+                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
                         Benchmarking
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../api/router.html">
+                      <a class="nav-link nav-internal" href="../concepts/router.html">
                         Routing
                       </a>
                     </li>
@@ -181,68 +181,26 @@
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/unify.html">
-                        Python Package Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/langchain.html">
-                        LangChain Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../demos/llamaindex.html">
-                        LlamaIndex Examples
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/connecting_stack.html">
+                      <a class="nav-link nav-internal" href="../console/connecting_stack.html">
                         Connecting your stack
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/running_benchmarks.html">
+                      <a class="nav-link nav-internal" href="../console/running_benchmarks.html">
                         Benchmarking endpoints
                       </a>
                     </li>
                 
 
                     <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../interfaces/building_router.html">
+                      <a class="nav-link nav-internal" href="../console/building_router.html">
                         Building a custom router
                       </a>
                     </li>
                 
 
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/endpoints.html">
-                        Model Endpoints
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/benchmarks.html">
-                        Benchmarks
-                      </a>
-                    </li>
-                
-
-                    <li class="nav-item">
-                      <a class="nav-link nav-internal" href="../concepts/routing.html">
-                        Routing
-                      </a>
-                    </li>
-                
-
                     <li class="nav-item">
                       <a class="nav-link nav-internal" href="../on_prem/on_prem_access.html">
                         On-Prem access
@@ -289,13 +247,13 @@
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -303,41 +261,11 @@
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">
@@ -475,13 +403,13 @@ <h1>Python Library<a class="headerlink" href="#python-library" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../index.html">Welcome to Unify!</a></li>
 <li class="toctree-l1"><a class="reference external" href="https://api.unify.ai/v0/docs">API Reference</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../api/unify_api.html">Universal API</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/benchmarks.html">Benchmarking</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../api/router.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/unify_api.html">Universal API</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarking</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../concepts/router.html">Routing</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Python Client Docs</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">API</span></p>
 <ul class="nav bd-sidenav">
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.chat.html">Chat</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.clients.html">Clients</a></li>
@@ -489,41 +417,11 @@ <h1>Python Library<a class="headerlink" href="#python-library" title="Link to th
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.tests.html">Tests</a></li>
 <li class="toctree-l1"><a class="reference internal" href="../docs/unify/unify/unify.utils.html">Utils</a></li>
 </ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Demos</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/unify.html">Python Package Examples</a><input class="toctree-checkbox" id="toctree-checkbox-1" name="toctree-checkbox-1" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-1"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/ChatBot/ChatBot.html">Build a ChatBot</a></li>
-
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/AsyncVsSync/AsyncVsSync.html">Synchronous VS Asynchronous Clients</a></li>
-
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM-Wars/README.html">LLM-Wars</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/SemanticRouter/README.html">Semantic Router</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/Chatbot_Arena/README.html">Chatbot Arena</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/Unify/LLM_Debate/README.html">AI Debate App</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/langchain.html">LangChain Examples</a><input class="toctree-checkbox" id="toctree-checkbox-2" name="toctree-checkbox-2" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-2"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LangChain/RAG_playground/README.html">RAG Playground 🛝</a></li>
-</ul>
-</li>
-<li class="toctree-l1 has-children"><a class="reference internal" href="../demos/llamaindex.html">LlamaIndex Examples</a><input class="toctree-checkbox" id="toctree-checkbox-3" name="toctree-checkbox-3" type="checkbox"/><label class="toctree-toggle" for="toctree-checkbox-3"><i class="fa-solid fa-chevron-down"></i></label><ul>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/RAGPlayground/README.html">RAG Playground</a></li>
-<li class="toctree-l2"><a class="reference internal" href="../demos/demos/LlamaIndex/BasicUsage/unify.html">LlamaIndex</a></li>
-</ul>
-</li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Interfaces</span></p>
-<ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/connecting_stack.html">Connecting your stack</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/running_benchmarks.html">Benchmarking endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../interfaces/building_router.html">Building a custom router</a></li>
-</ul>
-<p aria-level="2" class="caption" role="heading"><span class="caption-text">Concepts</span></p>
+<p aria-level="2" class="caption" role="heading"><span class="caption-text">Console</span></p>
 <ul class="nav bd-sidenav">
-<li class="toctree-l1"><a class="reference internal" href="../concepts/endpoints.html">Model Endpoints</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/benchmarks.html">Benchmarks</a></li>
-<li class="toctree-l1"><a class="reference internal" href="../concepts/routing.html">Routing</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/connecting_stack.html">Connecting your stack</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/running_benchmarks.html">Benchmarking endpoints</a></li>
+<li class="toctree-l1"><a class="reference internal" href="../console/building_router.html">Building a custom router</a></li>
 </ul>
 <p aria-level="2" class="caption" role="heading"><span class="caption-text">On-Prem</span></p>
 <ul class="nav bd-sidenav">