elasticsearch-py/docs/examples/00fea15cbca83be9d5f1a024ff2ec708.asciidoc at 78bca84e422575520ff5e4d72c09c8e94ca961b1 · elastic/elasticsearch-py · GitHub

resp = client.inference.put(
    task_type="text_embedding",
    inference_id="my-e5-model",
    inference_config={
        "service": "elasticsearch",
        "service_settings": {
            "num_allocations": 1,
            "num_threads": 1,
            "model_id": ".multilingual-e5-small"
        }
    },
)
print(resp)