huggingface
diff --git a/‎packages/inference/src/lib/getProviderHelper.ts
Lines changed: 270 additions & 0 deletions b/‎packages/inference/src/lib/getProviderHelper.ts
Lines changed: 270 additions & 0 deletions
@@ -0,0 +1,270 @@
+import * as BlackForestLabs from "../providers/black-forest-labs";
+import * as Cerebras from "../providers/cerebras";
+import * as Cohere from "../providers/cohere";
+import * as FalAI from "../providers/fal-ai";
+import * as Fireworks from "../providers/fireworks-ai";
+import * as HFInference from "../providers/hf-inference";
+
+import * as Hyperbolic from "../providers/hyperbolic";
+import * as Nebius from "../providers/nebius";
+import * as Novita from "../providers/novita";
+import * as OpenAI from "../providers/openai";
+import type {
+	AudioClassificationTaskHelper,
+	AudioToAudioTaskHelper,
+	AutomaticSpeechRecognitionTaskHelper,
+	ConversationalTaskHelper,
+	DocumentQuestionAnsweringTaskHelper,
+	FeatureExtractionTaskHelper,
+	FillMaskTaskHelper,
+	ImageClassificationTaskHelper,
+	ImageSegmentationTaskHelper,
+	ImageToImageTaskHelper,
+	ImageToTextTaskHelper,
+	ObjectDetectionTaskHelper,
+	QuestionAnsweringTaskHelper,
+	SentenceSimilarityTaskHelper,
+	SummarizationTaskHelper,
+	TableQuestionAnsweringTaskHelper,
+	TabularClassificationTaskHelper,
+	TabularRegressionTaskHelper,
+	TaskProviderHelper,
+	TextClassificationTaskHelper,
+	TextGenerationTaskHelper,
+	TextToAudioTaskHelper,
+	TextToImageTaskHelper,
+	TextToSpeechTaskHelper,
+	TextToVideoTaskHelper,
+	TokenClassificationTaskHelper,
+	TranslationTaskHelper,
+	VisualQuestionAnsweringTaskHelper,
+	ZeroShotClassificationTaskHelper,
+	ZeroShotImageClassificationTaskHelper,
+} from "../providers/providerHelper";
+import * as Replicate from "../providers/replicate";
+import * as Sambanova from "../providers/sambanova";
+import * as Together from "../providers/together";
+import type { InferenceProvider, InferenceTask } from "../types";
+
+export const PROVIDERS: Record<InferenceProvider, Partial<Record<InferenceTask, TaskProviderHelper>>> = {
+	"black-forest-labs": {
+		"text-to-image": new BlackForestLabs.BlackForestLabsTextToImageTask(),
+	},
+	cerebras: {
+		conversational: new Cerebras.CerebrasConversationalTask(),
+	},
+	cohere: {
+		conversational: new Cohere.CohereConversationalTask(),
+	},
+	"fal-ai": {
+		"text-to-image": new FalAI.FalAITextToImageTask(),
+		"text-to-speech": new FalAI.FalAITextToSpeechTask(),
+		"text-to-video": new FalAI.FalAITextToVideoTask(),
+		"automatic-speech-recognition": new FalAI.FalAIAutomaticSpeechRecognitionTask(),
+	},
+	"hf-inference": {
+		"text-to-image": new HFInference.HFInferenceTextToImageTask(),
+		conversational: new HFInference.HFInferenceConversationalTask(),
+		"text-generation": new HFInference.HFInferenceTextGenerationTask(),
+		"text-classification": new HFInference.HFInferenceTextClassificationTask(),
+		"question-answering": new HFInference.HFInferenceQuestionAnsweringTask(),
+		"audio-classification": new HFInference.HFInferenceAudioClassificationTask(),
+		"automatic-speech-recognition": new HFInference.HFInferenceAutomaticSpeechRecognitionTask(),
+		"fill-mask": new HFInference.HFInferenceFillMaskTask(),
+		"feature-extraction": new HFInference.HFInferenceFeatureExtractionTask(),
+		"image-classification": new HFInference.HFInferenceImageClassificationTask(),
+		"image-segmentation": new HFInference.HFInferenceImageSegmentationTask(),
+		"document-question-answering": new HFInference.HFInferenceDocumentQuestionAnsweringTask(),
+		"image-to-text": new HFInference.HFInferenceImageToTextTask(),
+		"object-detection": new HFInference.HFInferenceObjectDetectionTask(),
+		"audio-to-audio": new HFInference.HFInferenceAudioToAudioTask(),
+		"zero-shot-image-classification": new HFInference.HFInferenceZeroShotImageClassificationTask(),
+		"zero-shot-classification": new HFInference.HFInferenceZeroShotClassificationTask(),
+		"image-to-image": new HFInference.HFInferenceImageToImageTask(),
+		"sentence-similarity": new HFInference.HFInferenceSentenceSimilarityTask(),
+		"table-question-answering": new HFInference.HFInferenceTableQuestionAnsweringTask(),
+		"tabular-classification": new HFInference.HFInferenceTabularClassificationTask(),
+		"text-to-speech": new HFInference.HFInferenceTextToSpeechTask(),
+		"token-classification": new HFInference.HFInferenceTokenClassificationTask(),
+		translation: new HFInference.HFInferenceTranslationTask(),
+		summarization: new HFInference.HFInferenceSummarizationTask(),
+		"visual-question-answering": new HFInference.HFInferenceVisualQuestionAnsweringTask(),
+		"tabular-regression": new HFInference.HFInferenceTabularRegressionTask(),
+		"text-to-audio": new HFInference.HFInferenceTextToAudioTask(),
+	},
+	"fireworks-ai": {
+		conversational: new Fireworks.FireworksConversationalTask(),
+	},
+	hyperbolic: {
+		"text-to-image": new Hyperbolic.HyperbolicTextToImageTask(),
+		conversational: new Hyperbolic.HyperbolicConversationalTask(),
+		"text-generation": new Hyperbolic.HyperbolicTextGenerationTask(),
+	},
+	nebius: {
+		"text-to-image": new Nebius.NebiusTextToImageTask(),
+		conversational: new Nebius.NebiusConversationalTask(),
+		"text-generation": new Nebius.NebiusTextGenerationTask(),
+	},
+	novita: {
+		conversational: new Novita.NovitaConversationalTask(),
+		"text-generation": new Novita.NovitaTextGenerationTask(),
+	},
+	openai: {
+		conversational: new OpenAI.OpenAIConversationalTask(),
+	},
+	replicate: {
+		"text-to-image": new Replicate.ReplicateTextToImageTask(),
+		"text-to-speech": new Replicate.ReplicateTextToSpeechTask(),
+		"text-to-video": new Replicate.ReplicateTextToVideoTask(),
+	},
+	sambanova: {
+		conversational: new Sambanova.SambanovaConversationalTask(),
+	},
+	together: {
+		"text-to-image": new Together.TogetherTextToImageTask(),
+		conversational: new Together.TogetherConversationalTask(),
+		"text-generation": new Together.TogetherTextGenerationTask(),
+	},
+};
+
+/**
+ * Get provider helper instance by name and task
+ */
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-to-image"
+): TextToImageTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "conversational"
+): ConversationalTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-generation"
+): TextGenerationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-to-speech"
+): TextToSpeechTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-to-audio"
+): TextToAudioTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "automatic-speech-recognition"
+): AutomaticSpeechRecognitionTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-to-video"
+): TextToVideoTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "text-classification"
+): TextClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "question-answering"
+): QuestionAnsweringTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "audio-classification"
+): AudioClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "audio-to-audio"
+): AudioToAudioTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "fill-mask"
+): FillMaskTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "feature-extraction"
+): FeatureExtractionTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "image-classification"
+): ImageClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "image-segmentation"
+): ImageSegmentationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "document-question-answering"
+): DocumentQuestionAnsweringTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "image-to-text"
+): ImageToTextTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "object-detection"
+): ObjectDetectionTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "zero-shot-image-classification"
+): ZeroShotImageClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "zero-shot-classification"
+): ZeroShotClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "image-to-image"
+): ImageToImageTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "sentence-similarity"
+): SentenceSimilarityTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "table-question-answering"
+): TableQuestionAnsweringTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "tabular-classification"
+): TabularClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "tabular-regression"
+): TabularRegressionTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "token-classification"
+): TokenClassificationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "translation"
+): TranslationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "summarization"
+): SummarizationTaskHelper & TaskProviderHelper;
+export function getProviderHelper(
+	provider: InferenceProvider,
+	task: "visual-question-answering"
+): VisualQuestionAnsweringTaskHelper & TaskProviderHelper;
+export function getProviderHelper(provider: InferenceProvider, task: InferenceTask | undefined): TaskProviderHelper;
+
+export function getProviderHelper(provider: InferenceProvider, task: InferenceTask | undefined): TaskProviderHelper {
+	if (provider === "hf-inference") {
+		if (!task) {
+			return new HFInference.HFInferenceTask();
+		}
+	}
+	if (!task) {
+		throw new Error("you need to provide a task name when using an external provider, e.g. 'text-to-image'");
+	}
+	if (!(provider in PROVIDERS)) {
+		throw new Error(`Provider '${provider}' not supported. Available providers: ${Object.keys(PROVIDERS)}`);
+	}
+	const providerTasks = PROVIDERS[provider];
+	if (!providerTasks || !(task in providerTasks)) {
+		throw new Error(
+			`Task '${task}' not supported for provider '${provider}'. Available tasks: ${Object.keys(providerTasks ?? {})}`
+		);
+	}
+	return providerTasks[task] as TaskProviderHelper;
+}