[Inference] Make CI green on main (#1359)

SBrandeis · web-flow · commit f7608fbe5f40 · 2025-04-15T16:20:35.000+02:00
Best reviewed commit per commit

- Some missing code for HF Inference tests
- Run the format and lint scripts
diff --git a/packages/inference/src/lib/getInferenceProviderMapping.ts b/packages/inference/src/lib/getInferenceProviderMapping.ts
@@ -5,7 +5,6 @@ import { HARDCODED_MODEL_INFERENCE_MAPPING } from "../providers/consts";
 import { EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS } from "../providers/hf-inference";
 import { typedInclude } from "../utils/typedInclude";
 
-
 export const inferenceProviderMappingCache = new Map<ModelId, InferenceProviderMapping>();
 
 export type InferenceProviderMapping = Partial<
@@ -24,12 +23,12 @@ export interface InferenceProviderModelMapping {
 export async function getInferenceProviderMapping(
 	params: {
 		accessToken?: string;
-		modelId: ModelId,
-		provider: InferenceProvider,
-		task: WidgetType
+		modelId: ModelId;
+		provider: InferenceProvider;
+		task: WidgetType;
 	},
 	options: {
-		fetch?: (input: RequestInfo, init?: RequestInit) => Promise<Response>
+		fetch?: (input: RequestInfo, init?: RequestInit) => Promise<Response>;
 	}
 ): Promise<InferenceProviderModelMapping | null> {
 	if (HARDCODED_MODEL_INFERENCE_MAPPING[params.provider][params.modelId]) {
@@ -49,7 +48,8 @@ export async function getInferenceProviderMapping(
 		if (resp.status === 404) {
 			throw new Error(`Model ${params.modelId} does not exist`);
 		}
-		inferenceProviderMapping = await resp.json()
+		inferenceProviderMapping = await resp
+			.json()
 			.then((json) => json.inferenceProviderMapping)
 			.catch(() => null);
 	}
@@ -60,7 +60,10 @@ export async function getInferenceProviderMapping(
 
 	const providerMapping = inferenceProviderMapping[params.provider];
 	if (providerMapping) {
-		const equivalentTasks = params.provider === "hf-inference" && typedInclude(EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS, params.task) ? EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS : [params.task]
+		const equivalentTasks =
+			params.provider === "hf-inference" && typedInclude(EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS, params.task)
+				? EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS
+				: [params.task];
 		if (!typedInclude(equivalentTasks, providerMapping.task)) {
 			throw new Error(
 				`Model ${params.modelId} is not supported for task ${params.task} and provider ${params.provider}. Supported task: ${providerMapping.task}.`
@@ -76,7 +79,7 @@ export async function getInferenceProviderMapping(
 			if (!treeResp.ok) {
 				throw new Error(`Unable to fetch the model tree for ${params.modelId}.`);
 			}
-			const tree: Array<{ type: "file" | "directory"; path: string; }> = await treeResp.json();
+			const tree: Array<{ type: "file" | "directory"; path: string }> = await treeResp.json();
 			const adapterWeightsPath = tree.find(({ type, path }) => type === "file" && path.endsWith(".safetensors"))?.path;
 			if (!adapterWeightsPath) {
 				throw new Error(`No .safetensors file found in the model tree for ${params.modelId}.`);
@@ -85,9 +88,9 @@ export async function getInferenceProviderMapping(
 				...providerMapping,
 				hfModelId: params.modelId,
 				adapterWeightsPath,
-			}
+			};
 		}
 		return { ...providerMapping, hfModelId: params.modelId };
 	}
 	return null;
-}
+}
diff --git a/packages/inference/src/lib/makeRequestOptions.ts b/packages/inference/src/lib/makeRequestOptions.ts
@@ -41,7 +41,13 @@ export async function makeRequestOptions(
 
 	if (args.endpointUrl) {
 		// No need to have maybeModel, or to load default model for a task
-		return makeRequestOptionsFromResolvedModel(maybeModel ?? args.endpointUrl, providerHelper, args, undefined, options);
+		return makeRequestOptionsFromResolvedModel(
+			maybeModel ?? args.endpointUrl,
+			providerHelper,
+			args,
+			undefined,
+			options
+		);
 	}
 
 	if (!maybeModel && !task) {
@@ -55,23 +61,26 @@ export async function makeRequestOptions(
 		throw new Error(`Provider ${provider} requires a model ID to be passed directly.`);
 	}
 
-	const inferenceProviderMapping = providerHelper.clientSideRoutingOnly ?
-		{
-			// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
-			providerId: removeProviderPrefix(maybeModel!, provider),
-			// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
-			hfModelId: maybeModel!,
-			status: "live",
-			// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
-			task: task!
-		} satisfies InferenceProviderModelMapping
-		: await getInferenceProviderMapping({
-			modelId: hfModel,
-			// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
-			task: task!,
-			provider,
-			accessToken: args.accessToken,
-		}, { fetch: options?.fetch });
+	const inferenceProviderMapping = providerHelper.clientSideRoutingOnly
+		? ({
+				// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
+				providerId: removeProviderPrefix(maybeModel!, provider),
+				// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
+				hfModelId: maybeModel!,
+				status: "live",
+				// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
+				task: task!,
+		  } satisfies InferenceProviderModelMapping)
+		: await getInferenceProviderMapping(
+				{
+					modelId: hfModel,
+					// eslint-disable-next-line @typescript-eslint/no-non-null-assertion
+					task: task!,
+					provider,
+					accessToken: args.accessToken,
+				},
+				{ fetch: options?.fetch }
+		  );
 	if (!inferenceProviderMapping) {
 		throw new Error(`We have not been able to find inference provider information for model ${hfModel}.`);
 	}
diff --git a/packages/inference/src/providers/consts.ts b/packages/inference/src/providers/consts.ts
@@ -9,7 +9,10 @@ import { type ModelId } from "../types";
  *
  * We also inject into this dictionary from tests.
  */
-export const HARDCODED_MODEL_INFERENCE_MAPPING: Record<InferenceProvider, Record<ModelId, InferenceProviderModelMapping>> = {
+export const HARDCODED_MODEL_INFERENCE_MAPPING: Record<
+	InferenceProvider,
+	Record<ModelId, InferenceProviderModelMapping>
+> = {
 	/**
 	 * "HF model ID" => "Model ID on Inference Provider's side"
 	 *
diff --git a/packages/inference/src/providers/fal-ai.ts b/packages/inference/src/providers/fal-ai.ts
@@ -76,7 +76,7 @@ abstract class FalAITask extends TaskProviderHelper {
 }
 
 function buildLoraPath(modelId: ModelId, adapterWeightsPath: string): string {
-	return `${HF_HUB_URL}/${modelId}/resolve/main/${adapterWeightsPath}`
+	return `${HF_HUB_URL}/${modelId}/resolve/main/${adapterWeightsPath}`;
 }
 
 export class FalAITextToImageTask extends FalAITask implements TextToImageTaskHelper {
@@ -86,25 +86,31 @@ export class FalAITextToImageTask extends FalAITask implements TextToImageTaskHe
 			...(params.args.parameters as Record<string, unknown>),
 			sync_mode: true,
 			prompt: params.args.inputs,
-			...(params.mapping?.adapter === "lora" && params.mapping.adapterWeightsPath ? {
-				loras: [{
-					path: buildLoraPath(params.mapping.hfModelId, params.mapping.adapterWeightsPath),
-					scale: 1
-				}]
-			} : undefined)
+			...(params.mapping?.adapter === "lora" && params.mapping.adapterWeightsPath
+				? {
+						loras: [
+							{
+								path: buildLoraPath(params.mapping.hfModelId, params.mapping.adapterWeightsPath),
+								scale: 1,
+							},
+						],
+				  }
+				: undefined),
 		};
 
 		if (params.mapping?.adapter === "lora" && params.mapping.adapterWeightsPath) {
-			payload.loras = [{
-				path: buildLoraPath(params.mapping.hfModelId, params.mapping.adapterWeightsPath),
-				scale: 1
-			}]
+			payload.loras = [
+				{
+					path: buildLoraPath(params.mapping.hfModelId, params.mapping.adapterWeightsPath),
+					scale: 1,
+				},
+			];
 			if (params.mapping.providerId === "fal-ai/lora") {
 				payload.model_name = "stabilityai/stable-diffusion-xl-base-1.0";
 			}
 		}
 
-		return payload
+		return payload;
 	}
 
 	override async getResponse(response: FalAITextToImageOutput, outputType?: "url" | "blob"): Promise<string | Blob> {
@@ -160,8 +166,9 @@ export class FalAITextToVideoTask extends FalAITask implements TextToVideoTaskHe
 		let status = response.status;
 
 		const parsedUrl = new URL(url);
-		const baseUrl = `${parsedUrl.protocol}//${parsedUrl.host}${parsedUrl.host === "router.huggingface.co" ? "/fal-ai" : ""
-			}`;
+		const baseUrl = `${parsedUrl.protocol}//${parsedUrl.host}${
+			parsedUrl.host === "router.huggingface.co" ? "/fal-ai" : ""
+		}`;
 
 		// extracting the provider model id for status and result urls
 		// from the response as it might be different from the mapped model in `url`
@@ -253,7 +260,8 @@ export class FalAITextToSpeechTask extends FalAITask {
 			return await urlResponse.blob();
 		} catch (error) {
 			throw new InferenceOutputError(
-				`Error fetching or processing audio from Fal.ai Text-to-Speech URL: ${res.audio.url}. ${error instanceof Error ? error.message : String(error)
+				`Error fetching or processing audio from Fal.ai Text-to-Speech URL: ${res.audio.url}. ${
+					error instanceof Error ? error.message : String(error)
 				}`
 			);
 		}
diff --git a/packages/inference/src/providers/hf-inference.ts b/packages/inference/src/providers/hf-inference.ts
@@ -87,7 +87,6 @@ interface AudioToAudioOutput {
 	label: string;
 }
 
-
 export const EQUIVALENT_SENTENCE_TRANSFORMERS_TASKS = ["feature-extraction", "sentence-similarity"] as const;
 
 export class HFInferenceTask extends TaskProviderHelper {
@@ -217,7 +216,8 @@ export class HFInferenceAudioClassificationTask extends HFInferenceTask implemen
 
 export class HFInferenceAutomaticSpeechRecognitionTask
 	extends HFInferenceTask
-	implements AutomaticSpeechRecognitionTaskHelper {
+	implements AutomaticSpeechRecognitionTaskHelper
+{
 	override async getResponse(response: AutomaticSpeechRecognitionOutput): Promise<AutomaticSpeechRecognitionOutput> {
 		return response;
 	}
@@ -250,7 +250,8 @@ export class HFInferenceAudioToAudioTask extends HFInferenceTask implements Audi
 
 export class HFInferenceDocumentQuestionAnsweringTask
 	extends HFInferenceTask
-	implements DocumentQuestionAnsweringTaskHelper {
+	implements DocumentQuestionAnsweringTaskHelper
+{
 	override async getResponse(
 		response: DocumentQuestionAnsweringOutput
 	): Promise<DocumentQuestionAnsweringOutput[number]> {
@@ -352,7 +353,8 @@ export class HFInferenceObjectDetectionTask extends HFInferenceTask implements O
 
 export class HFInferenceZeroShotImageClassificationTask
 	extends HFInferenceTask
-	implements ZeroShotImageClassificationTaskHelper {
+	implements ZeroShotImageClassificationTaskHelper
+{
 	override async getResponse(response: ZeroShotImageClassificationOutput): Promise<ZeroShotImageClassificationOutput> {
 		if (Array.isArray(response) && response.every((x) => typeof x.label === "string" && typeof x.score === "number")) {
 			return response;
@@ -378,20 +380,20 @@ export class HFInferenceQuestionAnsweringTask extends HFInferenceTask implements
 		if (
 			Array.isArray(response)
 				? response.every(
-					(elem) =>
-						typeof elem === "object" &&
-						!!elem &&
-						typeof elem.answer === "string" &&
-						typeof elem.end === "number" &&
-						typeof elem.score === "number" &&
-						typeof elem.start === "number"
-				)
+						(elem) =>
+							typeof elem === "object" &&
+							!!elem &&
+							typeof elem.answer === "string" &&
+							typeof elem.end === "number" &&
+							typeof elem.score === "number" &&
+							typeof elem.start === "number"
+				  )
 				: typeof response === "object" &&
-				!!response &&
-				typeof response.answer === "string" &&
-				typeof response.end === "number" &&
-				typeof response.score === "number" &&
-				typeof response.start === "number"
+				  !!response &&
+				  typeof response.answer === "string" &&
+				  typeof response.end === "number" &&
+				  typeof response.score === "number" &&
+				  typeof response.start === "number"
 		) {
 			return Array.isArray(response) ? response[0] : response;
 		}
@@ -536,7 +538,8 @@ export class HFInferenceTabularClassificationTask extends HFInferenceTask implem
 
 export class HFInferenceVisualQuestionAnsweringTask
 	extends HFInferenceTask
-	implements VisualQuestionAnsweringTaskHelper {
+	implements VisualQuestionAnsweringTaskHelper
+{
 	override async getResponse(response: VisualQuestionAnsweringOutput): Promise<VisualQuestionAnsweringOutput[number]> {
 		if (
 			Array.isArray(response) &&
diff --git a/packages/inference/test/InferenceClient.spec.ts b/packages/inference/test/InferenceClient.spec.ts

Original file line number	Diff line number	Diff line change
`@@ -9,7 +9,10 @@ import { type ModelId } from "../types";`
`9`	`9`	`*`
`10`	`10`	`* We also inject into this dictionary from tests.`
`11`	`11`	`*/`
`12`		`-export const HARDCODED_MODEL_INFERENCE_MAPPING: Record<InferenceProvider, Record<ModelId, InferenceProviderModelMapping>> = {`
	`12`	`+export const HARDCODED_MODEL_INFERENCE_MAPPING: Record<`
	`13`	`+ InferenceProvider,`
	`14`	`+ Record<ModelId, InferenceProviderModelMapping>`
	`15`	`+> = {`
`13`	`16`	`/**`
`14`	`17`	`* "HF model ID" => "Model ID on Inference Provider's side"`
`15`	`18`	`*`