推理提供商文件
定價與計費
並獲得增強的文件體驗
開始使用
定價與計費
透過集中、透明、按需付費的定價方式,訪問來自領先 AI 推理提供商的 200 多個模型。無需基礎設施管理,只需為您使用的付費,Hugging Face 不收取任何額外費用。
免費積分助您入門
每位 Hugging Face 使用者每月都會收到積分,用於試用推理提供商服務。
賬戶型別 | 每月積分 | 額外使用量(按需付費) |
---|---|---|
免費使用者 | 0.10 美元,可能會有變動 | 否 |
PRO 使用者 | $2.00 | 是的 |
團隊或企業組織 | 每個席位 2.00 美元 | 是的 |
當您透過 Hugging Face 路由請求時,您的每月積分將自動應用。對於團隊或企業組織,積分在所有成員之間共享。
計費方式:選擇您的方案
推理提供商在計費方面提供了靈活性。提前瞭解這些選項有助於您選擇最適合您需求的方案。
特性 | 透過 Hugging Face 路由 | 自定義提供商金鑰 |
---|---|---|
工作原理 | 您的請求透過 HF 路由到提供商 | 您在 HF 設定中設定自定義提供商金鑰 |
計費 | 在您的 HF 賬戶上按需付費 | 由提供商直接計費 |
每月積分 | ✅ 是 - 積分適用於符合條件的提供商 | ❌ 否 - 積分不適用 |
是否需要提供商賬戶 | ❌ 否 - 我們處理一切 | ✅ 是 - 您需要提供商賬戶 |
最適合 | 簡單、實驗、集中計費 | 更多計費控制,使用非整合提供商 |
整合 | SDK、Playground、小部件、Data AI Studio | SDK、Playground、小部件、Data AI Studio |
我應該選擇哪個選項?
- 如果您想要簡單便捷並使用每月積分,請從“透過 Hugging Face 路由”開始。
- 如果您需要特定提供商功能或您一直使用同一提供商,請使用自定義提供商金鑰。
按需付費詳情
要享受企業 Hub 包含的積分,您需要在執行推理請求時明確指定要計費的組織。有關更多詳細資訊,請參閱下面的組織計費部分。
PRO 使用者和企業 Hub 組織在用完每月積分後仍可繼續使用 API。這確保了生產工作負載的模型訪問不間斷。
Hugging Face 向您收取與提供商相同的費率,不收取任何額外費用。我們直接將提供商成本轉嫁給您。
您可以隨時在您的計費頁面上跟蹤您的支出。
Hugging Face 計費與自定義提供商金鑰(詳細比較)
以上文件假設您正在向外部提供商發出路由請求。實際上,有 2 種不同的方式來執行推理,每種方式都有獨特的計費影響。
Hugging Face 路由請求:這是使用推理提供商的預設方法。只需使用 JavaScript 或 Python
InferenceClient
,或使用您的 Hugging Face 使用者訪問令牌發出原始 HTTP 請求。您的請求會自動透過 Hugging Face 路由到提供商的平臺。無需單獨的提供商賬戶,Hugging Face 直接管理計費。這種方法使您可以在提供商之間無縫切換,無需額外設定。自定義提供商金鑰:您可以攜帶自己的提供商金鑰與推理提供商一起使用。如果您已經擁有提供商賬戶並希望將其與推理提供商一起使用,這將非常有用。Hugging Face 不會向您收取呼叫費用。
以下表格總結了我們目前所瞭解的情況。
HF 路由 | 計費方 | 是否包含免費套餐 | 按需付費 | 整合 | |
---|---|---|---|---|---|
路由請求 | 是 | Hugging Face | 是 | 僅適用於 PRO 使用者和整合提供商 | SDK、Playground、小部件、Data AI Studio |
自定義提供商金鑰 | 是 | 提供商 | 否 | 是 | SDK、Playground、小部件、Data AI Studio |
您可以在 Hub 上的設定頁面中設定您的自定義提供商金鑰,或者在使用 JavaScript 或 Python SDK 時在 InferenceClient
中設定。使用自定義金鑰發出路由請求時,您的程式碼保持不變——您仍然可以傳遞您的 Hugging Face 使用者訪問令牌。Hugging Face 將在路由請求時自動交換身份驗證。
HF 推理成本
您可能已經注意到,您可以選擇使用 "hf-inference"
提供商。在推理提供商出現之前,這項服務曾被稱為“推理 API(無伺服器)”。從使用者的角度來看,使用 HF 推理與使用任何其他提供商相同。在免費套餐積分用完後,您將根據計算時間 x 底層硬體價格對每個推理請求收費。
例如,一個對 black-forest-labs/FLUX.1-dev 的請求,如果在 GPU 機器上完成需要 10 秒,而該 GPU 機器每秒執行成本為 0.00012 美元,則將收取 0.0012 美元。
截至 2025 年 7 月,hf-inference 主要側重於 CPU 推理(例如,嵌入、文字排名、文字分類,或具有歷史重要性的小型 LLM,如 BERT 或 GPT-2)。
團隊和企業組織的計費
對於企業 Hub 組織,可以集中管理所有使用者的計費。每個使用者仍然使用自己的使用者訪問令牌,但請求將計入您的組織。這可以透過在 HTTP 請求中將 "X-HF-Bill-To: my-org-name"
作為標頭傳遞來實現。
企業 Hub 組織會根據訂閱中的席位數量獲得免費使用積分池。推理提供商的使用情況可以在組織的計費頁面上跟蹤。企業 Hub 組織管理員還可以在組織的設定中設定支出限制並停用一組推理提供商。


要向您的組織計費,請在初始化客戶端時使用 bill_to
引數。
from huggingface_hub import InferenceClient
client = InferenceClient(bill_to="my-org-name")
completion = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V3-0324",
messages=[
{
"role": "user",
"content": "How many 'G's in 'huggingface'?"
}
],
)
print(completion.choices[0].message)
同樣在 JavaScript 中
如果您正在使用 JavaScript InferenceClient
,您可以在客戶端級別設定 billTo
屬性以向您的組織計費。
import { InferenceClient } from "@huggingface/inference";
const client = new InferenceClient(process.env.HF_TOKEN, { billTo: "my-org-name" });
const completion = await client.chat.completions.create({
model: "deepseek-ai/DeepSeek-V3-0324",
messages: [
{
role: "user",
content: "How many 'G's in 'huggingface'?",
},
],
});
console.log(completion.choices[0].message.content);