推理端點(專用)文件

定價

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

定價

建立端點時,您可以根據每小時費率選擇要部署和擴充套件模型的例項型別。Hugging Face 賬戶只要有有效的訂閱和信用卡存檔,就可以訪問推理端點。在計費週期結束時,使用者或組織賬戶將按成功部署的端點(準備就緒可提供服務)在初始化執行狀態下所使用的計算資源付費。

下面,您可以找到所有可用例項和加速器的每小時定價,以及成本計算示例:雖然價格按小時顯示,但實際成本按分鐘計費。

CPU 例項

下表顯示了當前可用的 CPU 例項及其每小時定價。如果無法在應用程式中選擇例項型別,您需要申請配額才能使用它。

提供商 例項型別 例項大小 每小時費率 vCPU 記憶體 架構
aws intel-spr x1 $0.033 1 2 GB Intel Sapphire Rapids
aws intel-spr x2 $0.067 2 4 GB Intel Sapphire Rapids
aws intel-spr x4 $0.134 4 8 GB Intel Sapphire Rapids
aws intel-spr x8 $0.268 8 16 GB Intel Sapphire Rapids
aws intel-spr x16 $0.536 16 32 GB Intel Sapphire Rapids
azure intel-xeon x1 $0.060 1 2 GB Intel Xeon
azure intel-xeon x2 $0.120 2 4 GB Intel Xeon
azure intel-xeon x4 $0.240 4 8 GB Intel Xeon
azure intel-xeon x8 $0.480 8 16 GB Intel Xeon
gcp intel-spr x1 $0.050 1 2 GB Intel Sapphire Rapids
gcp intel-spr x2 $0.100 2 4 GB Intel Sapphire Rapids
gcp intel-spr x4 $0.200 4 8 GB Intel Sapphire Rapids
gcp intel-spr x8 $0.400 8 16 GB Intel Sapphire Rapids
aws intel-icl x1 $0.032 1 2 GB Intel Ice Lake - 2025 年 7 月起棄用
aws intel-icl x2 $0.064 2 4 GB Intel Ice Lake - 2025 年 7 月起棄用
aws intel-icl x4 $0.128 4 8 GB Intel Ice Lake - 2025 年 7 月起棄用
aws intel-icl x8 $0.256 8 16 GB Intel Ice Lake - 2025 年 7 月起棄用

GPU 例項

下表顯示了當前可用的 GPU 例項及其每小時定價。如果無法在應用程式中選擇例項型別,您需要申請配額才能使用它。

提供商 例項型別 例項大小 每小時費率 GPU 記憶體 架構
aws nvidia-t4 x1 $0.5 1 14 GB NVIDIA T4
aws nvidia-t4 x4 $3 4 56 GB NVIDIA T4
aws nvidia-l4 x1 $0.8 1 24 GB NVIDIA L4
aws nvidia-l4 x4 $3.8 4 96 GB NVIDIA L4
aws nvidia-a10g x1 $1 1 24 GB NVIDIA A10G
aws nvidia-a10g x4 $5 4 96 GB NVIDIA A10G
aws nvidia-l40s x1 $1.8 1 48 GB NVIDIA L40S
aws nvidia-l40s x4 $8.3 4 192 GB NVIDIA L40S
aws nvidia-l40s x8 $23.5 8 384 GB NVIDIA L40S
aws nvidia-a100 x1 $2.5 1 80 GB NVIDIA A100
aws nvidia-a100 x2 $5 2 160 GB NVIDIA A100
aws nvidia-a100 x4 $10 4 320 GB NVIDIA A100
aws nvidia-a100 x8 $20 8 640 GB NVIDIA A100
aws nvidia-h200 x1 $5 1 141 GB NVIDIA H200
aws nvidia-h200 x2 $10 2 282 GB NVIDIA H200
aws nvidia-h200 x4 $20 4 564 GB NVIDIA H200
aws nvidia-h200 x8 $40 8 1128 GB NVIDIA H200
gcp nvidia-t4 x1 $0.5 1 16 GB NVIDIA T4
gcp nvidia-l4 x1 $0.7 1 24 GB NVIDIA L4
gcp nvidia-l4 x4 $3.8 4 96 GB NVIDIA L4
gcp nvidia-a100 x1 $3.6 1 80 GB NVIDIA A100
gcp nvidia-a100 x2 $7.2 2 160 GB NVIDIA A100
gcp nvidia-a100 x4 $14.4 4 320 GB NVIDIA A100
gcp nvidia-a100 x8 $28.8 8 640 GB NVIDIA A100
gcp nvidia-h100 x1 $10 1 80 GB NVIDIA H100
gcp nvidia-h100 x2 $20 2 160 GB NVIDIA H100
gcp nvidia-h100 x4 $40 4 320 GB NVIDIA H100
gcp nvidia-h100 x8 $80 8 640 GB NVIDIA H100

INF2 例項

下表顯示了當前可用的 INF2 例項及其每小時定價。如果無法在應用程式中選擇例項型別,您需要申請配額才能使用它。

提供商 例項型別 例項大小 每小時費率 加速器 加速器記憶體 RAM 架構
aws inf2 x1 $0.75 1 32 GB 14.5 GB AWS Inferentia2
aws inf2 x12 $12 12 384 GB 760 GB AWS Inferentia2

定價示例

以下定價方案示例演示瞭如何計算成本。您可以在上表中找到所有例項型別和大小的每小時費率。使用以下公式計算成本

instance hourly rate * ((hours * # min replica) + (scale-up hrs * # additional replicas))

基本示例

  • AWS CPU intel-spr x2 (2x vCPU 4GB RAM)
  • 自動擴縮(最少 1 個副本,最多 1 個副本)

每小時費用

instance hourly rate * (hours * # min replica) = hourly cost
$0.067/hr * (1hr * 1 replica) = $0.067/hr

每月費用

instance hourly rate * (hours * # min replica) = monthly cost
$0.064/hr * (730hr * 1 replica) = $46.72/month

basic-chart

高階示例

  • AWS GPU 小型(1x GPU 14GB RAM)
  • 自動擴縮(最少 1 個副本,最多 3 個副本),每小時流量高峰會將端點從 1 個副本擴縮到 3 個副本,持續 15 分鐘

每小時費用

instance hourly rate * ((hours * # min replica) + (scale-up hrs * # additional replicas)) = hourly cost
$0.5/hr * ((1hr * 1 replica) + (0.25hr * 2 replicas)) = $0.75/hr

每月費用

instance hourly rate * ((hours * # min replica) + (scale-up hrs * # additional replicas)) = monthly cost
$0.5/hr * ((730hr * 1 replica) + (182.5hr * 2 replicas)) = $547.5/month

advanced-chart

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.