AWS Trainium & Inferentia 文件

Optimum Neuron 容器

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

Optimum Neuron 容器

我們為 Amazon SageMaker 提供了預構建的 Optimum Neuron 容器。這些容器預裝了所有的 Hugging Face 庫和依賴項,因此您可以立即開始使用。我們提供用於訓練和推理的容器,以及帶有 TGI 的最佳化文字生成容器。下表是最新版本,僅包含每個容器的最新版本。您可以在 深度學習容器釋出說明 中找到舊版本。

我們建議使用 sagemaker Python SDK 來檢索您想要使用的容器的映象 URI。以下程式碼片段用於檢索最新的文字生成推理容器映象 URI:

from sagemaker.huggingface import get_huggingface_llm_image_uri
 
# retrieve the llm image uri
llm_image = get_huggingface_llm_image_uri(
  "huggingface-neuronx"
)

print(f"llm image uri: {llm_image}")

可用的 Optimum Neuron 容器

型別 Optimum 版本 映象 URI
訓練 0.0.25 763104351884.dkr.ecr.us-west-2.amazonaws.com/huggingface-pytorch-training-neuronx:2.1.2-transformers4.48.1-neuronx-py310-sdk2.20.0-ubuntu20.04
推理 0.0.25 763104351884.dkr.ecr.us-west-2.amazonaws.com/huggingface-pytorch-inference-neuronx:2.1.2-transformers4.43.2-neuronx-py310-sdk2.20.0-ubuntu20.04
文字生成推理 0.2.0 763104351884.dkr.ecr.us-west-2.amazonaws.com/huggingface-pytorch-tgi-inference:2.5.1-optimum3.3.4-neuronx-py310-ubuntu22.04

請將 763104351884 替換為正確的 AWS 賬戶 ID,並將 region 替換為您正在使用的 AWS 區域。

© . This site is unofficial and not affiliated with Hugging Face, Inc.