AWS Trainium & Inferentia 文件

支援的架構

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

支援的架構

訓練

在 AWS Trainium 例項(Trn1)上進行訓練可實現採用分散式並行策略的大規模模型訓練。

要求

  • 模型必須與 Neuron SDK 相容。如果模型足夠小,可以容納在 16GB 記憶體內,那麼任何能夠成功編譯的架構都支援訓練。
  • 記憶體限制: 每個加速器有 16GB 記憶體用於存放模型權重、梯度、最佳化器狀態和啟用值。
  • 對於大型模型: 需要支援張量並行和/或流水線並行的自定義模型實現。

以下架構具有支援分散式訓練的自定義模型實現

架構 任務 張量並行 流水線並行
Llama、Llama 2、Llama 3 文字生成
Qwen3 文字生成
Granite 文字生成

如果您需要為上面未列出的自定義模型新增支援,請查閱我們的訓練貢獻指南,瞭解如何實現支援分散式訓練的自定義模型。您也可以在 Optimum Neuron GitHub 倉庫中提出 issue 來請求支援。

推理

下表列出了 Optimum Neuron 在 Amazon EC2 Inf2 例項上支援的推理架構和任務。

如果列出了一個 LLM,例如一個具有 `text-generation` 任務的模型,這意味著它也支援 TGI

Transformers

架構 任務
ALBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
AST 特徵提取、音訊分類
BERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Beit 特徵提取、影像分類
CamemBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
CLIP 特徵提取、影像分類
ConvBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
ConvNext 特徵提取、影像分類
ConvNextV2 特徵提取、影像分類
CvT 特徵提取、影像分類
DeBERTa (僅限 INF2) 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
DeBERTa-v2 (僅限 INF2) 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Deit 特徵提取、影像分類
DistilBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
DonutSwin 特徵提取
Dpt 特徵提取
ELECTRA 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
ESM 特徵提取、掩碼填充、文字分類、詞元分類
FlauBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Granite 文字生成
Hubert 特徵提取、自動語音識別、音訊分類
Levit 特徵提取、影像分類
Llama、Llama 2、Llama 3 文字生成
Mixtral 文字生成
MobileBERT 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
MobileNetV2 特徵提取、影像分類、語義分割
MobileViT 特徵提取、影像分類、語義分割
ModernBERT 特徵提取、掩碼填充、文字分類、詞元分類
MPNet 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Phi3 文字生成
Phi 特徵提取、文字分類、詞元分類
Qwen2、Qwen 3 文字生成
RoBERTa 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
RoFormer 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Swin 特徵提取、影像分類
T5 文字到文字生成
UniSpeech 特徵提取、自動語音識別、音訊分類
UniSpeech-SAT 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector
ViT 特徵提取、影像分類
Wav2Vec2 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector
WavLM 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector
Whisper 自動語音識別
XLM 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
XLM-RoBERTa 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類
Yolos 特徵提取、目標檢測

Diffusers

架構 任務
Stable Diffusion 文字到影像、影像到影像、修復
Stable Diffusion XL Base 文字到影像、影像到影像、修復
Stable Diffusion XL Refiner 影像到影像、修復
SDXL Turbo 文字到影像、影像到影像、修復
LCM 文字到影像
PixArt-α 文字到影像
PixArt-Σ 文字到影像
Flux 文字到影像

Sentence Transformers

架構 任務
Transformer 特徵提取、句子相似度
CLIP 特徵提取、零樣本影像分類

要了解如何匯出用於推理的模型,您可以檢視此指南

© . This site is unofficial and not affiliated with Hugging Face, Inc.