AWS Trainium & Inferentia 文件
支援的架構
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
支援的架構
訓練
在 AWS Trainium 例項(Trn1)上進行訓練可實現採用分散式並行策略的大規模模型訓練。
要求
- 模型必須與 Neuron SDK 相容。如果模型足夠小,可以容納在 16GB 記憶體內,那麼任何能夠成功編譯的架構都支援訓練。
- 記憶體限制: 每個加速器有 16GB 記憶體用於存放模型權重、梯度、最佳化器狀態和啟用值。
- 對於大型模型: 需要支援張量並行和/或流水線並行的自定義模型實現。
以下架構具有支援分散式訓練的自定義模型實現
| 架構 | 任務 | 張量並行 | 流水線並行 |
|---|---|---|---|
| Llama、Llama 2、Llama 3 | 文字生成 | ✓ | ✓ |
| Qwen3 | 文字生成 | ✓ | ✓ |
| Granite | 文字生成 | ✓ | ✗ |
如果您需要為上面未列出的自定義模型新增支援,請查閱我們的訓練貢獻指南,瞭解如何實現支援分散式訓練的自定義模型。您也可以在 Optimum Neuron GitHub 倉庫中提出 issue 來請求支援。
推理
下表列出了 Optimum Neuron 在 Amazon EC2 Inf2 例項上支援的推理架構和任務。
如果列出了一個 LLM,例如一個具有 `text-generation` 任務的模型,這意味著它也支援 TGI。
Transformers
| 架構 | 任務 |
|---|---|
| ALBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| AST | 特徵提取、音訊分類 |
| BERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Beit | 特徵提取、影像分類 |
| CamemBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| CLIP | 特徵提取、影像分類 |
| ConvBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| ConvNext | 特徵提取、影像分類 |
| ConvNextV2 | 特徵提取、影像分類 |
| CvT | 特徵提取、影像分類 |
| DeBERTa (僅限 INF2) | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| DeBERTa-v2 (僅限 INF2) | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Deit | 特徵提取、影像分類 |
| DistilBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| DonutSwin | 特徵提取 |
| Dpt | 特徵提取 |
| ELECTRA | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| ESM | 特徵提取、掩碼填充、文字分類、詞元分類 |
| FlauBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Granite | 文字生成 |
| Hubert | 特徵提取、自動語音識別、音訊分類 |
| Levit | 特徵提取、影像分類 |
| Llama、Llama 2、Llama 3 | 文字生成 |
| Mixtral | 文字生成 |
| MobileBERT | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| MobileNetV2 | 特徵提取、影像分類、語義分割 |
| MobileViT | 特徵提取、影像分類、語義分割 |
| ModernBERT | 特徵提取、掩碼填充、文字分類、詞元分類 |
| MPNet | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Phi3 | 文字生成 |
| Phi | 特徵提取、文字分類、詞元分類 |
| Qwen2、Qwen 3 | 文字生成 |
| RoBERTa | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| RoFormer | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Swin | 特徵提取、影像分類 |
| T5 | 文字到文字生成 |
| UniSpeech | 特徵提取、自動語音識別、音訊分類 |
| UniSpeech-SAT | 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector |
| ViT | 特徵提取、影像分類 |
| Wav2Vec2 | 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector |
| WavLM | 特徵提取、自動語音識別、音訊分類、音訊幀分類、音訊 x-vector |
| Whisper | 自動語音識別 |
| XLM | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| XLM-RoBERTa | 特徵提取、掩碼填充、多項選擇、問答、文字分類、詞元分類 |
| Yolos | 特徵提取、目標檢測 |
Diffusers
| 架構 | 任務 |
|---|---|
| Stable Diffusion | 文字到影像、影像到影像、修復 |
| Stable Diffusion XL Base | 文字到影像、影像到影像、修復 |
| Stable Diffusion XL Refiner | 影像到影像、修復 |
| SDXL Turbo | 文字到影像、影像到影像、修復 |
| LCM | 文字到影像 |
| PixArt-α | 文字到影像 |
| PixArt-Σ | 文字到影像 |
| Flux | 文字到影像 |
Sentence Transformers
| 架構 | 任務 |
|---|---|
| Transformer | 特徵提取、句子相似度 |
| CLIP | 特徵提取、零樣本影像分類 |
要了解如何匯出用於推理的模型,您可以檢視此指南。