Optimum 文件
Optimum for Intel® Gaudi® AI 加速器
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
Optimum for Intel® Gaudi® AI 加速器
Optimum for Intel Gaudi AI 加速器是 Hugging Face 庫(Transformers、Diffusers、Accelerate 等)與 Intel Gaudi AI 加速器 (HPU) 之間的介面。它提供了一套工具,使得在單 HPU 和多 HPU 設定上,針對各種下游任務都能輕鬆實現模型載入、訓練和推理,如下表所示。
Intel Gaudi AI 加速器系列目前包括三代產品:Intel Gaudi 1、Intel Gaudi 2 和 Intel Gaudi 3。每臺伺服器都配備 8 個裝置,稱為 Habana 處理單元 (HPU),Gaudi 3 提供 128GB 記憶體,Gaudi 2 提供 96GB,第一代 Gaudi 提供 32GB。有關底層硬體架構的更多詳細資訊,請查閱 Gaudi 架構概述。Optimum for Intel Gaudi 庫與所有三代 Gaudi 加速器完全相容。
有關在 Gaudi 上執行工作負載的深入示例,請瀏覽以下部落格文章
以下模型架構、任務和裝置分佈已透過 Optimum for Intel Gaudi 驗證
下表中,✅ 表示單卡、多卡和 DeepSpeed 均已透過驗證。
- Transformers
| 架構 | 訓練 | 推理 | 任務 |
|---|---|---|---|
| BERT | ✅ | ✅ | |
| RoBERTa | ✅ | ✅ | |
| ALBERT | ✅ | ✅ | |
| DistilBERT | ✅ | ✅ | |
| GPT2 | ✅ | ✅ | |
| BLOOM(Z) | |||
| StarCoder / StarCoder2 | ✅ | ||
| GPT-J | |||
| GPT-Neo | |||
| GPT-NeoX | |||
| OPT | |||
| Llama 2 / CodeLlama / Llama 3 / Llama Guard / Granite | ✅ | ✅ | |
| StableLM | |||
| Falcon | ✅ | ||
| CodeGen | |||
| MPT | |||
| Mistral | |||
| Phi | ✅ | ||
| Mixtral | |||
| Gemma | ✅ | ||
| Gemma2 | ✅ | ||
| Qwen2 / Qwen3 | |||
| Qwen2-MoE | |||
| Persimmon | |||
| XGLM | |||
| Cohere | |||
| T5 / Flan T5 | ✅ | ✅ | |
| BART | |||
| ViT | ✅ | ✅ | |
| Swin | ✅ | ✅ | |
| Wav2Vec2 | ✅ | ✅ | |
| Whisper | ✅ | ✅ | |
| SpeechT5 | |||
| CLIP | ✅ | ✅ | |
| BridgeTower | ✅ | ✅ | |
| ESMFold | |||
| Blip | |||
| OWLViT | |||
| ClipSeg | |||
| Llava / Llava-next / Llava-onevision | |||
| Paligemma | |||
| idefics2 | |||
| SAM | |||
| VideoMAE | |||
| TableTransformer | |||
| DETR | |||
| Mllama | ✅ | ||
| Video-LLaVA | |||
| MiniCPM3 | |||
| Baichuan2 | |||
| DeepSeek-V2 | ✅ | ✅ | |
| DeepSeek-V3 / Moonlight | ✅ | ||
| ChatGLM | |||
| Qwen2-VL | |||
| GLM-4V |
- Diffusers
| 架構 | 訓練 | 推理 | 任務 |
|---|---|---|---|
| Stable Diffusion | ✅ | ✅ | |
| Stable Diffusion XL | ✅ | ✅ | |
| Stable Diffusion Depth2img | |||
| Stable Diffusion 3 | ✅ | ||
| LDM3D | |||
| FLUX.1 | |||
| 文字到影片 | |||
| 影像到影片 | |||
| i2vgen-xl |
- PyTorch 影像模型/TIMM
| 架構 | 訓練 | 推理 | 任務 |
|---|---|---|---|
| FastViT |
- TRL
| 架構 | 訓練 | 推理 | 任務 |
|---|---|---|---|
| Llama 2 | ✅ | ||
| Llama 2 | ✅ | ||
| Stable Diffusion | ✅ |
🤗 Transformers 和 🤗 Diffusers 庫支援的其他模型和任務也可能有效。您可以參考此部分,瞭解如何將其與 🤗 Optimum for Intel Gaudi 結合使用。此外,此頁面解釋瞭如何修改 🤗 Transformers 庫中的任何示例,使其與 🤗 Optimum for Intel Gaudi 相容。
< > 在 GitHub 上更新