隆重推出“訓練叢集即服務”——與 NVIDIA 的全新合作

釋出於 2025 年 6 月 11 日
在 GitHub 上更新

今天,在 GTC 巴黎大會上,我們激動地宣佈與 NVIDIA 合作推出“訓練叢集即服務” (Training Cluster as a Service),旨在讓世界各地的研究機構能夠更輕鬆地使用大型 GPU 叢集,從而在各個領域訓練未來的基礎模型。

讓 GPU 叢集觸手可及

許多吉瓦級 (Gigawatt-size) GPU 超級叢集專案正在建設中,用於訓練下一代 AI 模型。這似乎讓“GPU 貧困”和“GPU 富裕”之間的算力差距迅速擴大。但實際上,隨著超大規模雲服務商、區域性雲服務商和 AI 原生雲提供商都在迅速擴大其容量,GPU 資源是存在的。

那麼,我們如何將 AI 計算能力與需要它的研究人員聯絡起來?我們如何讓世界各地的大學、國家研究實驗室和公司能夠構建自己的模型?

這正是 Hugging Face 和 NVIDIA 推出“訓練叢集即服務”所要解決的問題——提供 GPU 叢集的可訪問性,並能靈活地僅為訓練期間的執行時長付費。

首先,Hugging Face 上的 25 萬個組織中,任何一個都可以在需要時,申請所需規模的 GPU 叢集。

工作原理

要開始使用,您可以在 hf.co/training-cluster 代表您的組織申請 GPU 叢集。

“訓練叢集即服務”將 NVIDIA 和 Hugging Face 的關鍵元件整合成一個完整的解決方案。

  • NVIDIA 雲合作伙伴在區域資料中心提供最新的 NVIDIA 加速計算能力,如 NVIDIA Hopper 和 NVIDIA GB200,所有這些都集中在 NVIDIA DGX Cloud 內。
  • NVIDIA DGX Cloud Lepton——今天在 GTC 巴黎大會上宣佈——為研究人員提供了對已配置基礎設施的便捷訪問,並支援訓練任務的排程和監控。
  • Hugging Face 的開發者資源和開源庫使啟動訓練任務變得輕而易舉。

一旦您的 GPU 叢集請求被接受,Hugging Face 和 NVIDIA 將合作根據您的規模、區域和時長要求,為您採購、定價、配置和設定 GPU 叢集。

執行中的叢集

與 TIGEM 共同推進罕見遺傳病研究

Telethon 基因組學與醫學研究所 (簡稱 TIGEM) 是一個致力於理解罕見遺傳病背後分子機制並開發新療法的研究中心。訓練新的 AI 模型是預測致病性變異影響和藥物再利用的新途徑。

AI 為研究罕見遺傳病的病因和開發治療方法提供了新途徑,但我們的領域需要訓練新的模型。‘訓練叢集即服務’讓我們能夠在恰當的時間輕鬆地獲得所需的 GPU 計算能力。

-- Diego di Bernardo, TIGEM 基因組醫學專案協調員

與 Numina 共同推進數學 AI 研究

Numina 是一個非營利組織,致力於為數學推理構建開源、開放資料集的 AI,並獲得了 2024 年 AIMO 進步獎

我們正朝著構建頂級閉源模型 (如 Deepmind 的 AlphaProof) 的開放替代方案的目標穩步前進。計算資源是我們目前的瓶頸——有了‘訓練叢集即服務’,我們將能夠實現我們的目標!

-- Yann Fleureau, Numina 專案聯合創始人

與 Mirror Physics 共同推進材料科學研究

Mirror Physics 是一家為化學和材料科學建立前沿 AI 系統的初創公司。

我們與 MACE 團隊一起,致力於推動化學領域 AI 的極限。藉助‘訓練叢集即服務’,我們正在以前所未有的規模生產高保真化學模型。這將是該領域向前邁出的重要一步。

-- Sam Walton Norwood, Mirror 公司 CEO 兼創始人

為多樣化的 AI 研究提供動力

“訓練叢集即服務”是 Hugging Face 和 NVIDIA 之間的一項新合作,旨在讓全球 AI 研究社群更容易獲得 AI 計算資源。

大規模、高效能的計算資源是構建跨領域、跨語言的下一代 AI 模型的關鍵。‘訓練叢集即服務’將為研究人員和公司消除障礙,釋放他們訓練最先進模型的能力,並推動 AI 領域的可能性邊界。

-- Clément Delangue, Hugging Face 聯合創始人兼 CEO

將 DGX Cloud Lepton 與 Hugging Face 的‘訓練叢集即服務’相結合,為開發者和研究人員提供了一種無縫的方式,可以跨越廣泛的雲提供商網路訪問高效能的 NVIDIA GPU。這種合作使 AI 研究人員和組織能夠更輕鬆地擴充套件其 AI 訓練工作負載,同時使用 Hugging Face 上熟悉的工具。

-- Alexis Bjorlin, NVIDIA DGX Cloud 副總裁

與 NVIDIA 共同賦能 AI 構建者

我們很高興能與 NVIDIA 合作,向 Hugging Face 組織提供“訓練叢集即服務”——您現在就可以在 hf.co/training-cluster 開始使用。

今天在 GTC 巴黎大會上,NVIDIA 宣佈了許多針對 Hugging Face 使用者的新貢獻,從智慧體到機器人!

社群

註冊登入 以發表評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.