推出 Snowball Fight ☃️,我們的第一個 ML-Agents 環境
釋出於 2021 年 12 月 2 日
在 GitHub 上更新我們很高興分享我們的第一個自定義深度強化學習環境:Snowball Fight 1對1 🎉。

Snowball Fight 是一個使用 Unity ML-Agents 製作的遊戲,你可以在其中向深度強化學習代理發射雪球。該遊戲託管在 Hugging Face Spaces 上。
在這篇文章中,我們將介紹我們正在為使用 Unity ML-Agents 的深度強化學習研究人員和愛好者構建的生態系統。
Hugging Face 上的 Unity ML-Agents
Unity 機器學習代理工具包是一個開源庫,它允許你使用 Unity 遊戲引擎構建遊戲和模擬,以作為訓練智慧代理的環境。
透過這第一步,我們的目標是在 Hugging Face 上為使用 ML-Agents 的深度強化學習研究人員和愛好者建立一個生態系統,它具有三個特點。
- 構建和共享自定義環境。 我們正在開發和共享令人興奮的環境,以嘗試新問題:雪球大戰、賽車、謎題……所有這些都將是開源的,並託管在 Hugging Face 的 Hub 上。
- 允許你輕鬆託管你的環境、儲存模型並在 Hugging Face Hub 上共享它們。我們已經在此處釋出了 Snowball Fight 訓練環境,但未來會有更多!
- 你現在可以輕鬆地在 Spaces 上託管你的演示並快速向生態系統的其餘部分展示你的成果。
加入我們:加入我們的 Discord 伺服器!
如果你正在使用 ML-Agents 或對深度強化學習感興趣並希望參與討論,你可以加入我們的 Discord 伺服器。我們剛剛添加了兩個頻道(未來還會新增更多)
- 深度強化學習
- ML-Agents
我們的 Discord 是你可以交流 Hugging Face、NLP、深度強化學習等內容的地方!我們也會在這個 Discord 上宣佈所有新的環境和功能。
接下來呢?
在接下來的幾周和幾個月裡,我們將透過以下方式擴充套件生態系統:
- 撰寫一些關於 ML-Agents 的技術教程。
- 開發Snowball Fight 2 對 2 版本,其中代理將使用MA-POCA(一種新的深度強化學習演算法)在團隊中進行協作,該演算法可以訓練團隊中的協作行為。
- 我們正在構建將在 Hugging Face 中託管的新自定義環境。
結論
我們很高興看到你正在使用 ML-Agents 進行的工作,以及我們如何構建能夠幫助你提升工作效率的功能和工具。
別忘了加入我們的 Discord 伺服器,以獲取新功能的提醒。