深度強化學習課程文件
深度強化學習簡介
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
深度強化學習簡介
歡迎來到人工智慧中最引人入勝的主題:深度強化學習。
深度強化學習是一種機器學習型別,其中智慧體透過執行動作並觀察結果來學習如何在環境中行動。
在本單元中,您將學習深度強化學習的基礎知識。
然後,您將使用深度強化學習庫Stable-Baselines3來訓練您的深度強化學習智慧體(一個月球著陸器)在月球上正確著陸。
最後,您將把這個訓練好的智慧體上傳到Hugging Face Hub 🤗,這是一個免費、開放的平臺,人們可以在其中共享機器學習模型、資料集和演示。
在深入實施深度強化學習智慧體之前,掌握這些要素至關重要。本章的目標是為您打下堅實的基礎。
本單元之後,在一個獎勵單元中,您將能夠訓練狗狗 Huggy 🐶 去撿棍子並和它玩耍 🤗。
那麼,我們開始吧!🚀
< > 在 GitHub 上更新