深度強化學習課程文件
結論
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
結論:
恭喜你完成了這個額外的單元!你已經學會了記錄專家演示並使用 IL 訓練智慧體的過程,這在某些情況下可以替代使用 RL 訓練遊戲內智慧體。
本教程由 Ivan Dodic 編寫。感謝 Edward Beeching 和 Thomas Simonini 的審閱和反饋。
< > 在 GitHub 上更新深度強化學習課程文件
結論
並獲得增強的文件體驗
開始使用
恭喜你完成了這個額外的單元!你已經學會了記錄專家演示並使用 IL 訓練智慧體的過程,這在某些情況下可以替代使用 RL 訓練遊戲內智慧體。
本教程由 Ivan Dodic 編寫。感謝 Edward Beeching 和 Thomas Simonini 的審閱和反饋。
< > 在 GitHub 上更新