深度強化學習課程文件

深度強化學習簡介

深度強化學習課程

第 0 單元：課程歡迎辭

單元1. 深度強化學習導論

簡介什麼是強化學習？強化學習框架任務型別探索/利用的權衡解決強化學習問題的兩種主要方法深度強化學習中的“深度” 總結詞彙表實操測驗結論延伸閱讀

獎勵單元1. Huggy深度強化學習導論

直播1. 課程如何運作，問答環節，以及與Huggy玩耍

單元2. Q-Learning導論

單元3. 雅達利遊戲深度Q-Learning

獎勵單元2. 使用Optuna進行自動超引數調優

單元4. PyTorch策略梯度

單元5. Unity ML-Agents導論

單元6. 機器人環境Actor-Critic方法

單元7. 多智慧體和AI對AI導論

單元8. 第1部分近端策略最佳化 (PPO)

單元8. 第2部分使用Doom的近端策略最佳化 (PPO)

獎勵單元3. 強化學習高階主題

獎勵單元5. 使用Godot RL Agents進行模仿學習

結業證書和祝賀

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

深度強化學習簡介

Unit 1 thumbnail

歡迎來到人工智慧中最引人入勝的主題：深度強化學習。

深度強化學習是一種機器學習型別，其中智慧體透過執行動作並觀察結果來學習如何在環境中行動。

在本單元中，您將學習深度強化學習的基礎知識。

然後，您將使用深度強化學習庫Stable-Baselines3來訓練您的深度強化學習智慧體（一個月球著陸器）在月球上正確著陸。

LunarLander

最後，您將把這個訓練好的智慧體上傳到Hugging Face Hub 🤗，這是一個免費、開放的平臺，人們可以在其中共享機器學習模型、資料集和演示。

在深入實施深度強化學習智慧體之前，掌握這些要素至關重要。本章的目標是為您打下堅實的基礎。

本單元之後，在一個獎勵單元中，您將能夠訓練狗狗 Huggy 🐶 去撿棍子並和它玩耍 🤗。

那麼，我們開始吧！🚀

< > 在 GitHub 上更新

←Discord 101 什麼是強化學習？→

© . This site is unofficial and not affiliated with Hugging Face, Inc.