深度強化學習課程文件

強化學習中的“深度”

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

強化學習中的“深度”

到目前為止我們談論的是強化學習。但“深度”又體現在哪裡呢?

深度強化學習引入了深度神經網路來解決強化學習問題——因此得名“深度”。

例如,在下一個單元中,我們將學習兩種基於價值的演算法:Q-學習(經典強化學習)和深度Q-學習。

你會發現不同之處在於,第一種方法中,我們使用傳統演算法來建立一個Q表格,幫助我們找到每個狀態下應採取的行動。

在第二種方法中,我們將使用神經網路(來近似Q值)。

Value based RL
圖示靈感來源於Udacity的Q學習筆記本

如果你不熟悉深度學習,你絕對應該觀看FastAI面向程式設計師的實用深度學習課程(免費)。

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.