深度強化學習課程文件
強化學習中的“深度”
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
強化學習中的“深度”
到目前為止我們談論的是強化學習。但“深度”又體現在哪裡呢?
深度強化學習引入了深度神經網路來解決強化學習問題——因此得名“深度”。
例如,在下一個單元中,我們將學習兩種基於價值的演算法:Q-學習(經典強化學習)和深度Q-學習。
你會發現不同之處在於,第一種方法中,我們使用傳統演算法來建立一個Q表格,幫助我們找到每個狀態下應採取的行動。
在第二種方法中,我們將使用神經網路(來近似Q值)。
如果你不熟悉深度學習,你絕對應該觀看FastAI面向程式設計師的實用深度學習課程(免費)。
< > 在 GitHub 上更新