Hub 文件
在 Hugging Face 使用 RL-Baselines3-Zoo
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
在 Hugging Face 使用 RL-Baselines3-Zoo
rl-baselines3-zoo
是一個使用 Stable Baselines3 進行強化學習的訓練框架。
探索 Hub 中的 RL-Baselines3-Zoo
您可以透過在模型頁面左側過濾來查詢 RL-Baselines3-Zoo 模型。
Stable-Baselines3 團隊託管了超過 150 個經過訓練的強化學習代理,並帶有已調整的超引數,您可以在此處找到它們。
Hub 上的所有模型都附帶了有用的功能
- 一個自動生成的模型卡片,包含描述、訓練配置等資訊。
- 有助於發現的元資料標籤。
- 與其他模型進行比較的評估結果。
- 一個影片小部件,您可以在其中觀看您的智慧體執行任務。
使用現有模型
您可以使用 load_from_hub
從 Hub 中簡單下載一個模型
# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/
您可以定義三個引數
--repo-name
:倉庫的名稱。-orga
:Hugging Face 使用者名稱或組織。-f
:目標資料夾。
共享您的模型
您可以使用 push_to_hub
輕鬆上傳您的模型。這將儲存模型,評估模型,生成模型卡,並記錄您的代理的重放影片,然後將完整的倉庫推送到 Hub。
python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 --repo-name dqn-SpaceInvadersNoFrameskip-v4 -orga ThomasSimonini -f logs/
您可以定義三個引數
--repo-name
:倉庫的名稱。-orga
:您的 Hugging Face 使用者名稱。-f
:模型儲存的資料夾。