Hub 文件

在 Hugging Face 使用 RL-Baselines3-Zoo

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

在 Hugging Face 使用 RL-Baselines3-Zoo

rl-baselines3-zoo 是一個使用 Stable Baselines3 進行強化學習的訓練框架。

探索 Hub 中的 RL-Baselines3-Zoo

您可以透過在模型頁面左側過濾來查詢 RL-Baselines3-Zoo 模型。

Stable-Baselines3 團隊託管了超過 150 個經過訓練的強化學習代理,並帶有已調整的超引數,您可以在此處找到它們。

Hub 上的所有模型都附帶了有用的功能

  1. 一個自動生成的模型卡片,包含描述、訓練配置等資訊。
  2. 有助於發現的元資料標籤。
  3. 與其他模型進行比較的評估結果。
  4. 一個影片小部件,您可以在其中觀看您的智慧體執行任務。

使用現有模型

您可以使用 load_from_hub 從 Hub 中簡單下載一個模型

# Download ppo SpaceInvadersNoFrameskip-v4 model and save it into the logs/ folder
python -m rl_zoo3.load_from_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f logs/ -orga sb3
python enjoy.py --algo dqn --env SpaceInvadersNoFrameskip-v4  -f logs/

您可以定義三個引數

  • --repo-name:倉庫的名稱。
  • -orga:Hugging Face 使用者名稱或組織。
  • -f:目標資料夾。

共享您的模型

您可以使用 push_to_hub 輕鬆上傳您的模型。這將儲存模型,評估模型,生成模型卡,並記錄您的代理的重放影片,然後將完整的倉庫推送到 Hub。

python -m rl_zoo3.push_to_hub  --algo dqn  --env SpaceInvadersNoFrameskip-v4  --repo-name dqn-SpaceInvadersNoFrameskip-v4  -orga ThomasSimonini  -f logs/

您可以定義三個引數

  • --repo-name:倉庫的名稱。
  • -orga:您的 Hugging Face 使用者名稱。
  • -f:模型儲存的資料夾。

額外資源

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.