排行榜文件

排行榜和評估

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

排行榜和評估

Hub 包含機器學習模型(包括 LLM、聊天機器人等)的排行榜和評估。有三種類型的排行榜:

  • 評估結果 來自官方基準資料集,如 GPQA、MMLU-Pro 或學術論文中使用的其他資料集。當結果在模型儲存庫中釋出時,分數將顯示在模型頁面上。
  • 社群管理排行榜 託管在 Spaces 上,由社群針對特定用例進行管理。
  • Open LLM Leaderboard 是 Hugging Face 團隊策劃的一個專案,用於評估和排名開源 LLM 和聊天機器人,並提供可復現的分數,區分營銷宣傳和該領域的實際進展。

Eval Results

在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.