排行榜
加入 Hugging Face 社群
並獲得增強的文件體驗
排行榜和評估
Hub 包含機器學習模型(包括 LLM、聊天機器人等)的排行榜和評估。有三種類型的排行榜:
- 評估結果 來自官方基準資料集,如 GPQA、MMLU-Pro 或學術論文中使用的其他資料集。當結果在模型儲存庫中釋出時,分數將顯示在模型頁面上。
- 社群管理排行榜 託管在 Spaces 上,由社群針對特定用例進行管理。
- Open LLM Leaderboard 是 Hugging Face 團隊策劃的一個專案,用於評估和排名開源 LLM 和聊天機器人,並提供可復現的分數,區分營銷宣傳和該領域的實際進展。

在 GitHub 上更新
© . This site is unofficial and not affiliated with Hugging Face, Inc.