Evaluate
加入 Hugging Face 社群
並獲得增強的文件體驗
🤗 Evaluate
一個用於輕鬆評估機器學習模型和資料集的庫。
只需一行程式碼,您就可以訪問數十種適用於不同領域(NLP、計算機視覺、強化學習等)的評估方法。無論是在您的本地機器上還是在分散式訓練環境中,您都可以以一致且可復現的方式評估您的模型!
請訪問 🤗 Evaluate 組織頁面,檢視可用的完整指標列表。每個指標都有一個專屬的 Space,其中包含關於如何使用該指標的互動式演示,以及一個詳細說明指標侷限性和用法的文件卡片。
提示: 對於更近期的評估方法,例如評估大語言模型(LLM),我們推薦使用我們更新更積極、維護更活躍的庫 LightEval。
< > 在 GitHub 上更新
© . This site is unofficial and not affiliated with Hugging Face, Inc.