LLM 課程文件
Argilla 簡介
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
Argilla 簡介
在第 5 章中,你學習瞭如何使用 🤗 Datasets 庫構建資料集,在第 6 章中,你探索瞭如何針對一些常見 NLP 任務微調模型。在本章中,你將學習如何使用 Argilla 來標註和整理資料集,以便用於訓練和評估你的模型。
訓練效能良好的模型的關鍵是擁有高質量的資料。儘管 Hub 中有一些不錯的資料集可以用於訓練和評估你的模型,但這些資料集可能與你的特定應用或用例不相關。在這種情況下,你可能需要構建和整理自己的資料集。Argilla 將幫助你高效地完成這項工作。

透過 Argilla,你可以:
- 將非結構化資料轉化為用於 NLP 任務的結構化資料。
- 整理資料集,從低質量資料集轉變為高質量資料集。
- 收集 LLM 和多模態模型的人工反饋。
- 邀請專家與你協作進行 Argilla 標註,或眾包標註!
以下是你在本章中將學到的一些內容:
- 如何設定自己的 Argilla 例項。
- 如何載入資料集並根據一些流行的 NLP 任務進行配置。
- 如何使用 Argilla UI 標註你的資料集。
- 如何使用你整理的資料集並將其匯出到 Hub。