SetFit 文件
SetFit
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
SetFit
🤗 SetFit 是一個高效且無需提示的框架,用於對 Sentence Transformers 進行少樣本微調。它只需少量標註資料即可實現高精度——例如,在客戶評論情感資料集上,每個類別僅用 8 個標註樣本,🤗 SetFit 的表現就與在包含 3k 樣本的完整訓練集上微調 RoBERTa Large 不相上下!
與其他少量樣本學習方法相比,SetFit 具有幾個獨特的特性
- 🗣 無需提示或口語化: 當前的少樣本微調技術需要手工製作提示或口語化器,將樣本轉換為適合底層語言模型的格式。SetFit 完全摒棄了提示,直接從文字樣本生成豐富的嵌入。
- 🏎 訓練速度快: SetFit 無需像 T0、Llama 或 GPT-4 這樣的大型模型即可實現高精度。因此,它的訓練和推理速度通常快一個數量級(或更多)。
- 🌎 多語言支援:SetFit 可以與 Hub 上的任何 Sentence Transformer 一起使用,這意味著您只需微調一個多語言檢查點即可對多種語言的文字進行分類。
< > 在 GitHub 上更新