Hub 文件
在 Hugging Face 中使用 SetFit
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
在 Hugging Face 中使用 SetFit
SetFit 是一個高效且無需提示詞(prompt-free)的框架,用於對 Sentence Transformers 進行少樣本微調。它只需少量標註資料即可實現高精度——例如,在客戶評論情感資料集上,每個類別僅使用 8 個標註樣本,SetFit 的效能就可與在 3000 個樣本的完整訓練集上微調的 RoBERTa Large 相媲美 🤯!
與其他少量樣本學習方法相比,SetFit 具有幾個獨特的特性
- 🗣 無需提示詞或轉換器(verbalizers): 當前的少樣本微調技術需要手工製作提示詞或轉換器,將樣本轉換為適合底層語言模型的格式。SetFit 完全摒棄了提示詞,透過直接從文字樣本中生成豐富的嵌入向量來實現。
- 🏎 訓練速度快: SetFit 無需像 T0 或 GPT-3 這樣的大規模模型也能實現高精度。因此,其訓練和推理速度通常快一個數量級(或更多)。
- 🌎 多語言支援:SetFit 可以與 Hub 上的任何 Sentence Transformer 模型一起使用,這意味著你只需微調一個多語言檢查點,就可以對多種語言的文字進行分類。
在 Hub 上探索 SetFit
你可以在模型頁面左側進行篩選,找到 SetFit 模型。
Hub 上的所有模型都具有以下實用功能:
- 自動生成的模型卡片,包含簡要描述。
- 一個互動式小部件,您可以在瀏覽器中直接使用模型進行操作。
- 一個推理 API,允許您發出推理請求。
安裝
首先,你可以按照 SetFit 安裝指南進行操作。你也可以透過 pip 使用以下單行命令安裝:
pip install -U setfit
使用現有模型
所有 setfit
模型都可以輕鬆地從 Hub 載入。
from setfit import SetFitModel
model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")
載入後,你可以使用 SetFitModel.predict
進行推理。
model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")
['positive', 'negative']
如果你想載入一個特定的 SetFit 模型,可以點選“在 SetFit 中使用(Use in SetFit)”,系統會提供一個可用的程式碼片段!
其他資源
- Hub 上所有可用的 SetFit 模型
- SetFit 倉庫
- SetFit 文件
- SetFit 論文