Hub 文件

在 Hugging Face 中使用 SetFit

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

在 Hugging Face 中使用 SetFit

SetFit 是一個高效且無需提示詞(prompt-free)的框架,用於對 Sentence Transformers 進行少樣本微調。它只需少量標註資料即可實現高精度——例如,在客戶評論情感資料集上,每個類別僅使用 8 個標註樣本,SetFit 的效能就可與在 3000 個樣本的完整訓練集上微調的 RoBERTa Large 相媲美 🤯!

與其他少量樣本學習方法相比,SetFit 具有幾個獨特的特性

  • 🗣 無需提示詞或轉換器(verbalizers): 當前的少樣本微調技術需要手工製作提示詞或轉換器,將樣本轉換為適合底層語言模型的格式。SetFit 完全摒棄了提示詞,透過直接從文字樣本中生成豐富的嵌入向量來實現。
  • 🏎 訓練速度快: SetFit 無需像 T0 或 GPT-3 這樣的大規模模型也能實現高精度。因此,其訓練和推理速度通常快一個數量級(或更多)。
  • 🌎 多語言支援:SetFit 可以與 Hub 上的任何 Sentence Transformer 模型一起使用,這意味著你只需微調一個多語言檢查點,就可以對多種語言的文字進行分類。

在 Hub 上探索 SetFit

你可以在模型頁面左側進行篩選,找到 SetFit 模型。

Hub 上的所有模型都具有以下實用功能:

  1. 自動生成的模型卡片,包含簡要描述。
  2. 一個互動式小部件,您可以在瀏覽器中直接使用模型進行操作。
  3. 一個推理 API,允許您發出推理請求。

安裝

首先,你可以按照 SetFit 安裝指南進行操作。你也可以透過 pip 使用以下單行命令安裝:

pip install -U setfit

使用現有模型

所有 setfit 模型都可以輕鬆地從 Hub 載入。

from setfit import SetFitModel

model = SetFitModel.from_pretrained("tomaarsen/setfit-paraphrase-mpnet-base-v2-sst2-8-shot")

載入後,你可以使用 SetFitModel.predict 進行推理。

model.predict("Amelia Earhart flew her single engine Lockheed Vega 5B across the Atlantic to Paris.")
['positive', 'negative']

如果你想載入一個特定的 SetFit 模型,可以點選“在 SetFit 中使用(Use in SetFit)”,系統會提供一個可用的程式碼片段!

其他資源

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.