SetFit 文件
多標籤文字分類
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
多標籤文字分類
SetFit 支援多標籤分類,允許為每個例項分配多個標籤。
除非每個例項都必須分配多個輸出,否則您通常不需要指定多目標策略。
本指南將向您展示如何訓練和使用多標籤 SetFit 模型。
多標籤策略
SetFit 將從 sklearn
初始化一個多標籤分類頭 - multi_target_strategy
可用以下選項
"one-vs-rest"
: 使用OneVsRestClassifier
頭。"multi-output"
: 使用MultiOutputClassifier
頭。"classifier-chain"
: 使用ClassifierChain
頭。
有關更多詳細資訊,請參閱 scikit-learn 的多類別和多輸出分類文件。
使用多標籤策略初始化 SetFit 模型
使用預設的 LogisticRegression 頭,我們可以這樣應用多目標策略
from setfit import SetFitModel
model = SetFitModel.from_pretrained(
model_id, # e.g. "BAAI/bge-small-en-v1.5"
multi_target_strategy="multi-output",
)
使用可微分的頭,它看起來像這樣
from setfit import SetFitModel
model = SetFitModel.from_pretrained(
model_id, # e.g. "BAAI/bge-small-en-v1.5"
multi_target_strategy="one-vs-rest"
use_differentiable_head=True,
head_params={"out_features": num_classes},
)