SetFit 文件

多標籤文字分類

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

多標籤文字分類

SetFit 支援多標籤分類,允許為每個例項分配多個標籤。

除非每個例項都必須分配多個輸出,否則您通常不需要指定多目標策略。

本指南將向您展示如何訓練和使用多標籤 SetFit 模型。

多標籤策略

SetFit 將從 sklearn 初始化一個多標籤分類頭 - multi_target_strategy 可用以下選項

有關更多詳細資訊,請參閱 scikit-learn 的多類別和多輸出分類文件

使用多標籤策略初始化 SetFit 模型

使用預設的 LogisticRegression 頭,我們可以這樣應用多目標策略

from setfit import SetFitModel

model = SetFitModel.from_pretrained(
    model_id, # e.g. "BAAI/bge-small-en-v1.5"
    multi_target_strategy="multi-output",
)

使用可微分的頭,它看起來像這樣

from setfit import SetFitModel

model = SetFitModel.from_pretrained(
    model_id, # e.g. "BAAI/bge-small-en-v1.5"
    multi_target_strategy="one-vs-rest"
    use_differentiable_head=True,
    head_params={"out_features": num_classes},
)
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.