推理提供商文件
Token 分類
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
詞元分類
詞元分類是一項任務,它將標籤分配給文字中的某些詞元。一些流行的詞元分類子任務是命名實體識別 (NER) 和詞性標註 (PoS)。
有關 `token-classification` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。
推薦模型
- dslim/bert-base-NER:一個性能強大的模型,用於識別人物、地點、組織和各種實體名稱。
- FacebookAI/xlm-roberta-large-finetuned-conll03-english:一個強大的模型,用於識別多種語言中的人物、地點、組織和名稱。
- blaze999/Medical-NER:一個專門用於醫學實體識別的詞元分類模型。
在此處探索所有可用模型,找到最適合您的模型。
使用 API
語言
客戶端
提供商
import os
from huggingface_hub import InferenceClient
client = InferenceClient(
provider="hf-inference",
api_key=os.environ["HF_TOKEN"],
)
result = client.token_classification(
"My name is Sarah Jessica Parker but you can call me Jessica",
model="dslim/bert-base-NER",
)
API 規範
請求
標頭 | ||
---|---|---|
授權 | 字串 | 認證頭採用 `Bearer: hf_****` 形式,其中 `hf_****` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。 |
有效負載 | ||
---|---|---|
輸入* | 字串 | 輸入文字資料 |
引數 | 物件 | |
ignore_labels | 字串陣列 | 要忽略的標籤列表 |
stride | 整數 | 分割輸入文字時,塊之間重疊詞元的數量。 |
aggregation_strategy | 字串 | 以下之一 |
(#1) | “無” | 不聚合詞元 |
(#2) | “簡單” | 將具有相同標籤的連續詞元分組為單個實體。 |
(#3) | “第一個” | 類似於“簡單”,也保留單詞完整性(使用單詞中第一個詞元預測的標籤)。 |
(#4) | “平均” | 類似於“簡單”,也保留單詞完整性(使用得分最高的標籤,在單詞詞元中取平均)。 |
(#5) | “最大” | 類似於“簡單”,也保留單詞完整性(使用單詞詞元中得分最高的標籤)。 |
響應
正文 | ||
---|---|---|
(陣列) | 物件陣列 | 輸出是一個物件陣列。 |
entity_group | 字串 | 一組或多個詞元的預測標籤 |
entity | 字串 | 單個詞元的預測標籤 |
score | 數字 | 相關得分/機率 |
word | 字串 | 對應的文字 |
start | 整數 | 此組在輸入中的起始字元位置。 |
end | 整數 | 此組在輸入中的結束字元位置。 |