Token 分類 - Hugging Face 文件

詞元分類

詞元分類是一項任務，它將標籤分配給文字中的某些詞元。一些流行的詞元分類子任務是命名實體識別 (NER) 和詞性標註 (PoS)。

有關 `token-classification` 任務的更多詳細資訊，請檢視其專用頁面！您將找到示例和相關材料。

使用 API

語言

客戶端

提供商

設定

import os
from huggingface_hub import InferenceClient

client = InferenceClient(
    provider="hf-inference",
    api_key=os.environ["HF_TOKEN"],
)

result = client.token_classification(
    "My name is Sarah Jessica Parker but you can call me Jessica",
    model="dslim/bert-base-NER",
)

API 規範

請求

標頭
授權	字串	認證頭採用 `Bearer: hf_**` 形式，其中 `hf_**` 是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。

有效負載
輸入*	字串	輸入文字資料
引數	物件
ignore_labels	字串陣列	要忽略的標籤列表
stride	整數	分割輸入文字時，塊之間重疊詞元的數量。
aggregation_strategy	字串	以下之一
(#1)	“無”	不聚合詞元
(#2)	“簡單”	將具有相同標籤的連續詞元分組為單個實體。
(#3)	“第一個”	類似於“簡單”，也保留單詞完整性（使用單詞中第一個詞元預測的標籤）。
(#4)	“平均”	類似於“簡單”，也保留單詞完整性（使用得分最高的標籤，在單詞詞元中取平均）。
(#5)	“最大”	類似於“簡單”，也保留單詞完整性（使用單詞詞元中得分最高的標籤）。

響應

正文
（陣列）	物件陣列	輸出是一個物件陣列。
entity_group	字串	一組或多個詞元的預測標籤
entity	字串	單個詞元的預測標籤
score	數字	相關得分/機率
word	字串	對應的文字
start	整數	此組在輸入中的起始字元位置。
end	整數	此組在輸入中的結束字元位置。

< > 在 GitHub 上更新

推理服務提供商

詞元分類

推薦模型

使用 API

API 規範

請求

響應