推理提供商文件

音訊分類

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

音訊分類

音訊分類是將標籤或類別分配給給定音訊的任務。

應用示例

  • 識別使用者正在發出的命令
  • 識別說話人
  • 檢測歌曲的流派

有關 `audio-classification` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。

推薦模型

在此處探索所有可用模型並找到最適合您的模型。

使用 API

目前沒有針對 **audio-classification** 任務的程式碼片段示例,因為尚無提供商支援它。

API 規範

請求

標頭
授權 字串 認證頭格式為`'Bearer: hf_****'`,其中`hf_****`是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。
有效負載
輸入* 字串 以 base64 編碼字串形式提供的輸入音訊資料。如果未提供 `parameters`,您也可以將音訊資料作為原始位元組負載提供。
引數 物件
        要應用的函式 列舉 可能的值:sigmoid、softmax、none。
        top_k 整數 指定時,將輸出限制為最有可能的 K 個類別。

響應

正文
(陣列) 物件陣列 輸出是一個物件陣列。
        標籤 字串 預測的類別標籤。
        分數 數字 對應的機率。
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.