推理提供商文件
音訊分類
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
音訊分類
音訊分類是將標籤或類別分配給給定音訊的任務。
應用示例
- 識別使用者正在發出的命令
- 識別說話人
- 檢測歌曲的流派
有關 `audio-classification` 任務的更多詳細資訊,請檢視其專用頁面!您將找到示例和相關材料。
推薦模型
在此處探索所有可用模型並找到最適合您的模型。
使用 API
目前沒有針對 **audio-classification** 任務的程式碼片段示例,因為尚無提供商支援它。
API 規範
請求
標頭 | ||
---|---|---|
授權 | 字串 | 認證頭格式為`'Bearer: hf_****'`,其中`hf_****`是具有“推理提供商”許可權的個人使用者訪問令牌。您可以從您的設定頁面生成一個。 |
有效負載 | ||
---|---|---|
輸入* | 字串 | 以 base64 編碼字串形式提供的輸入音訊資料。如果未提供 `parameters`,您也可以將音訊資料作為原始位元組負載提供。 |
引數 | 物件 | |
要應用的函式 | 列舉 | 可能的值:sigmoid、softmax、none。 |
top_k | 整數 | 指定時,將輸出限制為最有可能的 K 個類別。 |
響應
正文 | ||
---|---|---|
(陣列) | 物件陣列 | 輸出是一個物件陣列。 |
標籤 | 字串 | 預測的類別標籤。 |
分數 | 數字 | 對應的機率。 |