音訊課程文件

第 4 單元. 構建一個音樂流派分類器

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

單元 4. 構建音樂流派分類器

您將學習和構建什麼

音訊分類是音訊和語音處理中 Transformer 最常見的應用之一。與機器學習中的其他分類任務一樣,此任務涉及根據音訊錄製的內容為其分配一個或多個標籤。例如,在語音的情況下,我們可能需要檢測何時說出“嘿 Siri”之類的喚醒詞,或者從“今天天氣如何?”之類的口頭查詢中推斷出“溫度”之類的關鍵詞。環境聲音提供了另一個例子,我們可能需要自動區分“汽車喇叭”、“警報器”、“狗叫”等聲音。

在本節中,我們將瞭解如何將預訓練的音訊 Transformer 應用於各種音訊分類任務。然後,我們將針對音樂分類任務微調 Transformer 模型,將歌曲分類為“流行”和“搖滾”等流派。這是 Spotify 等音樂流媒體平臺的重要組成部分,這些平臺會推薦與使用者正在收聽的歌曲相似的歌曲。

在本節結束時,您將瞭解如何

  • 查詢適用於音訊分類任務的預訓練模型
  • 使用 🤗 Datasets 庫和 Hugging Face Hub 選擇音訊分類資料集
  • 微調預訓練模型以按流派分類歌曲
  • 構建一個 Gradio 演示,讓您對自己的歌曲進行分類
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.