音訊課程文件
第 4 單元. 構建一個音樂流派分類器
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
單元 4. 構建音樂流派分類器
您將學習和構建什麼
音訊分類是音訊和語音處理中 Transformer 最常見的應用之一。與機器學習中的其他分類任務一樣,此任務涉及根據音訊錄製的內容為其分配一個或多個標籤。例如,在語音的情況下,我們可能需要檢測何時說出“嘿 Siri”之類的喚醒詞,或者從“今天天氣如何?”之類的口頭查詢中推斷出“溫度”之類的關鍵詞。環境聲音提供了另一個例子,我們可能需要自動區分“汽車喇叭”、“警報器”、“狗叫”等聲音。
在本節中,我們將瞭解如何將預訓練的音訊 Transformer 應用於各種音訊分類任務。然後,我們將針對音樂分類任務微調 Transformer 模型,將歌曲分類為“流行”和“搖滾”等流派。這是 Spotify 等音樂流媒體平臺的重要組成部分,這些平臺會推薦與使用者正在收聽的歌曲相似的歌曲。
在本節結束時,您將瞭解如何
- 查詢適用於音訊分類任務的預訓練模型
- 使用 🤗 Datasets 庫和 Hugging Face Hub 選擇音訊分類資料集
- 微調預訓練模型以按流派分類歌曲
- 構建一個 Gradio 演示,讓您對自己的歌曲進行分類