單元 4. 構建音樂流派分類器

您將學習和構建什麼

音訊分類是音訊和語音處理中 Transformer 最常見的應用之一。與機器學習中的其他分類任務一樣，此任務涉及根據音訊錄製的內容為其分配一個或多個標籤。例如，在語音的情況下，我們可能需要檢測何時說出“嘿 Siri”之類的喚醒詞，或者從“今天天氣如何？”之類的口頭查詢中推斷出“溫度”之類的關鍵詞。環境聲音提供了另一個例子，我們可能需要自動區分“汽車喇叭”、“警報器”、“狗叫”等聲音。

在本節中，我們將瞭解如何將預訓練的音訊 Transformer 應用於各種音訊分類任務。然後，我們將針對音樂分類任務微調 Transformer 模型，將歌曲分類為“流行”和“搖滾”等流派。這是 Spotify 等音樂流媒體平臺的重要組成部分，這些平臺會推薦與使用者正在收聽的歌曲相似的歌曲。

在本節結束時，您將瞭解如何

查詢適用於音訊分類任務的預訓練模型
使用 🤗 Datasets 庫和 Hugging Face Hub 選擇音訊分類資料集
微調預訓練模型以按流派分類歌曲
構建一個 Gradio 演示，讓您對自己的歌曲進行分類

< > 在 GitHub 上更新

音訊課程

單元 4. 構建音樂流派分類器

您將學習和構建什麼