音訊課程文件
動手練習
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
動手練習
本練習不計分,旨在幫助您熟悉在本課程其餘部分將使用的工具和庫。如果您已經熟練使用 Google Colab、🤗 Datasets、librosa 和 🤗 Transformers,則可以選擇跳過此練習。
- 建立一個 Google Colab 筆記本。
- 使用 🤗 Datasets 以流模式載入您選擇的語言的
facebook/voxpopuli
資料集的訓練集。 - 從資料集的
train
部分獲取第三個示例並進行探索。考慮到此示例具有的特徵,您可以使用此資料集進行哪些型別的音訊任務? - 繪製此示例的波形和頻譜圖。
- 訪問 🤗 Hub,探索預訓練模型並找到一個可用於您之前選擇的語言的自動語音識別的模型。使用您找到的模型例項化相應的管道,並轉錄示例。
- 將從管道獲得的轉錄與示例中提供的轉錄進行比較。
如果您在練習中遇到困難,請隨時檢視示例解決方案。發現了什麼有趣的東西?找到了一個很酷的模型?得到了漂亮的頻譜圖?歡迎在 Twitter 上分享您的作品和發現!
在接下來的章節中,您將瞭解更多關於各種音訊 Transformer 架構的知識,並訓練您自己的模型!
< > 在 GitHub 上更新