音訊課程文件

動手練習

音訊課程

第 0 單元. 歡迎學習本課程！

第 1 單元. 處理音訊資料

第 2 單元. 音訊應用簡介

音訊應用概述使用管道進行音訊分類使用管道進行自動語音識別使用管道進行音訊生成動手練習

第 3 單元. 用於音訊的 Transformer 架構

第 4 單元. 構建一個音樂流派分類器

第 5 單元. 自動語音識別

第 6 單元. 從文字到語音

第 7 單元. 綜合應用

第 8 單元. 終點線

課程活動

加入 Hugging Face 社群

並獲得增強的文件體驗

在模型、資料集和 Spaces 上進行協作

透過加速推理獲得更快的示例

切換文件主題

開始使用

動手練習

本練習不計分，旨在幫助您熟悉在本課程其餘部分將使用的工具和庫。如果您已經熟練使用 Google Colab、🤗 Datasets、librosa 和 🤗 Transformers，則可以選擇跳過此練習。

建立一個 Google Colab 筆記本。
使用 🤗 Datasets 以流模式載入您選擇的語言的 facebook/voxpopuli 資料集的訓練集。
從資料集的 train 部分獲取第三個示例並進行探索。考慮到此示例具有的特徵，您可以使用此資料集進行哪些型別的音訊任務？
繪製此示例的波形和頻譜圖。
訪問 🤗 Hub，探索預訓練模型並找到一個可用於您之前選擇的語言的自動語音識別的模型。使用您找到的模型例項化相應的管道，並轉錄示例。
將從管道獲得的轉錄與示例中提供的轉錄進行比較。

如果您在練習中遇到困難，請隨時檢視示例解決方案。發現了什麼有趣的東西？找到了一個很酷的模型？得到了漂亮的頻譜圖？歡迎在 Twitter 上分享您的作品和發現！

在接下來的章節中，您將瞭解更多關於各種音訊 Transformer 架構的知識，並訓練您自己的模型！

< > 在 GitHub 上更新

←使用管道生成音訊 Transformer 模型回顧→

© . This site is unofficial and not affiliated with Hugging Face, Inc.