音訊課程文件

補充閱讀材料和資源

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

補充閱讀材料和資源

本單元整合了前幾個單元的許多元件,介紹了語音到語音翻譯、語音助手和說話人識別等任務。因此,為方便起見,補充閱讀材料分為這三項新任務

語音到語音翻譯

語音助手

會議轉錄

  • pyannote.audio 技術報告,Hervé Bredin:本報告描述了 pyannote.audio 說話人識別管道背後的主要原理
  • Whisper X,Max Bain 等人:使用 Whisper 模型計算單詞級時間戳的卓越方法
< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.