音訊課程文件
補充閱讀材料和資源
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
補充閱讀和資源
如果您想進一步探索不同的 Transformer 架構,並瞭解它們在語音處理中的各種應用,請查閱這篇最近的論文:
語音處理中的 Transformer:一項綜述
作者:Siddique Latif, Aun Zaidi, Heriberto Cuayahuitl, Fahad Shamshad, Moazzam Shoukat, Junaid Qadir
“Transformer 在自然語言處理領域的卓越成功激發了語音處理界的興趣,促使人們探索其在語音序列中建模長距離依賴的潛力。最近,Transformer 在各種語音相關領域獲得了突出地位,包括自動語音識別、語音合成、語音翻譯、語音副語言學、語音增強、語音對話系統以及眾多多模態應用。本文旨在提出一項全面的綜述,旨在彌合語音技術中不同子領域的研究。透過整合語音技術領域的研究成果,我們為對利用 Transformer 的力量來推動該領域感興趣的研究人員提供了寶貴的資源。我們指出了 Transformer 在語音處理中遇到的挑戰,同時還提供瞭解決這些問題的潛在解決方案的見解。”
< > 在 GitHub 上更新