音訊課程文件

補充閱讀材料和資源

Hugging Face's logo
加入 Hugging Face 社群

並獲得增強的文件體驗

開始使用

補充閱讀和資源

如果您想進一步探索不同的 Transformer 架構,並瞭解它們在語音處理中的各種應用,請查閱這篇最近的論文:

語音處理中的 Transformer:一項綜述

作者:Siddique Latif, Aun Zaidi, Heriberto Cuayahuitl, Fahad Shamshad, Moazzam Shoukat, Junaid Qadir

“Transformer 在自然語言處理領域的卓越成功激發了語音處理界的興趣,促使人們探索其在語音序列中建模長距離依賴的潛力。最近,Transformer 在各種語音相關領域獲得了突出地位,包括自動語音識別、語音合成、語音翻譯、語音副語言學、語音增強、語音對話系統以及眾多多模態應用。本文旨在提出一項全面的綜述,旨在彌合語音技術中不同子領域的研究。透過整合語音技術領域的研究成果,我們為對利用 Transformer 的力量來推動該領域感興趣的研究人員提供了寶貴的資源。我們指出了 Transformer 在語音處理中遇到的挑戰,同時還提供瞭解決這些問題的潛在解決方案的見解。”

arxiv.org/abs/2303.11607

< > 在 GitHub 上更新

© . This site is unofficial and not affiliated with Hugging Face, Inc.