社群計算機視覺課程文件
補充閱讀材料和資源 🤗
加入 Hugging Face 社群
並獲得增強的文件體驗
開始使用
補充閱讀材料和資源 🤗
我們希望您覺得多模態模型單元令人興奮。如果您想深入學習和探索多模態學習和模型,這裡列出了一些資源供您參考:
- Hugging Face 任務提供了計算機視覺、音訊、自然語言處理、多模態學習和強化學習等領域的各種任務概述。這些任務包含演示、用例、模型、資料集等。
- 卡內基梅隆大學多模態機器學習 (11-777 MMML) 課程。您可以在這裡找到影片講座。
- Chip Huyen 關於多模態和大型語言模型的部落格全面概述了多模態、大型多模態模型以及 BLIP、CLIP 等系統。
- Awesome Multimodal ML,一個包含論文、課程、架構、研討會、教程等的 GitHub 儲存庫。
- Awesome Multimodal Large Language Models,一個包含與多模態大型語言模型相關的論文和資料集的 GitHub 儲存庫。
- 加州理工學院 EE/CS 148 大型語言和視覺模型課程。
在下一個單元中,我們將研究另一種近年來因多模態而發生革命性變化的神經網路模型:生成神經網路。準備好您的畫筆,與我們一起踏上計算機視覺領域的另一段激動人心的旅程吧 🤠
< > 在 GitHub 上更新