社群計算機視覺課程文件
歡迎來到社群計算機視覺課程
並獲得增強的文件體驗
開始使用
歡迎來到社群計算機視覺課程
親愛的學習者,
歡迎來到社群驅動的計算機視覺課程。計算機視覺正在以多種方式改變我們的世界,從透過面部識別解鎖手機,到分析醫學影像以檢測疾病,監測野生動物,以及創造新的影像。讓我們一起深入探索迷人的計算機視覺世界!
在本課程中,我們將涵蓋從基礎到最新進展的所有內容。它結構清晰,包含各種基礎主題,對所有人來說都友好且易於理解。我們非常高興你能加入我們這段激動人心的旅程!
在本頁面,你可以找到如何加入學習者社群以及更多關於課程的詳細資訊!
認證 🥇
抱歉,我們目前不提供此課程的認證。如果您想參與構建一種方法,讓人們能夠證明他們在本課程中學到的知識,並使其成為一個高度自動化的過程,歡迎隨時開啟討論或提交 issue。
加入社群!
我們邀請您加入我們活躍且支援性的 Discord 社群,這裡每天都有引人入勝的對話和共同的興趣,本課程也在這裡誕生。您將找到可以交流想法和資源的同伴。這裡是您協作、獲取反饋和提問的地方!
這也是激勵自己學習課程的好方法。加入我們的社群是保持參與的絕佳方式。誰知道我們接下來會一起創造什麼呢?
隨著人工智慧的不斷發展,我們社群的討論質量和觀點的多樣性也在不斷提高。成為會員後,您將有機會與課程的其他參與者建立聯絡,交流想法並與他人協作。此外,本課程的貢獻者活躍在 Discord 上,可能在您需要時提供幫助。立即加入我們!
計算機視覺頻道
我們的 Discord 伺服器上有許多專注於不同主題的頻道。您會發現人們在那裡討論論文、組織活動、分享他們的專案和想法、頭腦風暴等等。
作為一名計算機視覺課程的學習者,您可能會發現以下頻道特別有用
#computer-vision:一個涵蓋所有與計算機視覺相關內容的通用頻道#cv-study-group:一個交流想法、就特定帖子提問和發起討論的地方#3d:一個討論 3D 計算機視覺特定方面的頻道
如果您對生成式 AI 感興趣,我們也邀請您加入所有與擴散模型相關的頻道:#core-announcements、#discussions、#dev-discussions 和 #diff-i-made-this。
您將學到什麼
本課程由理論、實踐教程和引人入勝的挑戰組成。
- 理論部分:本部分詳細解釋了計算機視覺的理論原理,並輔以實際示例。
- 動手教程:您將學習如何使用 Google Colab 筆記本訓練和應用關鍵的計算機視覺模型。
在本課程中,我們將涵蓋從基礎到最新進展的所有內容。它結構清晰,包含各種基礎主題,讓您全面瞭解使計算機視覺在當今如此重要的原因。
先修課程
在開始本課程之前,請確保您具備 Python 程式設計經驗,並且熟悉 Transformer、機器學習和神經網路。如果這些對您來說是新的,可以考慮回顧 Hugging Face NLP 課程的第一單元。雖然對預處理技術和卷積等數學運算有紮實的瞭解會有所幫助,但它們不是先決條件。
課程結構
本課程分為多個單元,涵蓋基礎知識並深入探討最先進的模型。
- 第一單元 - 計算機視覺基礎:本單元涵蓋了入門計算機視覺的基本概念:計算機視覺的必要性、該領域的知識以及應用。探索影像基礎、形成和預處理,以及特徵提取的關鍵方面。
- 第二單元 - 卷積神經網路 (CNNs):深入瞭解 CNN 的世界,理解其通用架構、關鍵概念和常見預訓練模型。學習如何應用遷移學習和微調來適應各種任務的 CNN。
- 第三單元 - 視覺 Transformer:在計算機視覺的背景下探索 Transformer 架構,並學習它們與 CNN 的比較。理解常見的視覺 Transformer,如 Swin、DETR 和 CVT,以及遷移學習和微調技術。
- 第四單元 - 多模態模型:透過探索影像到文字和文字到影像的多模態任務來理解文字和視覺的融合。研究 CLIP 及其相關模型(GroupViT、BLIPM、Owl-VIT),並掌握多模態任務的遷移學習技術。
- 第五單元 - 生成模型:探索生成模型,包括 GAN、VAE 和擴散模型。瞭解它們的區別以及在文字到影像、影像到影像和影像修復等任務中的應用。
- 第六單元 - 基本計算機視覺任務:涵蓋影像分類、目標檢測和分割等基本任務以及它們使用的模型(YOLO、SAM)。深入瞭解這些任務的指標和實際應用。
- 第七單元 - 影片和影片處理:檢查影片的特性、影片處理的作用以及與影像處理相比的挑戰。探索影片處理中的時間連續性、運動估計和實際應用。
- 第八單元 - 3D 視覺、場景渲染和重建:深入探討三維視覺的複雜性,探索 NeRF 和 GQN 等場景渲染和重建的概念。理解 3D 視覺在計算機視覺中的挑戰和應用,以及它如何提供更全面的空間資訊檢視。
- 第九單元 - 模型最佳化:探索模型最佳化的關鍵方面。涵蓋模型壓縮、部署考慮以及工具和框架的使用等技術。包括蒸餾、剪枝和 TinyML 等主題,以實現高效的模型部署。
- 第十單元 - 合成數據建立:發現使用深度生成模型建立合成數據的重要性。探索點雲和擴散模型等方法,並研究主要的合成數據集及其在計算機視覺中的應用。
- 第十一單元 - 零樣本計算機視覺:深入研究計算機視覺中的零樣本學習領域,涵蓋泛化、遷移學習的各個方面及其在零樣本識別和影像分割等任務中的應用。探索零樣本學習與計算機視覺各個領域遷移學習之間的關係。
- 第十二單元 - 計算機視覺中的倫理和偏見:瞭解計算機視覺特有的倫理考量。探討倫理為何重要,偏見如何滲入 AI 模型,以及這些領域普遍存在的偏見型別。學習如何進行偏見評估和緩解策略,強調 AI 技術的負責任開發和部署。
- 第十三單元 - 前景和新興趨勢:探索當前趨勢和新興架構。深入研究 Retentive Network、Hiera、Hyena、I-JEPA 和 Retention Vision Models 等創新方法。
認識我們的團隊
本課程由 Hugging Face 社群用愛心製作!透過在 GitHub 上貢獻您的力量加入我們。我們的目標是建立一個對初學者友好的計算機視覺課程,並能作為他人的資源。來自世界各地的 60 多人聯手完成了這個專案。在這裡我們給予他們肯定。
第一單元 - 計算機視覺基礎
- 審稿人:Ratan Prasad, Ameed Taylor, Sergio Paniego
- 作者:Seshu Pavan Mutyala, Isabella Bicalho-Frazeto, Aman Kapoor, Tiago Comassetto Fróes, Aditya Mishra, Kerem Delikoyun, Ker Lee Yap, Kathy Fahnline, Ameed Taylor
第二單元 - 卷積神經網路 (CNNs)
- 審稿人:Ratan Prasad, Mohammed Hamdy, Sezan, Joshua Adrian Cahyono, Murtaza Nazir, Albert Kao, Sitam Meur, Antonis Stellas, Sergio Paniego
- 作者:Emre Albayrak, Caroline Shamiso Chitongo, Sezan, Joshua Adrian Cahyono, Murtaza Nazir, Albert Kao, Isabella Bicalho-Frazeto, Aman Kapoor, Sitam Meur
單元 3 - 視覺Transformer
- 審稿人:Ratan Prasad, Mohammed Hamdy, Ameed Taylor, Sezan
- 作者:Surya Guthikonda, Ker Lee Yap, Anindyadeep Sannigrahi, Celina Hanouti, Malcolm Krolick, Alvin Li, Shreyas Daniel Gaddam, Anthony Susevski, Alan Ahmet, Ghassen Fatnassi
單元 4 - 多模態模型
- 審稿人:Ratan Prasad, Snehil Sanyal, Mohammed Hamdy, Charchit Sharma, Ameed Taylor, Isabella Bicalho-Frazeto
- 作者:Snehil Sanyal, Surya Guthikonda, Mateusz Dziemian, Charchit Sharma, Evstifeev Stepan, Jeremy Kespite, Isabella Bicalho-Frazeto, Pedro Gabriel Gengo Lourenco
單元 5 - 生成模型
- 審稿人:Ratan Prasad, William Bonvini, Mohammed Hamdy, Ameed Taylor-
- 作者:Jeronim Matijević, Mateusz Dziemian, Charchit Sharma, Muhammad Waseem
第六單元 - 基本計算機視覺任務
單元 7 - 影片和影片處理
- 審稿人:Ameed Taylor, Isabella Bicalho-Frazeto
- 作者:Diwakar Basnet, Chulhwa Han, Woojun Jung, Jiwook Han, Mingi Kim
第八單元 - 3D 視覺、場景渲染和重建
- 審稿人:Ratan Prasad, William Bonvini, Mohammed Hamdy, Adhi Setiawan, Ameed Taylor
- 作者:John Fozard, Vasu Gupta, Psetinek
單元 9 - 模型最佳化
單元 10 - 合成數據建立
- 審稿人:Mohammed Hamdy, Ameed Taylor, Bhavesh Misra
- 作者:William Bonvini, Alper Balbay, Madhav Kumar, Bhavesh Misra, Kathy Fahnline
單元 11 - 零樣本計算機視覺
- 審稿人:Ratan Prasad, Mohammed Hamdy, Albert Kao, Isabella Bicalho-Frazeto
- 作者:Mohammed Hamdy, Albert Kao
第十二單元 - 計算機視覺中的倫理和偏見
- 審稿人:Ratan Prasad, Mohammed Hamdy, Charchit Sharma, Adhi Setiawan, Ameed Taylor, Bhavesh Misra
- 作者:Snehil Sanyal, Bhavesh Misra
第十三單元 - 前景和新興趨勢
- 審稿人:Ratan Prasad, Ameed Taylor, Mohammed Hamdy
- 作者:Farros Alferro, Mohammed Hamdy, Louis Ulmer, Dario Wisznewer, gonzachiar
組織團隊 Merve Noyan, Adam Molnar, Johannes Kolbe
我們很高興您能在這裡,讓我們開始吧!
在 GitHub 上更新