社群計算機視覺課程文件
計算機視覺的應用
並獲得增強的文件體驗
開始使用
計算機視覺的應用
在當今世界,計算機視覺系統執行著越來越具挑戰性的任務。其中一些任務甚至人類都難以完成。以印度為例,你知道印度是世界上註冊兩輪車數量最多的國家嗎?有那麼多司機,其中一些人會忘記戴頭盔。這是一種危險的行為,可能導致嚴重傷害。為了解決這個問題,印度政府與其他機構合作,開發了一個計算機視覺系統,可以自動識別未戴頭盔的騎手及其車牌。該系統對他們處以嚴厲罰款,以阻止人們違法。
當然,罰款並不是計算機視覺的唯一應用。它在醫療保健、零售和許多其他行業都有應用。這裡,我們提供一些計算機視覺系統的高層示例。
計算機視覺系統高階概述及示例
自動駕駛汽車

自動駕駛汽車嚴重依賴計算機視覺來感知和解釋環境。它們利用攝像頭和感測器識別道路上的物體、行人、交通標誌、車道線和其他車輛。基於分析的資料,計算機視覺演算法幫助這些車輛做出即時決策,例如轉向、加速或制動。特斯拉、Waymo 和 Uber 等公司正在積極研究這項技術,以使交通更安全、更高效。
零售和電子商務
計算機視覺正在徹底改變零售業。許多線上零售商和實體店都在將其用於各種目的。其中一個重要應用是物體識別和推薦系統。透過分析產品的影像或影片,計算機視覺演算法可以識別物品,理解其特徵,並向客戶推薦類似產品。例如,亞馬遜、eBay 和沃爾瑪等平臺利用計算機視覺根據使用者的瀏覽或購買歷史推薦相關產品。此外,在實體店中,計算機視覺驅動的系統可以跟蹤庫存水平,檢測庫存短缺,甚至分析客戶行為,以最佳化商店佈局和營銷策略,最終幫助他們提升商店。
裝配線中的質量控制
計算機視覺在裝配線質量控制中的應用有助於在檢測和糾正缺陷方面實現更高的準確性、效率和一致性,從而減少浪費,提高產品質量,並簡化製造過程。它被廣泛應用於許多領域。
缺陷檢測:計算機視覺系統可以即時分析裝配線上的產品,識別肉眼可能無法立即看到的缺陷或不規則之處。例如,計算機視覺可以檢查製造中的電子元件、汽車零件或包裝商品,以發現瑕疵、劃痕、凹痕或不正確的組裝。這些系統將產品與標準參考進行比較,以確定其是否符合質量標準。
自動化檢測:傳統的質量控制通常涉及人工檢測,這既耗時又容易出錯。計算機視覺系統透過使用攝像頭和機器學習演算法來捕獲產品在裝配線上的影像或影片,從而實現此過程的自動化。然後分析這些影像以檢測與標準的偏差,從而確保大規模生產中的一致性和高質量。
即時反饋和維護系統:透過將計算機視覺整合到裝配線中,製造商可以收到有關產品質量的即時反饋。如果檢測到缺陷,系統可以觸發立即操作,例如提醒操作員、將有缺陷的產品分流進行返工,甚至調整機器以糾正問題,從而最大限度地減少缺陷產品的生產並最佳化整個生產過程。
醫學影像分析

醫學影像分析應用計算機視覺和機器學習技術來解釋和提取來自X射線、CT掃描、MRI、超聲和組織病理學切片等醫學影像的資訊。
診斷輔助:計算機視覺透過分析醫學影像輔助診斷疾病和病症。例如,在放射學中,演算法可以檢測X射線或MRI中的腫瘤和骨折等異常。這些系統透過突出關注區域或提供有助於決策的定量資料來協助醫療專業人員。
分割和檢測:醫學影像分析涉及對影像內的特定結構或異常進行分割和檢測。此過程有助於隔離器官、組織或病理,以便進行更仔細的檢查。例如,在癌症檢測中,計算機視覺演算法可以從MRI或CT掃描中分割和分析腫瘤,從而協助治療計劃和監測。
治療計劃和監測:計算機視覺透過提供精確測量、跟蹤隨時間的變化以及協助手術計劃來促進治療計劃。它幫助醫生了解疾病的範圍和進展,使他們能夠相應地計劃和調整治療策略。醫生已經能夠手動完成大部分這些任務,但現在計算機視覺系統可以自動完成,從而使醫生能夠執行其他任務。
AI 輔助放射學:放射學中基於 AI 的系統透過自動化常規任務、減輕工作量和提高準確性來協助放射科醫生。這些系統可以標記潛在的異常發現,提供定量分析,甚至根據醫學影像中識別的模式預測潛在的健康問題。
藥物開發與研究:在藥物開發和醫學研究中,計算機視覺技術有助於分析細胞結構、組織樣本或遺傳物質。這有助於在微觀層面理解疾病,從而促進新藥、療法或診斷工具的開發。
計算機視覺系統面臨的挑戰
計算機視覺系統面臨著眾多挑戰,這些挑戰源於在現實世界場景中處理視覺資訊的複雜性,包括資料質量差、隱私和倫理問題以及其他問題,如下表所示:
| 因素 | 挑戰 |
|---|---|
| 資料可變性 | 從現實世界收集的資料高度多樣化,光照、視角、遮擋和背景各不相同,這使得開發可靠的計算機視覺系統具有挑戰性。 |
| 可伸縮性 | 由於視覺資料的不斷增加,計算機視覺系統需要具有可擴充套件性,以管理大型資料集並滿足即時處理要求。 |
| 準確率 | 在物體檢測、場景解釋和跟蹤方面實現高精度是一個重大挑戰,尤其是在複雜或雜亂的場景中,這通常是由於噪聲、不相關特徵和影像質量差造成的。 |
| 對噪聲的魯棒性 | 真實世界的資料充滿噪聲,包含缺陷、感測器偽影和失真。計算機視覺系統必須足夠健壯,才能有效處理這些噪聲資料。 |
| 與其他技術的整合 | 將計算機視覺與自然語言處理、機器人技術或增強現實等技術整合帶來了系統互操作性方面的挑戰,擴充套件了機器學習和計算機視覺的可用性。 |
| 隱私和倫理問題 | 計算機視覺的實際應用,尤其是在監控、面部識別和資料收集方面,引發了對隱私和倫理的擔憂,因此需要妥善處理資料庫和個人資訊。 |
| 即時處理 | 自動駕駛汽車和增強現實等應用需要即時處理,這給實現必要的計算效率帶來了挑戰,通常需要大量的計算能力和功能強大的雲平臺。 |
| 長期可靠性 | 在現實場景中長期保持計算機視覺系統的可靠性具有挑戰性,因為確保持續的準確性和靈活性可能很困難。 |
| 泛化性 | 開發在不同上下文和領域具有良好泛化能力的模型是一項重大挑戰,這要求模型能夠適應不斷變化的環境,而無需大量再訓練。 |
| 校準和維護 | 在現實世界環境中校準和維護攝像頭和感測器等硬體帶來了挑戰,這通常是由於後勤複雜性以及需要承受極端天氣條件。 |
倫理考量

隨著計算機視覺技術日益融入我們生活的方方面面,對其倫理考量變得至關重要。這些倫理考量早在人工智慧技術普及之前就已存在,並且與它的誕生息息相關。
倫敦醫院生存預測器就是一個很好的例子。它創建於1972年,其任務是預測患者是否能從昏迷中恢復。它有一個刻度盤,指示“生存”或“不可逆的腦損傷”。這是模式識別和人工神經網路最早的應用之一。即使在早期階段,這也引起了擔憂。醫生被建議不要僅憑預測器的判斷做出決定,該機器也從未用於移除患者的生命支援。
時過境遷,世界變得更加數字化、互聯互通,模型的倫理考量也必須隨之改變。現在,我們從全球角度考慮公平性和偏見。在此背景下,公平性是指模型以公平的方式行事,不對某個群體或個人進行目標歧視或不公平偏見。偏見是指對某人或某個群體的好惡傾向。在實踐中考慮公平性和偏見可能很棘手。
與效能指標不同,公平性沒有一個數學指標。要評估它,你必須理解當前的問題。更復雜的是,偏見可能在模型開發的任何階段出現;在資料、人工智慧設計、部署和模型應用中。

為了協助解決這個問題,人們做出了多項努力,包括在模型卡(伴隨模型並提供其重要資訊的特殊檔案)中系統地報告模型風險、限制和偏見。關於這個主題還有很多話要說,這就是為什麼本課程中有一個專門的章節。然而,我們在此介紹一些關鍵概念,以提供對其背後一些倫理考量的高層概述。我們將其總結在下表中。
| 道德考量 | 挑戰 |
|---|---|
| 隱私問題 | 計算機視覺通常涉及收集和分析視覺資料,這引發了對個人隱私的擔憂。問題包括未經授權的監控、面部識別以及敏感資訊被濫用的可能性。 |
| 偏見和公平性 | 資料、演算法或計算機視覺系統設計中的偏見可能導致不公平的結果,從而延續社會不平等。確保資料收集、演算法設計和決策的公平性對於防止基於種族、性別或其他因素的歧視至關重要。 |
| 準確性和問責制 | 計算機視覺系統必須準確可靠。問責措施對於糾正錯誤或故障是必要的,以確保系統開發人員對其造成的任何意外後果負責。 |
| 知情同意和知情決策 | 獲得計算機視覺系統收集或使用其資料的個人的知情同意至關重要。使用者應瞭解其資料將如何使用,並有權對其使用做出知情決策。 |
| 兩用顧慮 | 計算機視覺技術既有有益用途,也有潛在有害用途。確保該技術不被用於惡意目的(例如監視或侵犯隱私)至關重要。 |
| 透明度和可解釋性 | 計算機視覺系統在功能和決策方面應透明。使用者應能夠理解這些系統如何工作以及其決策背後的原因。 |
| 兒童保護 | 在處理涉及兒童的視覺資料時必須特別小心。應採取保障措施保護未成年人免受隱私侵犯或任何其他潛在傷害。 |
| 文化和情境敏感性 | 計算機視覺系統應注意文化差異和多樣化語境,以避免基於文化或區域規範的誤解或偏見。 |
| 人工監督 | 人工監督和干預對於確保計算機視覺系統合乎道德地執行並做出準確決策至關重要。人類應能夠在系統決策可能造成損害的情況下進行干預。 |
| 環境影響 | 計算機視覺系統的開發和部署應考慮其環境影響。這包括能源消耗、電子廢物和其他生態因素。 |
| 教育和倫理培訓 | 培訓計劃和教育倡議對於提高開發人員、使用者和政策制定者對計算機視覺技術倫理影響的認識至關重要。 |