目標檢測

在本章中，我們將探索目標檢測這一引人入勝的領域——它是現代計算機視覺系統中的一項關鍵任務。我們將揭開基本概念的神秘面紗，討論流行方法，審視其應用，並討論評估指標。學完本章，你將打下堅實的基礎，並準備好進一步深入高階主題。

Image displaying the bounding boxes around multiple objects in the frame along with the confidence score of their classification

目標檢測概述

簡介

目標檢測是識別和定位數字影像或影片幀中特定物件的任務。它在各個領域都具有深遠的影響，包括自動駕駛汽車、人臉識別系統和醫療診斷工具。

分類與定位

分類根據獨特屬性區分物件，而定位則確定影像中物件的位置。目標檢測結合了這兩種方法，既定位實體又分配相應的類別標籤。想象一下識別不同型別的水果，並在一個影像中精確指出它們的位置。這就是目標檢測的體現！

用例

目標檢測影響著眾多行業，提供寶貴的洞察力和自動化機會。代表性示例包括自動駕駛汽車在道路上行駛，監控系統覆蓋廣闊的公共空間，醫療成像系統檢測疾病，製造工廠保持產量一致性，以及增強現實技術豐富使用者體驗。

以下是使用transformers進行目標檢測的一個例子

from transformers import pipeline
from PIL import Image

pipe = pipeline("object-detection", model="facebook/detr-resnet-50")

image = Image.open("path/to/your/image.jpg").convert("RGB")

bounding_boxes = pipe(image)

如何評估目標檢測模型？

你現在已經瞭解瞭如何使用目標檢測模型，但如何評估它呢？正如前一節所示，目標檢測主要是一個監督學習任務。這意味著資料集由影像及其對應的邊界框組成，這些邊界框作為真實情況。可以使用一些指標來評估你的模型。最常見的指標是：

交併比 (IoU) 或 Jaccard 指數衡量預測標籤與參考標籤之間的重疊，百分比範圍從 0% 到 100%。較高的 IoU 百分比表示更好的對齊，即提高了準確性。在評估跟蹤器在不斷變化條件下的效能時很有用，例如跟蹤遷徙中的野生動物。
平均精度均值 (mAP) 使用精度（正確預測比率）和召回率（真陽性識別能力）來估計目標檢測效率。mAP 在不同的 IoU 閾值下計算，作為目標檢測演算法的整體評估工具。有助於確定模型在具有挑戰性條件下的定位和檢測效能，例如在製造零件中查詢尺寸和形狀各異的不規則表面缺陷。

結論和未來工作

理解目標檢測為掌握高階計算機視覺技術奠定了基礎，從而能夠構建強大而準確的解決方案，滿足嚴苛的需求。未來的一些研究領域包括開發快速且易於部署的輕量級目標檢測模型。探索 3D 空間中的目標檢測領域，例如用於增強現實應用，是另一個值得探索的方向。

參考文獻和附加資源

< > 在 GitHub 上更新

社群計算機視覺課程