본문 바로가기
나만 보는 정리노트/ComputerVision

Object Detection 개념 및 성능 평가 방법

by SeoKhan 2022. 11. 18.

방법

  • Classification(분류) : 어떤 객체인지(Ex. 고양이 or 강아지) 클래스만을 분류한다. 이 때 주로 CNN 모델만을 사용한다.
  • Localization(회귀) :  특정 클래스 객체 위치를 바운딩 박스(Bounding Box)로 지정해 찾는 것을 의미한다.
  • Object Detection(분류 + 회귀) : 여러개의 클래스 객체들에 대한 위치를 여러개의 바운딩 박스로 지정해서 찾는다(Localization). 이 때 동시에 여러개의 객체들이 무엇을 의미하는지 클래스 분류(Classification)도 수행한다.
  • Segmentation : Pixel-level로 Object Detection을 하는 것을 의미한다.

탐지 방법 별 예시 이미지
분류(Classification) 및 회귀(Localization) 과정


Region Proposal

객체가 있을 만한 영역들의 후보군들을 여러개 추출한다.

  • Sliding Window
    각기 다른 모양의 윈도우를 각각 슬라이딩하거나 아니면 윈도우 크기를 고정하되 탐지할 이미지 크기를 다양하게 스케일링해서 수행하기도 한다.
    객체가 없는 지역도 슬라이딩해서 시간이 많이 걸릴 뿐더러 객체를 잘 탐지할 확률도 낮아지게 된다.

Sliding Window 방식

 

  • Selective Search
    이미지 픽셀의 컬러, 무늬, 크기, 형태에 따라 유사한 Region을 계층적 그룹핑 방법으로 계산하는 방식이다.
    == Segmentation된 부분을 유사도에 따라 Segmentation 그룹핑을 계속 반복하는 것이다.

Selective Search 방식


성능 평가 방법

  • IoU (Intersection Over Union)
    실제 객체가 있는 바운딩 박스(Ground Truth)와 모델이 예측한 바운딩 박스(Predicted)가 포함하고 있는 영역을 계산

IoU 계산식
IoU 값 변화

  • NMS(Non-Max Supperession)
    탐지 모델의 성능을 측정하는 지표라기 보다는 탐지 모델이 오브젝트를 정확하게 예측하도록 도와주는 기술,
    여러개의 바운딩 박스들 중 객체의 Confidence Score가 가장 높은 박스를 선정하고 이보다 낮은 박스들은 삭제한다.

NMS 과정

바운딩 박스가 여러개 나오는 것을 막을 수 있고, 다수의 객체를 탐지 가능하다.

 

  • mAP(mean-Average Precision)
    AP: Confidence Score 임곗값을 조절하면서 얻은 Precision-Recall Curve를 그린 그래프의 아래 면적

AP 개념 이미지

Confidence Score를 높게 설정한다면 객체 탐지 모델이 정말 확신하는 케이스만 Positive라고 예측하기 때문에 
Precision은 매우 높아지는 반면 Recall 수치는 낮아지게 된다.

Confidence Score를 낮게 설정한다면 객체 탐지 모델이 모든 케이스에 대해 Positive라고 예측하기에 
Recall 수치는 매우 높아지지만 Precision 수치는 낮아지게 된다.

 

AP는 하나의 객체(Object)에 대한 탐지 성능, mAP는 여러개의 객체들이 담긴 이미지를 객체 탐지했을 때 하나의 객체에 대한 AP값을 구하고 이미지에 존재하는 객체들의 개수만큼 평균값을 취해주는 것

 

 

 

 

 

Reference. https://techblog-history-younghunjo1.tistory.com/178