들어가기 전에
Object Detection 강의에 오신 여러분을 환영합니다. 이번 영상에서는 앞으로 우리가 들을 강의가 어떤 커리큘럼으로 구성되어 있는지 살펴보도록 하겠습니다. 또한 우리가 강의에서 주로 다루게 될 Object Detection 태스크가 어떤 문제인지 알아보고, 그 활용 분야에 대해서 살펴보도록 하겠습니다. 실습에서 사용하게 될 데이터셋은 [링크]에서 신청하여 받을 수 있으니 참고해주세요 :)
학습 목표
- Object Detection 태스크는 무엇인지, 학습된 모델은 어떤 Metric을 통해 평가되는지를 설명할 수 있다.
핵심 단어
강의 듣기
컴퓨터 비전의 태스크 종류
- Classification : 사진이 주어졌을 때 무엇인지 예측하는 태스크
- Object Detection : 이미지 속에서 객체를 식별해내는 태스크. 객체가 어디에 있는 지 찾고, 해당 객체가 무엇인지 식별하는 것
- Semantic Segmentation : 객체의 영역을 구분하는 태스크, 같은 클래스를 갖는 객체끼리는 구분이 없음
- Instance Segmentation : 객체의 영역을 구분하는 태스크, 같은 클래스의 객체 역시 구분함

Real word에서 Object Detection 예시
- 테슬라 AI 데이에서 테슬라의 자율주행 자동차
- 사진 속에서 텍스트를 뽑아내는 OCR 태스크
- 흉부 엑스레이 사진에서 병의 위치를 찾는 태스크
- CCTV에서 사람을 검출해내는 태스크
Object Detection의 역사

Object Detection 의 평가 지표
- mAP (mean average precision): 각 클래스당 AP의 평균
- mAP를 계산하기 위해 필요한 개념
- Confusion matrix:
- Precision: 모델의 예측관점에서 정의한 메트릭, 모델이 Posivie 라고 예측한 모든 케이스 중에 옳게 예측한 경우를 precision으로 정의
- Recall: 정답 관점의 메트릭입니다. 실제 정답 관점에 봤을 때 옳게 예측된 케이스와 틀리게 예측된 케이스가 있을 때 전체 정답중 옳게 예측된 정답의 비율을 의미
- PR curve: Recall 값에 따른 Precision 값의 변화를 그래프로 그려놓은 것
- IOU (Intersection Over union): Ground Truth 박스와 Predict 박스 두개의 전체 영역 분에 겹치는 영역을 의미
- FPS (Frames Per Second): 초당 처리 가능한 프레임 숫자, 크면 클수록 빠른 모델
- FLOPs (Floating Point Operations): 모델의 연산량을 측정할 수 있는 평가지표
Object Detection Library
- MMDetection: OpenMMLab에서 진행하는 Object Detection Libary
- Detectron2: Detectron2는 페이스북 AI 리서치의 라이브러리로 pytorch 기반의 Object Detection Libary
- YOLOv5: COCO 데이터셋으로 사전 학습된 모델로 수천 시간의 연구와 개발에 걸쳐 발전된 Object Detection 모델
생각해보기
- 우리 주변에서 적용된 Object Detection 는 무엇이 있을까요?
- mAP를 직접 구현해보세요. 가능하다면 AP의 PR Curve를 그려가며 mAP를 이해해봅시다.
comment