YOLO Loss | Notion

개요

Untitled

이미지를 지정한 **grid(7x7)**로 나누고, 각 grid cell이 한번에 bounding box, class 두가지 정답을 도출
각 grid cell에서 얻은 정보를 feature map이 잘 인코딩 할 수 있도록 독자적인 Convolution Network인 DarkNet 도입. (YOLO v1)
이로 얻은 feature map을 통해서 regression loss를 통해 모델 학습

Regression Loss

세부 과정

Untitled

전체 이미지를 입력 받습니다.
SxS개로 grid cell을 나눠 줍니다.
객체의 중심이 있는 grid cell을 각 grid cell에서 B개의 Bounding Box(x, y, w, h)와 Confidence Score를 예측

confidence score

한 개의 Bounding Box는 한 개의 객체만 예측 함.
한 개의 grid cell은 한 개의 confidence score가 높은 Bounding Box 한 개만 학습 함.

Untitled

각 grid cell 마다 C개의 conditional Class probabilities인 **Pr(Class[i] | Object)**를 예측 함

조건부 확률 : P(A∧C)=P(C)⋅P(A|C)

Bounding Box 별로 Class probability를 예측 하는 것이 아니라 grid cell 별로 예측을 진행