개요
- 이미지를 지정한 **grid(7x7)**로 나누고, 각 grid cell이 한번에 bounding box, class 두가지 정답을 도출
- 각 grid cell에서 얻은 정보를 feature map이 잘 인코딩 할 수 있도록 독자적인 Convolution Network인 DarkNet 도입. (YOLO v1)
- 이로 얻은 feature map을 통해서 regression loss를 통해 모델 학습
Regression Loss
세부 과정
- 전체 이미지를 입력 받습니다.
- SxS개로 grid cell을 나눠 줍니다.
- 객체의 중심이 있는 grid cell을
각 grid cell에서 B개의 Bounding Box(x, y, w, h)와 Confidence Score를 예측
Bounding Box
confidence score
- 한 개의 Bounding Box는 한 개의 객체만 예측 함.
- 한 개의 grid cell은 한 개의 confidence score가 높은 Bounding Box 한 개만 학습 함.
- 각 grid cell 마다 C개의 conditional Class probabilities인 **Pr(Class[i] | Object)**를 예측 함
조건부 확률 : P(A∧C)=P(C)⋅P(A|C)
- Bounding Box 별로 Class probability를 예측 하는 것이 아니라 grid cell 별로 예측을 진행