Abstract detection을 하기 위해 classifier를 고치는 것 대신에 우리는 분리된 bounding box와 연관된 class 확률에 regression 문제로서 object detection frame을 설정한다. single neural network는 한 번의 평가에서 full image로부터 bounding box와 class 확률을 예측한다. 전체 detection pipeline은 single network때문에 detection 구현에서 end to end로 최적화될 수 있다. 우리의 base yolo model은 실시간에서 초당 45 frame으로 image를 처리한다. network의 더 작은 version인 fast yolo는 다른 실시간 detector의 mAP에 두배..