Abstract cnn 기반 model의 많은 class로부터 판단에 대한 visual explanation을 만드는 기술을 제안한다. Gradient weighted Class Activation Mapping(Grad-CAM)같은 방법은 coarse localization map을 만들기 위해 마지막 convolutional layer에 넣는 target concept의 gradient를 사용한다. Grad CAM이 적용가능한 큰 다양한 cnn model 구조 3가지 1. fc layer를 가진 cnn(vgg) 2. 구조화된 output(captioning)에 사용된 CNN 3. multi model input(VQA)이나 reinforcement learning, 구조 변화나 재학습없는 모든 것을 ..