본 논문에서는 이미지에서 캡션을 생성하는 모델의 성능을 향상시키기 위하여 이미지 기술자를 학습하
는 방법을 제안한다. 우리는 기 학습 되어있는 CNN을 문장을 이용해 전이학습하고, Fisher 커널을 이용
해 이미지를 표현한다. 본 방법을 통해 표현된 이미지를 gLSTM을 이용해 문장을 생성하였으며 그 결
과 뚜렷한 성능 향상을 보였다. 본 논문에서는 각 방법론들이 가지는 당위성을 실험을 통해 검증한다.
는 방법을 제안한다. 우리는 기 학습 되어있는 CNN을 문장을 이용해 전이학습하고, Fisher 커널을 이용
해 이미지를 표현한다. 본 방법을 통해 표현된 이미지를 gLSTM을 이용해 문장을 생성하였으며 그 결
과 뚜렷한 성능 향상을 보였다. 본 논문에서는 각 방법론들이 가지는 당위성을 실험을 통해 검증한다.