객체 Attention을 이용한 이미지 캡션 생성 


46권  4호, pp. 369-375, 4월  2019
10.5626/JOK.2019.46.4.369


PDF

  요약

이미지 데이터가 폭발적으로 증가함에 따라 이미지를 자연어로 표현하기 위한 이미지 캡션 생성 기술에 대한 연구도 활발하게 이루어지고 있다. 기존 한국어 이미지 캡션 생성 기술에서는 영어권 데이터를 번역하여 사용함으로 인해 동시 발생 객체들에 의한 오류가 있다. 본 논문에서는 입력 이미지에 대한 캡션을 생성하여 추출한 명사와 이미지의 정답 캡션에서 추출한 명사를 이용하는 attention 함수를 새로운 손실 함수로 사용하는 이미지 캡션 모델을 제안한다. 공개된 실험 데이터를 사용한 실험에서 BLEU1 0.686, BLEU2 0.557, BLEU3 0.456, BLEU4 0.372를 보였다. 이를 이용하여 제안된 모델이 고빈도 동시 발생 객체 오류 해결에 효과적임을 입증하고 기존 연구보다 높은 성능을 얻음을 보이며 중복된 출력 문장을 줄임으로써 이미지 캡션의 다양한 표현들이 생성에 효과적임을 보였다. 또한 본 논문에서 제안하는 방법을 이용하여 이미지 캡션 모델을 학습하기 위한 코퍼스를 생성할 수 있다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

D. Park and J. Cha, "Image Caption Generation using Object Attention Mechanism," Journal of KIISE, JOK, vol. 46, no. 4, pp. 369-375, 2019. DOI: 10.5626/JOK.2019.46.4.369.


[ACM Style]

Da-Sol Park and Jeong-Won Cha. 2019. Image Caption Generation using Object Attention Mechanism. Journal of KIISE, JOK, 46, 4, (2019), 369-375. DOI: 10.5626/JOK.2019.46.4.369.


[KCI Style]

박다솔, 차정원, "객체 Attention을 이용한 이미지 캡션 생성," 한국정보과학회 논문지, 제46권, 제4호, 369~375쪽, 2019. DOI: 10.5626/JOK.2019.46.4.369.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr