참조 표현 증강과 마스크 통합을 이용한 제로 샷 참조 영상 분할 


53권  1호, pp. 15-21, 1월  2026
10.5626/JOK.2026.53.1.15


PDF

  요약

컴퓨터 비전 기술이 발전함에 따라 영상 분할작업이 다양하게 활용되고 있다. 특히 사용자의 지시에 따른 정확한 영역 분할을 위해 참조 영상 분할 과업이 사용된다. 본 논문은 물체를 볼 때, 사전 지식을 이용하여 객체를 인식하는 인간의 인지 방식에서 착안한 참조 영상 분할 프레임워크를 도입한다. 거대 언어 모델을 이용하여 물체의 다양한 시각적 요소들을 유추하고, 유추한 요소들을 바탕으로 마스크 제안을 통합하는 방식을 제안하였다. 결과적으로 RefCOCO, RefCOCO+, RefCOCOg 벤치마크 데이터셋에서 기존의 방법 대비 oIoU, mIoU 성능이 각각 0.41%, 0.74% 향상하여 우리의 방법의 효과를 입증하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Song, S. Kim, J. Seo, J. Lee, "Zero-shot Referring Image Segmentation using Referring Expression Augmentation and Mask Aggregation," Journal of KIISE, JOK, vol. 53, no. 1, pp. 15-21, 2026. DOI: 10.5626/JOK.2026.53.1.15.


[ACM Style]

Seungheon Song, Sungsik Kim, Junghyeon Seo, and Jaekoo Lee. 2026. Zero-shot Referring Image Segmentation using Referring Expression Augmentation and Mask Aggregation. Journal of KIISE, JOK, 53, 1, (2026), 15-21. DOI: 10.5626/JOK.2026.53.1.15.


[KCI Style]

송승헌, 김성식, 서정현, 이재구, "참조 표현 증강과 마스크 통합을 이용한 제로 샷 참조 영상 분할," 한국정보과학회 논문지, 제53권, 제1호, 15~21쪽, 2026. DOI: 10.5626/JOK.2026.53.1.15.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr