시각적 관계 예측을 위한 계산 효율적인 조합적 전이 표현 학습법 


49권  7호, pp. 544-554, 7월  2022
10.5626/JOK.2022.49.7.544


PDF

  요약

장면 그래프는 이미지에 존재하는 객체 사이의 고차원 시각 관계를 표현하기 위해 널리 활용된다. 본 논문에서는 장면 그래프를 자동으로 구축하기위해 객체 사이의 시각 관계를 감지하고 그 관계를 술어로 예측하는 알고리즘을 제안한다. 우리는 기존에 제시된 텍스트 기반 지식 그래프 임베딩 TransR에서 영감을 받아 i) 시각적 관계의 구성적 관점을 고려하기 위한 잠재 관계 부분 공간을 정의하고 ii) 각 부분 공간에서 객체 표현 사이의 전이적 제약을 적용하는 CompTransR을 제시한다. 장면 그래프 생성을 위한 대표적인 벤치마크 데이터인 VRD, VG200 및 VrR-VG에서 제안하는 방법론은 기제시된 모델과 비교하여 학습 복잡도를 줄이는 동시에 우수한 성능을 보였다. 또한, 높은 수준의 시각-언어 추론을 요구하는 문제 중 하나인 이미지 캡션 검색에 장면 그래프가 효과적으로 적용될 수 있음을 보이고, 제안하는 알고리즘으로 예측된 술어 표현이 검색 성능을 높이는데 도움이 됨을 확인하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

Y. Heo, E. Kim, W. S. Choi, K. On, B. Zhang, "Efficient Compositional Translation Embedding for Visual Relationship Detection," Journal of KIISE, JOK, vol. 49, no. 7, pp. 544-554, 2022. DOI: 10.5626/JOK.2022.49.7.544.


[ACM Style]

Yu-Jung Heo, Eun-Sol Kim, Woo Suk Choi, Kyoung-Woon On, and Byoung-Tak Zhang. 2022. Efficient Compositional Translation Embedding for Visual Relationship Detection. Journal of KIISE, JOK, 49, 7, (2022), 544-554. DOI: 10.5626/JOK.2022.49.7.544.


[KCI Style]

허유정, 김은솔, 최우석, 온경운, 장병탁, "시각적 관계 예측을 위한 계산 효율적인 조합적 전이 표현 학습법," 한국정보과학회 논문지, 제49권, 제7호, 544~554쪽, 2022. DOI: 10.5626/JOK.2022.49.7.544.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr