검색 : [ author: 송광호 ] (5)

TwinAMFNet: 3차원 시맨틱 세그멘테이션을 위한 Twin 어텐션 기반 멀티모달 퓨전 네트워크

윤재근, 전지연, 송광호

http://doi.org/10.5626/JOK.2023.50.9.784

최근 자율주행에서 오인식으로 인한 충돌 사고가 증가함에 따라 멀티 모달 센서를 활용한 센서 퓨전 기반의 3차원 시맨틱 세그멘테이션에 관한 관심이 늘어나고 있다. 이에 따라 본 연구에서는 카메라와 LiDAR의 센서 퓨전을 통해 새로운 3차원 시맨틱 세그멘테이션 신경망인 TwinAMFNet을 소개한다. 제안하는 신경망은 RGB 영상과 2차원의 좌표 평면에 사영한 점 군 사영 영상을 처리하는 Twin 신경망을 포함하며 인코더 및 디코더에서의 특징 단계 퓨전을 위한 어텐션 기반 퓨전 모듈을 통해 더욱 확장된 객체 및 경계 구분에 대한 표현력 개선을 보여준다. 결과적으로 제안한 신경망은 mIoU를 기준으로 3차원 시맨틱 세그멘테이션에 약 68%의 성능을 기록하였으며 기존 연구들에 비해 약 4.5% 이상 향상된 성능을 보였다.

보행자 이미지에서 지역 다중규모 특징 임베딩 추출을 위한 어텐션 피라미드 이용의 보행자 재식별

송광호, 김유성

http://doi.org/10.5626/JOK.2021.48.12.1305

본 논문에서는 보행자 이미지로부터 불필요한 배경 잡음을 배제시키며 정교한 지역 특징 임베딩(local feature embedding)을 추출하기 위해 어텐션 매커니즘을 결합시킨 이중 피라미드를 이용하는 새로운 보행자 재식별 방법을 제안한다. 규모 피라미드와 지역 피라미드로 구성된 이중 피라미드에 공간 어텐션을 적용해 특징 임베딩에 불필요한 배경 요소들이 반영되는 것을 억제시키고, 채널 어텐션을 적용해 추출된 다중규모 특징 중에서 상대적으로 중요도가 높은 것으로 지역 특징 임베딩이 구성되도록 한다. 실험에서는 각 구성 피라미드에 공간 어텐션과 채널 어텐션이 적용되는 효과를 비교함으로써 각 어텐션의 적용에 따른 재식별 정확도 변화를 관찰하고, 이를 기존의 우수 연구들과 비교하였다. 실험 결과에 따르면 제안 기법은 최대 99.4%의 1순위 정확도를 보였으며, 이는 기존 연구들보다 최소 약 0.2%, 최대 약 13.8%까지 높은 것으로 분석되었다.

지능형 영상 감시 시스템에서 모바일 센서 융합을 이용한 폭력행위 인식

차현인, 송광호, 김유성

http://doi.org/10.5626/JOK.2018.45.6.533

본 논문에서는 지능형 CCTV에서 동시다발적이고 연속적인 행위들로부터 추출한 특성들을 반영하여 폭력행위를 인식하는 방법으로서 그룹 ROI(Region of Interest)를 검출하고 ROI에서의 Dense Optical Flow 알고리즘을 사용해 얻은 움직임 정보와 영상 내 행위자가 소지한 모바일 기기의 관성측정장치로부터 얻은 가속도와 각속도 정보를 융합한 폭력행위 인식모델을 제안한다. 그리고 제안한 모델의 연산시간 감소를 통한 실시간성 확보와 영상만을 사용했을 때의 가려짐에 따른 성능 저하 현상의 성능 개선여부를 평가하기 위한 실험들을 진행하였으며 실행시간 측면에서 약 5.26배 빠른 연산속도를 보였고 정확도 측면에서 11.4% 증진된 결과를 보였다. 이를 통해 제안 모델이 폭력행위 인식에 발생하는 과도한 연산에 따른 실시간성 문제를 보완할 수 있고 영상 내 행위자 사이의 가려짐에 따른 비전 인식 불능에 대한 문제점을 보완할 수 있음을 알 수 있다.

단어 동시출현관계로 구축한 계층적 그래프 모델을 활용한 자동 키워드 추출 방법

송광호, 김유성

http://doi.org/

키워드 추출은 주어진 문서로부터 문서의 주제나 내용에 관련된 단어들을 추출해내는 방법으로 대량의 문서를 다루는 텍스트마이닝 연구들이 전처리에서 공통적으로 거치는 대표 자질 추출에서 중요하게 활용될 수 있다. 본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출하기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이를 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다. 그리고 제안한 방법의 정확성과 주제적 포괄성 검증을 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

질의응답 시스템에서 처음 보는 단어의 역문헌빈도 기반 단어 임베딩 기법

이우인, 송광호, 심규석

http://doi.org/

질의응답 시스템은 사용자의 질문에 대한 답을 찾아주는 시스템으로, 기존의 검색엔진이 사용자의 질의에 대해 관련된 문서의 링크만을 찾아주는 반면 질문에 대한 최종적인 답을 찾아준다는 차이점이 있다. 특정 분야에 국한되지 않고 다양한 질문을 처리해주는 오픈 도메인 질의응답 시스템에 필요한 연구들이 최근 자연어 처리, 인공지능, 데이터 마이닝 등 학계의 다양한 분야들에서 뜨거운 관심을 받고있다. 하지만 관련 연구에서는 학습 데이터에는 없었던 단어들이 질문에 대한 정확한 답과 유사한 오답을 구별해내는데 결정적인 역할을 할 수 있음에도, 이러한 처음 보는 단어들을 모두 단일 토큰으로 치환해버리는 문제가 있다. 본 논문에서는 문맥 정보를 통해 이러한 모르는 단어에 대한 벡터를 계산하는 방법을 제안한다. 그리고 역문헌빈도 가중치를 활용하여 문맥정보를 더 효율적으로 처리하는 모델을 제안한다. 또한 풍부한 실험을 통해 질의응답 시스템의 모델 학습 속도 및 정확성이 기존 연구에 비해 향상됨을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr