검색 : [ author: Boeun Kim ] (3)

역번역 프로세스를 통한 문서 기반 대화 데이터셋 노이즈 축소 방법

김담린, 김보은, 장영진, 김학수

http://doi.org/10.5626/JOK.2024.51.1.34

문서 기반 대화는 주어진 문서를 기반으로 두 명 이상으로 구성된 화자가 주고받는 대화를 말한다. 문서 기반 대화 시스템은 대화의 마지막 발화에 대한 응답을 생성하는 작업으로, 다양한 영어권 문서 기반 대화 데이터셋이 공개되면서 활발히 연구되고 있다. 한국어의 경우 한국어 문서 기반 대화 데이터셋의 부재로 인해 활발한 연구가 이루어지지 않고 있었으나, 최근 영어 문서 기반 대화 데이터셋 Doc2dial을 한국어로 번역한 KoDoc2dial이 공개되었다. 하지만 KoDoc2Dial은 번역 과정에서 발생한 노이즈를 그대로 포함하고 있다. 노이즈가 포함된 데이터셋은 학습과 시스템 일관성 측면에 부정적인 영향을 끼칠 수 있기 때문에 KoDoc2Dial 또한 존재하는 노이즈를 줄이기 위한 노력이 필요하다. 따라서 본 논문에서는 역번역 프로세스를 이용한 필터링을 통해 KoDoc2Dial에 포함된 노이즈를 줄이기 위한 방법을 제안하고자 한다. 실험을 통해 본 논문에서 제안하는 방법이 필터링 적용 전과 비교하여 SacreBLEU 기준 약 3.6의 성능 향상이 있음을 보였다.

2단계 학습을 통한 Span Matrix 기반 정답 후보군 탐지 모델

김보은, 장영진, 김학수

http://doi.org/10.5626/JOK.2021.48.5.539

데이터 자동 구축이란 알고리즘이나 심층 신경망 등을 통해 데이터를 자동으로 구축하는 기술을 의미한다. 본 논문에서 목표로 하는 질의응답 데이터 자동 구축 시스템은 질문 생성 모델을 통해 주로 연구되었으며, 이는 주어진 단락과 관련된 질문을 생성하는 모델을 의미한다. 기존에는 질문 생성 모델에 단락과 정답 후보를 입력하여 이와 관련된 질문을 생성했으며, 질문 생성 모델에 입력되는 정답 후보는 규칙 기반 방법이나 심층 신경망을 이용한 방법 등을 통해 탐지되었다. 본 논문에서는 질문 생성의 하위 작업인 정답 탐지가 질문 생성에 큰 영향을 줄 것으로 판단했고, Span Matrix를 이용한 정답 후보군 탐지 모델 및 2단계 학습 방법을 제안했다. 다양한 정답 후보 추출 방법을 통해 생성한 질문이 질의응답 시스템에 어떤 영향을 주는지 알아보기 위한 실험을 진행했다. 제안 모델은 기존 모델에 비해 많은 수의 정답을 추출했으며, 개체명 데이터셋을 활용함으로써 학습 과정의 노이즈를 보완했다. 이를 통해 제안 모델이 추출한 정답 후보로 생성한 질의응답 데이터가 질의응답 시스템의 성능에 가장 크게 기여하는 것을 확인했다.

3차원 동영상의 시각 주의 확률 모델 도출 및 시각 주의 기반 입체감 추정

김보은, 송원석, 김태정

http://doi.org/

시청자들은 영상을 시청할 때 화면상 시각이 집중된 곳 주변의 정보를 영향력 있게 받아들일 가능성이 크다. 이러한 사실을 이용하여 최근 연구들은 시각 주의 모델을 영상 제작 및 평가 방법에 이용하고 있다. 본 연구에서는 실제로 사람들의 시각 주의도가 어떠한 인자에 영향을 많이 받는지, 또 시각 주의 모델은 구체적으로 어떠한 형태가 되는지를 통계적 실험 계획법을 이용하여 추정하였다. 분산 분석법을 이용하여 속도, 화면으로부터의 거리, 비초점흐림 정도가 시각 주의에 영향을 미치는 유의한 인자인 것을 확인하였고 반응 표면 계획법을 이용하여 이 세가지 인자들에 따른 시각 주의 점수 모델을 도출하였다. 이 시각 주의 점수 모델로부터 영상 각 픽셀의 시각 주의 확률을 구하였다. 본 연구의 뒷부분에서는 시각주의 확률 모델을 기존의 기울기(gradient) 기반 3차원 영상의 입체감 측정법에 적용하는 방법을 제안하였다. 화면 상에서 시선을 집중할 확률이 큰 부분에 높은 비중을 둠으로써 기존의 방법 보다 시청자가 느끼는 입체감을 더욱 정확하게 측정할 수 있도록 하였다. 제안한 방법의 성능을 검증하기 위해 주관적 평가를 실시하여 피실험자들이 느끼는 입체감과 제안된 방법으로부터 도출한 결과를 비교하였다. 실험 결과 제안한 방법이 기존의 방법에 비해 성능이 높은 것을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr