2단계 학습을 통한 Span Matrix 기반 정답 후보군 탐지 모델 


48권  5호, pp. 539-547, 5월  2021
10.5626/JOK.2021.48.5.539


PDF

  요약

데이터 자동 구축이란 알고리즘이나 심층 신경망 등을 통해 데이터를 자동으로 구축하는 기술을 의미한다. 본 논문에서 목표로 하는 질의응답 데이터 자동 구축 시스템은 질문 생성 모델을 통해 주로 연구되었으며, 이는 주어진 단락과 관련된 질문을 생성하는 모델을 의미한다. 기존에는 질문 생성 모델에 단락과 정답 후보를 입력하여 이와 관련된 질문을 생성했으며, 질문 생성 모델에 입력되는 정답 후보는 규칙 기반 방법이나 심층 신경망을 이용한 방법 등을 통해 탐지되었다. 본 논문에서는 질문 생성의 하위 작업인 정답 탐지가 질문 생성에 큰 영향을 줄 것으로 판단했고, Span Matrix를 이용한 정답 후보군 탐지 모델 및 2단계 학습 방법을 제안했다. 다양한 정답 후보 추출 방법을 통해 생성한 질문이 질의응답 시스템에 어떤 영향을 주는지 알아보기 위한 실험을 진행했다. 제안 모델은 기존 모델에 비해 많은 수의 정답을 추출했으며, 개체명 데이터셋을 활용함으로써 학습 과정의 노이즈를 보완했다. 이를 통해 제안 모델이 추출한 정답 후보로 생성한 질의응답 데이터가 질의응답 시스템의 성능에 가장 크게 기여하는 것을 확인했다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

B. Kim, Y. Jang, H. Kim, "A Span Matrix-based Answer Candidates Detection Model used 2-Step Learning," Journal of KIISE, JOK, vol. 48, no. 5, pp. 539-547, 2021. DOI: 10.5626/JOK.2021.48.5.539.


[ACM Style]

Boeun Kim, Youngjin Jang, and Harksoo Kim. 2021. A Span Matrix-based Answer Candidates Detection Model used 2-Step Learning. Journal of KIISE, JOK, 48, 5, (2021), 539-547. DOI: 10.5626/JOK.2021.48.5.539.


[KCI Style]

김보은, 장영진, 김학수, "2단계 학습을 통한 Span Matrix 기반 정답 후보군 탐지 모델," 한국정보과학회 논문지, 제48권, 제5호, 539~547쪽, 2021. DOI: 10.5626/JOK.2021.48.5.539.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr