기계 독해 성능 개선을 위한 데이터 증강 기법 


48권  12호, pp. 1298-1304, 12월  2021
10.5626/JOK.2021.48.12.1298


PDF

  요약

기계 독해(Machine Reading Comprehension)란 컴퓨터가 주어진 텍스트의 의미를 이해 및 이를 평가하는 방법으로, 자연어 이해를 위한 중요한 기술 중 하나이다. 주어진 글에 대해서 질의가 주어졌을 때, 이에 대한 올바른 응답을 찾는 질의-응답이 가장 대표적인 기계 독해 과제이다. 기계 독해 기술은 최근 심층 인공신경망 기반의 자연어 처리 기술의 발달에 따라 획기적인 성능 개선을 보였다. 그럼에도 불구하고, 주어진 데이터가 희소할 때 성능 개선에 어려움이 있을 수 있다. 이를 해결하기 위해 본 논문에서는 단어 단위 및 문장 단위의 텍스트 편집을 통한 데이터 증강 기법을 활용하여 기존 모델의 변경을 최소화하며 성능 개선을 하고자 한다. 즉, 본 연구에서는 영어 질의응답 데이터에서 가장 널리 활용되고 있는 사전 학습된 언어 모델 기반의 기계 독해 모델에 데이터 증강 기법을 적용하여 기존 모델 대비성능이 향상되는 것을 확인하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Lee, E. Choi, S. Jeong, J. Lee, "Data Augmentation Methods for Improving the Performance of Machine Reading Comprehension," Journal of KIISE, JOK, vol. 48, no. 12, pp. 1298-1304, 2021. DOI: 10.5626/JOK.2021.48.12.1298.


[ACM Style]

Sunkyung Lee, Eunseong Choi, Seonho Jeong, and Jongwuk Lee. 2021. Data Augmentation Methods for Improving the Performance of Machine Reading Comprehension. Journal of KIISE, JOK, 48, 12, (2021), 1298-1304. DOI: 10.5626/JOK.2021.48.12.1298.


[KCI Style]

이선경, 최은성, 정선호, 이종욱, "기계 독해 성능 개선을 위한 데이터 증강 기법," 한국정보과학회 논문지, 제48권, 제12호, 1298~1304쪽, 2021. DOI: 10.5626/JOK.2021.48.12.1298.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr