지식베이스로부터 자연어 문장 생성을 위한 노이즈 추가 기법 


47권  10호, pp. 965-973, 10월  2020
10.5626/JOK.2020.47.10.965


PDF

  요약

지식베이스로부터 자연어 문장 생성이란 지식베이스 내 트리플을 입력하여 트리플이 내포하고 있는 정보, 즉 개체와 각 개체간의 관계를 포함하고 있는 자연어 문장을 생성하는 작업이다. 해당 작업을 심층신경망 방식으로 해결하기 위해서는 많은 트리플과 자연어 문장 쌍으로 구성된 학습데이터가 필요하다. 하지만 이와 같은 공개 된 한국어 학습데이터는 존재하지 않기 때문에 학습에 어려움을 겪고 있다. 본 논문에서는 이러한 학습 데이터 부족 문제를 해결하기 위하여 한국어 위키피디아 문장 데이터를 기반으로 핵심어를 추출한 뒤, 노이즈 추가 기법을 이용해 학습 데이터를 생성하는 비지도 학습 방법을 제안한다. 제안 모델을 평가하기 위하여 사람이 직접 제작한 트리플과 자연어 문장 쌍 정답 데이터를 이용하여 평가를 수행하였다. 자동 평가와 수동 평가 결과, 노이즈 추가 기법을 이용한 자연어 문장 생성 모델이 기존 비지도 학습 데이터를 이용한 모델보다 여러 측면에서 높은 성능을 보였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Kwon and S. Park, "Noise Injection for Natural Language Sentence Generation from Knowledge Base," Journal of KIISE, JOK, vol. 47, no. 10, pp. 965-973, 2020. DOI: 10.5626/JOK.2020.47.10.965.


[ACM Style]

Sunggoo Kwon and Seyoung Park. 2020. Noise Injection for Natural Language Sentence Generation from Knowledge Base. Journal of KIISE, JOK, 47, 10, (2020), 965-973. DOI: 10.5626/JOK.2020.47.10.965.


[KCI Style]

권성구, 박세영, "지식베이스로부터 자연어 문장 생성을 위한 노이즈 추가 기법," 한국정보과학회 논문지, 제47권, 제10호, 965~973쪽, 2020. DOI: 10.5626/JOK.2020.47.10.965.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr