군집 알고리즘과 NSP를 이용한 문서 단위 기계 번역 데이터 증강 


50권  5호, pp. 401-406, 5월  2023
10.5626/JOK.2023.50.5.401


PDF

  요약

최근 전체 문서의 문맥을 파악해 자연스러운 번역을 하기 위한 문서 단위 기계 번역 연구가 활발히 이루어지고 있다. 문서 단위 기계 번역 모델의 학습을 위해서 문장 단위 기계 번역 모델과 마찬가지로 많은 양의 학습 데이터가 필요로 하지만 대량의 문서 단위 병렬 코퍼스를 구축하는 데 큰 어려움이 있다. 따라서 본 논문에서는 문서 단위 병렬 코퍼스 부족 현상을 개선하기 위해서 문서 단위 기계 번역에 효과적인 데이터 증강 기법을 제안한다. 실험 결과, 문맥이 없는 문장 단위 병렬 코퍼스에 군집 알고리즘과 NSP를 이용한 데이터 증강 기법을 적용하여 문서 단위 기계 번역의 성능을 데이터 증강 기법 적용 전에 비해 S-BLEU 3.0, D-BLEU 2.7 향상할 수 있었다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

D. Kim and C. Lee, "Document-level Machine Translation Data Augmentation Using a Cluster Algorithm and NSP," Journal of KIISE, JOK, vol. 50, no. 5, pp. 401-406, 2023. DOI: 10.5626/JOK.2023.50.5.401.


[ACM Style]

Dokyoung Kim and Changki Lee. 2023. Document-level Machine Translation Data Augmentation Using a Cluster Algorithm and NSP. Journal of KIISE, JOK, 50, 5, (2023), 401-406. DOI: 10.5626/JOK.2023.50.5.401.


[KCI Style]

김도경, 이창기, "군집 알고리즘과 NSP를 이용한 문서 단위 기계 번역 데이터 증강," 한국정보과학회 논문지, 제50권, 제5호, 401~406쪽, 2023. DOI: 10.5626/JOK.2023.50.5.401.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr