프롬프트 엔지니어링 기반 한글 OCR 오류 교정 및 텍스트 손상 복원 


52권  11호, pp. 940-947, 11월  2025
10.5626/JOK.2025.52.11.940


PDF

  요약

광학 문자 인식(OCR)은 이미지 내 텍스트를 기계가 읽을 수 있도록 변환하는 기술로, 문서 관리가 중요한 산업에서 널리 활용된다. 그러나 한글은 자모가 결합된 복잡한 구조로 인해 인식 정확도가 낮으며, 이를 개선하려면 11,172개의 완성형 글자를 포함하는 방대한 데이터셋이 필요하다. 또한, 띄어쓰기, 맞춤법 오류뿐만 아니라 문자 왜곡과 손상 등의 오류 패턴이 존재해 기존 맞춤법 검사 모델을 활용한 후처리가 어렵다. 이를 해결하기 위해 본 논문에서는 초거대 언어 모델을 활용한 퓨샷 학습과 프롬프트 엔지니어링을 제안한다. 연구 결과, 기본 프롬프트 대비 오류 교정 정확도가 최대 18.18% 향상되었으며, 텍스트 손상 복원과 띄어쓰기 오류 교정에서도 각각 21.6%, 17.26%의 성능 개선이 확인되었다. 이는 적은 예시만으로도 한글 OCR 오류를 효과적으로 교정하고 손상된 텍스트를 복원할 수 있음을 입증한다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

S. Park, H. Lee, S. Choi, "Prompt Engineering for Korean OCR Error Correction and Text Damage Restoration," Journal of KIISE, JOK, vol. 52, no. 11, pp. 940-947, 2025. DOI: 10.5626/JOK.2025.52.11.940.


[ACM Style]

Suhyun Park, Hyojin Lee, and Sung-Pil Choi. 2025. Prompt Engineering for Korean OCR Error Correction and Text Damage Restoration. Journal of KIISE, JOK, 52, 11, (2025), 940-947. DOI: 10.5626/JOK.2025.52.11.940.


[KCI Style]

박수현, 이효진, 최성필, "프롬프트 엔지니어링 기반 한글 OCR 오류 교정 및 텍스트 손상 복원," 한국정보과학회 논문지, 제52권, 제11호, 940~947쪽, 2025. DOI: 10.5626/JOK.2025.52.11.940.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr