검색 : [ author: Tae-Young Kim ] (2)

대용량 표준 말뭉치 구축을 위한 다수 형태소 분석 결과 통합 방법론

김태영, 류법모, 김한샘, 오효정

http://doi.org/10.5626/JOK.2020.47.6.596

최근 한국어 정보처리를 위한 대용량 언어분석 표준 말뭉치(GS: Gold Standard Set)를 구축하고, 이를 공유 · 확산하기 위한 국가차원의 지원이 이뤄지고 있다. 본 연구는 이러한 말뭉치 구축 사업의 일환으로, 현재 국내에서 개발된 다양한 한국어 언어분석 모듈을 활용하여 공통 정답셋 구축을 위한 방법론을 제안하고자 한다. 특히, 대량의 학습셋을 구축하기 위해 다수의 모듈(N-modules)로부터 제시된 후보정답을 참조, 오류 형태를 분류하여 주요 유형을 반자동으로 보정함으로써 수작업을 최소화하였다. 본 연구에서는 형태소 분석 모듈 적용 결과를 정규화하여 통합 포맷인 U-POS를 기반으로 대용량 한국어 언어분석 표준 말뭉치를 구축하였다. 본 연구를 통해 348,229 문장, 총 9,455,930 어절이 한국어 표준 말뭉치로 구축되었으며, 이는 차후에 한국어 정보처리를 위한 기초 학습자원으로 활용될 수 있다.

시맨틱 네트워크 구조를 기반으로 한 라이프로그로부터 페트리넷을 이용한 패턴추출

김태영, 조성배

http://doi.org/10.5626/JOK.2020.47.6.553

최근 다양한 스마트 기기의 확산으로 여러 종류의 센서를 통해 사용자의 라이프로그 데이터가 자동으로 저장되고 있다. 그러나 스마트 기기로부터 수집된 라이프로그는 서로 다른 센서로부터 이질적인 정보를 자동으로 기록한다. 또한 사용자의 생활 패턴이 라이프로그의 서로 다른 판정 주기에 의해 결정되기 때문에 단순한 규칙 기반 시스템으로 정의하기 어렵다. 따라서 라이프로그로부터 유용한 생활 패턴을 추출하여 사용자에게 제공하기 위해서는 수많은 동적 요소들의 관계를 표현해야한다. 본 논문에서는 시맨틱 네트워크구조로 표현된 라이프로그로부터 페트리넷을 이용하여 사용자 생활 패턴을 자동으로 추출하는 방법을 제안한다. 제안하는 생활 패턴 추출 방법은 이질적으로 수집된 사용자 라이프로그의 의미관계를 나타내기 위해 의미구조를 정의하고 시맨틱 네트워크로 구조화한다. 또한 페트리넷 그래프를 이용하여 시간흐름에 따라 불규칙적으로 변화하는 라이프로그를 의학적 진단 항목을 기반으로 자동으로 판단하여 개인의 수면, 식사 생활패턴을 추출한다. 페트리넷은 스마트 기기 센서 데이터의 불확실성을 줄이고 생활 패턴의 다양성을 증가시킨다. 제안하는 방법의 유용성을 확인하기 위해 안드로이드 앱으로 수집한 65명의 라이프로그 데이터를 사용하여 실험을 진행하고 사용자의 수면, 식사 패턴에 따른 페트리넷의 패턴추출 정확도를 확인한다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr