디지털 라이브러리[ 검색결과 ]
대용량 표준 말뭉치 구축을 위한 다수 형태소 분석 결과 통합 방법론
http://doi.org/10.5626/JOK.2020.47.6.596
최근 한국어 정보처리를 위한 대용량 언어분석 표준 말뭉치(GS: Gold Standard Set)를 구축하고, 이를 공유 · 확산하기 위한 국가차원의 지원이 이뤄지고 있다. 본 연구는 이러한 말뭉치 구축 사업의 일환으로, 현재 국내에서 개발된 다양한 한국어 언어분석 모듈을 활용하여 공통 정답셋 구축을 위한 방법론을 제안하고자 한다. 특히, 대량의 학습셋을 구축하기 위해 다수의 모듈(N-modules)로부터 제시된 후보정답을 참조, 오류 형태를 분류하여 주요 유형을 반자동으로 보정함으로써 수작업을 최소화하였다. 본 연구에서는 형태소 분석 모듈 적용 결과를 정규화하여 통합 포맷인 U-POS를 기반으로 대용량 한국어 언어분석 표준 말뭉치를 구축하였다. 본 연구를 통해 348,229 문장, 총 9,455,930 어절이 한국어 표준 말뭉치로 구축되었으며, 이는 차후에 한국어 정보처리를 위한 기초 학습자원으로 활용될 수 있다.
시맨틱 네트워크 구조를 기반으로 한 라이프로그로부터 페트리넷을 이용한 패턴추출
http://doi.org/10.5626/JOK.2020.47.6.553
최근 다양한 스마트 기기의 확산으로 여러 종류의 센서를 통해 사용자의 라이프로그 데이터가 자동으로 저장되고 있다. 그러나 스마트 기기로부터 수집된 라이프로그는 서로 다른 센서로부터 이질적인 정보를 자동으로 기록한다. 또한 사용자의 생활 패턴이 라이프로그의 서로 다른 판정 주기에 의해 결정되기 때문에 단순한 규칙 기반 시스템으로 정의하기 어렵다. 따라서 라이프로그로부터 유용한 생활 패턴을 추출하여 사용자에게 제공하기 위해서는 수많은 동적 요소들의 관계를 표현해야한다. 본 논문에서는 시맨틱 네트워크구조로 표현된 라이프로그로부터 페트리넷을 이용하여 사용자 생활 패턴을 자동으로 추출하는 방법을 제안한다. 제안하는 생활 패턴 추출 방법은 이질적으로 수집된 사용자 라이프로그의 의미관계를 나타내기 위해 의미구조를 정의하고 시맨틱 네트워크로 구조화한다. 또한 페트리넷 그래프를 이용하여 시간흐름에 따라 불규칙적으로 변화하는 라이프로그를 의학적 진단 항목을 기반으로 자동으로 판단하여 개인의 수면, 식사 생활패턴을 추출한다. 페트리넷은 스마트 기기 센서 데이터의 불확실성을 줄이고 생활 패턴의 다양성을 증가시킨다. 제안하는 방법의 유용성을 확인하기 위해 안드로이드 앱으로 수집한 65명의 라이프로그 데이터를 사용하여 실험을 진행하고 사용자의 수면, 식사 패턴에 따른 페트리넷의 패턴추출 정확도를 확인한다.
복수 메모리 타일을 가진 NoC 매니코어 플랫폼에서의 태스크-타일 바인딩 기술
NoC 아키텍쳐에서는 데이터의 통신이 한 채널에 집중되는 경우 경합이 일어나서 통신이 지연될 수 있다. 이러한 지연을 최소화시키는 것을 목표로 본 논문에서는 NoC 기반 매니코어 플랫폼에서 태스크 매핑이 완료된 이후, 매핑된 태스크들을 NoC 타일로 바인딩하기 위한 기법을 제안한다. 큰 규모의 플랫폼은 복수의 메모리 타일을 가질 수 있으므로 응용별로 사용하는 메모리를 다르게 하여 메모리별 부하를 분산시키기 위한 메모리 클러스터링 기법을 사용한다. 수행된 응용은 데이터플로우 기반으로 작성되어 있으므로 응용들의 통신 요구량에 대한 정보를 미리 알 수 있다고 가정한다. 이 정보를 바탕으로 본 논문에서는 여러 태스크를 동시에 바인딩하는 두개의 휴리스틱을 제안하였으며 각 휴리스틱은 적절한 메모리 클러스터링 기법을 활용한다. NoC 시뮬레이터를 이용한 실험을 통해 제안된 휴리스틱이 기존의 바인딩 휴리스틱에 비해 최대 25% 이상의 성능을 보이는 것을 확인하였다.