검색 : [ keyword: Unsupervised learning ] (4)

비지도 기계 번역을 이용한 채팅체 문체 변환

정영준, 이창기, 황정인, 노형종

http://doi.org/10.5626/JOK.2023.50.1.19

문체 변환(style transfer)은 소스 문체(source style)로 쓰여진 텍스트가 주어지면 내용(content)을 유지하면서 타겟 문체(target style)의 텍스트를 생성하는 작업이다. 일반적으로 내용은 불변성(invariance), 문체는 가변성(variance)이라고 가정하여 텍스트의 문체를 변환하게 된다. 하지만, 채팅체의 경우 기존의 문체 변환 모델로 학습이 잘 안 되는 문제가 있다. 본 논문에서는 비지도 기계 번역(unsupervised machine translation)을 이용한 문체 변환 모델을 사용하여 채팅체를 문어체로 변환하는 방법을 제안한다. 또한, 변환된 결과를 활용하여 문체 변환에 사용될 수 있는 문체 간 단어 변환 사전을 구축할 수 있음을 보인다. 추가로, 변환된 결과 쌍에 대해 잘 변환된 결과만 사용할 수 있도록 필터링 방법을 적용하고, 필터링 된 결과를 이용한 지도 학습 방법으로 문체 변환 모델을 학습하여 변환 결과가 개선됨을 보인다.

지식베이스로부터 자연어 문장 생성을 위한 노이즈 추가 기법

권성구, 박세영

http://doi.org/10.5626/JOK.2020.47.10.965

지식베이스로부터 자연어 문장 생성이란 지식베이스 내 트리플을 입력하여 트리플이 내포하고 있는 정보, 즉 개체와 각 개체간의 관계를 포함하고 있는 자연어 문장을 생성하는 작업이다. 해당 작업을 심층신경망 방식으로 해결하기 위해서는 많은 트리플과 자연어 문장 쌍으로 구성된 학습데이터가 필요하다. 하지만 이와 같은 공개 된 한국어 학습데이터는 존재하지 않기 때문에 학습에 어려움을 겪고 있다. 본 논문에서는 이러한 학습 데이터 부족 문제를 해결하기 위하여 한국어 위키피디아 문장 데이터를 기반으로 핵심어를 추출한 뒤, 노이즈 추가 기법을 이용해 학습 데이터를 생성하는 비지도 학습 방법을 제안한다. 제안 모델을 평가하기 위하여 사람이 직접 제작한 트리플과 자연어 문장 쌍 정답 데이터를 이용하여 평가를 수행하였다. 자동 평가와 수동 평가 결과, 노이즈 추가 기법을 이용한 자연어 문장 생성 모델이 기존 비지도 학습 데이터를 이용한 모델보다 여러 측면에서 높은 성능을 보였다.

비디오 영상의 비지도 영상 정합을 이용한 파랑 이동 속도 추정

김진아, 김재일, 신성원

http://doi.org/10.5626/JOK.2019.46.12.1296

본 논문은 대용량 비디오 영상에서 파랑 추적을 통한 파랑 이동 속도 추정을 위하여 비지도 학습 기반 영상 정합 기술을 소개한다. 연안에서 파랑은 자체의 높은 비선형성과 비선형 상호작용에 의한 높은 복잡도, 그리고 센서 기반 관측의 어려움으로 물리 방정식을 이용한 파랑 이동 속도의 정확한 추정이 어렵다. 본 연구에서 제안하는 방법은 연안 비디오 영상을 이용한 다양한 비선형 파랑 거동에 대한 학습을 통하여 파랑을 정확히 추적함으로써 파랑의 이동 속도를 계산할 수 있다. 오토인코더를 이용하여 주변광 등 외부 요인이 제거된 파랑 이동 장면 영상을 추출하고, 이로부터 시-공간 비선형 영상 정합을 통해 파랑 추적에 대한 변위 벡터를 추출하여, 단위 시간에 대한 파랑의 이동 변위를 계산한다. 추정된 파랑이동 속도의 정확도 평가를 위해 실제 관측값과 기존 영상 처리 방법으로 추정된 값을 비교 분석하였다.

쥐 해마의 유전자 발현 그리드 데이터를 이용한 특징기반 유전자 분류 및 영역 군집화

강미선, 김혜련, 이석찬, 김명희

http://doi.org/

뇌의 유전자 발현 정보는 영역별 기능과 밀접한 관련이 있어 이를 분석하기 위해 다수의 유전자들 간의 발현 정도 및 발현 위치 정보와의 관계에 대한 연구가 이루어지고 있다. 본 논문에서는 컴퓨터 기술을 통해 알렌 뇌과학연구소에서 제공하는 약 2만여개의 쥐 뇌 유전자 발현 정보 중 뇌의 해마 영역을 중점적으로 분석하여 유전자들을 자동으로 분류해내고 발현 위치 정보를 기반으로 군집화하여 가시화하는 방법을 제안한다. 이를 통해 해마 내 전체적으로 발현되는 유전자들과 특정 영역에만 발현되는 유전자들을 분류할 수 있었고 그 중 특정 영역에 발현되는 유전자들의 위치정보 기반으로 군집화된 데이터를 뇌 지도와 함께 관찰 할 수 있었다. 본 연구는 뇌의 기능과 영역과의 관계성 관련 생물학적 연구를 위한 실험군 선정작업에 이용되어 실험설계시간을 줄일 수 있고 기존에 알려진 뇌의 해부학적 구조보다 더욱 세분화된 구조를 발견할 수 있는 가능성을 제시할 것으로 기대된다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr