디지털 라이브러리[ 검색결과 ]
이진화 마스킹을 이용한 생성 이미지의 배경 인페인팅 성능 향상
http://doi.org/10.5626/JOK.2024.51.6.537
최근에 딥러닝분야에서 이미지 생성 기술은 빠르게 발전하고있다. 이미지를 가장 잘 표현할 수 있는 방법 중 하나는 텍스트 프롬프트를 이용해 이미지를 생성하는 기술이고, 이를 이용해 이미지를 생 성하는 모델의 성능은 매우 뛰어나다. 하지만 이미지에서 텍스트 프롬프트만으로 원하는 부분을 자연스럽게 바꾸는 것은 쉽지가 않은데 이는 전형적인 이미지 생성 모델의 문제점이라고 할 수 있다. 따라서 본 연구에서는 이미지의 각 영역에 대한 텍스트를 추출하고 이를 바탕으로 하여 이미지의 객체를 유지하면서 배경 영역을 자연스럽게 바꿔주는 배경 인페인팅 기술을 개발하였다. 특히 제안하는 이미지의 배경 변환 인페인팅 기법은 한 장의 이미지로의 변환뿐만 아니라 여러 장의 이미지로 빠르게 변환할 수 있는 장점을 가지고 있다. 텍스트 프롬프트 기반 이미지 스타일 변환을 통해 데이터가 부족한 분야에 적용한다면 이미지 증식을 통해 인공지능 모델의 성능을 향상시킬 수 있을 것이다.
성격유형별 문체 특성 기반 맞춤형 광고 메시지 자동생성 연구
http://doi.org/10.5626/JOK.2024.51.1.23
이 연구는 MBTI의 심리 기능지표 조합의 유형별 특징을 반영한 마케팅 문체 프레임워크를 정의하고 모델 학습을 통해 성격유형별 맞춤화 된 광고 메시지를 생성하는 것을 목적으로 한다. 광고 메시지 자동 생성 기술은 BART 모델에 성격유형을 Prefix로 포함한 광고문을 학습시켜 성격유형에 따라 맞춤형 광고 메시지를 생성하는 방식이다. 학습된 모델은 Prefix 조작만으로 MBTI 성격유형별 문체 특징을 갖춘 광고 메시지로 변환되는 것을 실험을 통해 확인할 수 있었다. 본 연구는 성격유형의 특징을 문체 프레임워크로써 정의하고 이에 기반한 모델 학습을 통해 유형별 문체 특징과 소구점을 포함한 광고 메시지를 생성했다는 기술적 가치가 있다. 본 연구는 마케팅 분야에서의 실무적 활용 가능성 뿐만 아니라 지역 및 언어 간 문체 차이를 구조화하거나 재현해야 하는 문제에서 기반이 되는 연구로 활용될 수 있다.
비지도 기계 번역을 이용한 채팅체 문체 변환
http://doi.org/10.5626/JOK.2023.50.1.19
문체 변환(style transfer)은 소스 문체(source style)로 쓰여진 텍스트가 주어지면 내용(content)을 유지하면서 타겟 문체(target style)의 텍스트를 생성하는 작업이다. 일반적으로 내용은 불변성(invariance), 문체는 가변성(variance)이라고 가정하여 텍스트의 문체를 변환하게 된다. 하지만, 채팅체의 경우 기존의 문체 변환 모델로 학습이 잘 안 되는 문제가 있다. 본 논문에서는 비지도 기계 번역(unsupervised machine translation)을 이용한 문체 변환 모델을 사용하여 채팅체를 문어체로 변환하는 방법을 제안한다. 또한, 변환된 결과를 활용하여 문체 변환에 사용될 수 있는 문체 간 단어 변환 사전을 구축할 수 있음을 보인다. 추가로, 변환된 결과 쌍에 대해 잘 변환된 결과만 사용할 수 있도록 필터링 방법을 적용하고, 필터링 된 결과를 이용한 지도 학습 방법으로 문체 변환 모델을 학습하여 변환 결과가 개선됨을 보인다.
표층 중립화 기반의 언어 스타일 전이
http://doi.org/10.5626/JOK.2020.47.2.162
감정과 같은 자연어 문장의 스타일을 전이하기 위해 해결할 문제는 문장의 스타일을 없애는 중립화와 중립화된 문장에 스타일을 입히는 작업이다. 기존 연구에서는 적대적 학습을 통해서 잠재 공간에서 중립화를 수행했다. 하지만 이런 방식은 원래의 내용을 유지하면서 스타일을 전이하는 것에 어려움을 겪는다. 본 논문에서는 잠재 공간에서가 아닌 표층 수준에서 스타일을 띄는 단어를 지우는 것으로 중립화를 수행하고 지운 단어들을 적절히 전이된 단어로 예측해 복구하는 2단계 언어 스타일 전이 방법을 제안한다. 이를 위해서 자기주의 기반 분류기의 히트맵과 단어 예측기를 활용한다. 제안 모델을 평가하기 위해서 Yelp와 Amazon 리뷰 데이터셋, 그리고 Caption 데이터셋을 활용해 스타일 전이 실험을 수행했다. 자동 평가와 사람 평가 결과, 제안 모델이 여러 측면에서 비교 모델보다 높은 성능을 보였다.