디지털 라이브러리[ 검색결과 ]
BERT 기반 2단계 분류 모델과 Co-Attention 메커니즘을 이용한 치매와 조현병 관련 질병 진단
http://doi.org/10.5626/JOK.2022.49.12.1071
최근 환자가 많이 증가함에 따라 사회적 문제를 야기하는 치매와 조현병 진단을 위한 모델을 제안한다. 의사와 내담자의 대화 음성 시료를 전사 작업한 스크립트를 이용해 치매와 조현병의 세부적인 분류를 시도하였다. 두 단계 과정으로 분류를 진행하는 2단계 분류 모델과 Co-Attention 메커니즘을 이용한 분류 모델을 제안하였다. 2단계 분류 모델은 정상군과 환자군 각각의 발화에서 계산되는 perplexity 차이에 기반한 분류와 미세 조정한 BERT 모델을 이용한 분류의 통합을 시도한 모델이다. Co-Attention 메커니즘을 이용한 분류 모델은 의사와 내담자 발화를 분리해 각 발화에 대해 표상을 구하고, 이를 바탕으로 표상 간의 어텐션 가중치 공유를 통해 분류하는 모델이다. BERT 모델을 미세 조정하여 분류를 시도한 Baseline 모델과의 F1 점수 비교를 통해 2단계 분류 모델은 7개 분류 태스크 중 4개의 태스크에서 성능 향상을 확인 하였고, Co-Attention 메커니즘 모델은 8개 분류 태스크 중 4개의 태스크에서 가장 높은 F1 점수를 보인 것을 확인하였다.
메타버스 내 사용자 신원 증명을 위한 대체 불가능 토큰 기반 가상 아바타: 가상현실 내 사회적 상호작용을 중심으로
http://doi.org/10.5626/JOK.2022.49.11.1032
메타버스 내 익명성은 여러 제약으로부터 사용자를 자유롭게 하지만, 상호작용의 질을 저해하는 원인이기도 하다. 상기 문제점은 사용자 식별을 통해 보안할 수 있지만, 현재는 보안에 취약하며 위조 및 변도에 대응하기 어려운 개인 식별 번호(Personal Identification Number, PIN)나 보안 패턴을 사용한다는 점에서 개선이 요구된다. 본 연구에서는 블록체인 기반의 대체 불가능 토큰(Non-Fungible Token, NFT)과 사용자의 외모/개인정보가 결합된 신원 증명 수단 생성 방법론을 제안한다. 이를 통해 실제 외모와 개인정보가 반영된 NFT 아바타(NFT-based avatar)를 생성하고, 31명을 대상으로 생성된 아바타에 대한 사용자 평가를 수행하였다. 사용자 평가 결과 NFT-based avatar와 사회적 상호작용을 수행하는 경우 기존 아바타에 비해 더 높은 신뢰도, 공존감, 긍정적인 반응이 형성됨을 확인했다. 본 연구는 NFT를 기반으로 하는 신원 증명된 아바타 제작 방법론을 제안했다는 점과 그 효용을 확인했다는 점에서 의의가 있다.
사전 학습 언어 모델의 미세 튜닝을 활용한 버그 담당자 추천 기법
http://doi.org/10.5626/JOK.2022.49.11.987
최근 소프트웨어의 규모와 복잡성이 지속해서 증가하고 있으며, 이는 다양한 버그를 유발하고 있다. 이에 따라 체계적 버그 관리의 필요성이 지속해서 제기되고 있다. 산업계에서는 다수의 연구들은 단어 기반의 학습 모델을 이용하여 버그 담당자 배정을 자동화하는 방법을 제시하였다. 하지만 이들은 대체로 단어 맥락 미고려, 클래스 개수 과다 등의 요인으로 정확도가 만족스럽지 못한 성능을 보인다. 본 논문에서는 BERT 및 이를 기반으로 한 RoBERTa, DeBERTa, CodeBERT등을 기반으로 사전 학습 언어 모델을 파인 튜닝하여 Top-10 정확도 기준 약 27%p의 정확도 향상을 이루어 냈으며, 결과적으로 약 70%의 정확도를 보이는 것을 실험을 통해 확인하였다. 이를 통해 파인 튜닝된 사전 학습 언어 모델 기반의 접근 방법이 버그 담당자 배정 자동화 문제에 효과적으로 적용될 수 있음을 보였다.
그래프와 트리 구조를 활용한 한국어 문장제 수학 문제 풀이의 성능개선 연구
http://doi.org/10.5626/JOK.2022.49.11.972
선행 연구에서 영어 문장제 수학 문제를 해결하려 한 다양한 시도가 있었다. 많은 연구에서 Sequence-to-Sequence(이하 Seq2seq) 패러다임을 넘어선 트리, 그래프 등의 구조를 도입하여 개선된 성능을 달성할 수 있었다. 하지만 한국어 문장제 수학 문제 풀이 연구에서는 트리(Tree)나 그래프(Graph)등으로 제안된 구조를 활용한 모델 사례가 없다. 이에 본 논문에서는 한국어 사전학습 언어모델을 사용하여 트리 구조를 활용하는 모델, 트리와 그래프 구조를 함께 활용하는 모델에 대한 한국어 문장제 수학 문제풀이 능력의 가능성을 검토해보고자 한다. 테스트 결과 그래프와 트리 구조를 도입함으로써 Seq2seq 구조의 모델 대비 약 20%의 정확도 향상을 보였고, 나아가 한국어 사전학습 언어모델을 사용한 것이 사용하지 않은 것 대비 4.66~5.96%의 정확도 향상을 보였다.
군집 로봇 운용을 위한 상위 수준 프로그래밍 언어 조사
http://doi.org/10.5626/JOK.2022.49.11.936
다양한 분야에서 작업을 무인화하는 데에 사용하는 로봇은 단일 개체로만 사용하기 보다는 여러 개의 로봇을 운용하는 방향으로 발전하고 있다. 군집 로봇 (Swarm Robotics)은 다수의 로봇을 협동제어를 통해 단일 로봇 이상의 성능을 내는 것을 목표로 로봇 간의 협력을 통해 생존자 수색이나 지역 지도 작성과 같은 작업을 효율적으로 수행할 수 있다. 이러한 군집 로봇 시스템을 개발하고 운용하는 것은 숙련된 개발자를 필요로 하기 때문에 비전문가가 군집 로봇 운용을 쉽게 명세하고 운용할 수 있도록 지원하는 프로그래밍 언어 및 프레임워크가 개발되고 있다. 본 논문에서는 지금까지 연구가 이루어진 여러 상위 수준 군집 로봇 운용 명세 언어 중 실제 로봇이나 시뮬레이션을 통해 실행을 검증한 11개 언어를 선정하여, 이에 대해 간략하게 소개한다. 또한, 소프트웨어 및 군집 로봇 운용 관점에서 대상 언어들의 차이점을 비교하고, 현재까지 개발된 군집 운용 언어의 한계와 향후 과제를 논의한다.
의료 과학 연구를 위한 설명가능 그래프 인공 신경망
http://doi.org/10.5626/JOK.2022.49.11.999
설명가능 인공지능(Explainable AI, XAI)은 알고리즘의 예측 결과를 사용자 관점에서 이해할 수 있도록 설명력을 제공하는 기술이다. 의료 분야는 인공지능의 의사결정에 대한 신뢰도가 보장되어야 하므로, 의사 결정의 도출 과정을 설명하는 XAI의 활용이 필수적이다. 하지만 대부분의 XAI 기술은 이미지나 텍스트 데이터를 대상으로 개발되었기 때문에 다양한 상호작용을 기반으로 하는 그래프 구조의 의료 데이터에 그대로 적용하기에는 한계가 존재한다. 따라서 데이터의 복잡한 관계성을 효과적으로 파악할 수 있는 그래프 인공 신경망(Graph Neural Network, GNN) 기반의 XAI 연구가 요구되고 있다. 본 논문에서는 GNN 기반 XAI 기술의 적용 방식과 알고리즘에 따른 분류 체계를 제안하고, 의료 분야의 네 가지 세부 영역에서 XAI를 활용한 연구 동향과 사례를 소개한다. 마지막으로 생명 의료 분야에 적용된 XAI 연구의 한계점과 향후 발전 방향을 제시한다.
외부 지식의 정형화와 멀티 태스크 학습을 통한 지식 선택 모델
http://doi.org/10.5626/JOK.2022.49.10.884
목적 지향 대화 시스템은 사용자의 질문에 적절한 응답을 생성하기 위해서 체계적으로 구축된 데이터베이스 형태의 외부 지식을 활용한다. 그러나 더욱 적절하고 유창한 응답을 생성하기 위해서 웹 데이터 또는 FAQs와 같은 비정형 텍스트 형태의 외부 지식을 활용할 수 있어야 한다. 본 논문에서는 사전 훈련된 언어모델과 그래프 신경망을 멀티 태스크 학습 방법을 통해 효과적으로 결합한 비정형 텍스트 형태의 외부 지식을 활용하는 목적 지향 대화 시스템을 위한 지식 선택 모델을 제안한다. 제안 모델은 언어정보를 해석하는 능력뿐만 아니라 의존 구문 분석기를 통해 정형화된 외부 지식으로부터 잠재된 구조적 정보를 파악하여 시스템이 외부 지식을 효과적으로 선택할 수 있다. 실험 결과 제안 모델은 사전 학습된 크로스-인코더(cross-encoder)와 바이-인코더(bi-encoder)구조의 언어모델보다 의미 있는 성능 향상을 보였다.
데이터 생성 및 증강 기반의 개체 그래프를 활용한 음성 대화용 대화 상태 추적 모델
http://doi.org/10.5626/JOK.2022.49.10.891
대화 상태 추적은 목적 지향 대화 시스템의 한 부분으로, 대화를 이해하고 사용자의 목적을 이해하기 위해 수행되어야 하는 작업이다. 최근 Dialogue System Track Challenge (DSTC) 10 트랙2는 이를 음성 대화 환경으로 확장하여 음성 발화에 대한 대화 상태 추적 모델의 강건성을 주제로 진행되었다. 트랙2에서 공개한 평가 데이터는 새로운 시나리오의 등장, 3배 많은 개체 수 그리고 음성 인식된 발화로 이루어진 대화라는 특징을 가지고 있다. 본 논문에서는 이러한 데이터에도 강건한 개체 그래프를 활용한 추출 방식의 대화 상태 추적 모델과 새로운 시나리오에 대한 대화 데이터 생성 및 대화 익명화 방식을 활용한 증강 방법을 제안한다. DSTC10 평가 데이터에 대한 평가 결과 베이스라인 모델과 비교했을 때 Joint Goal Accuracy (JGA)와 Slot Accuracy에서 각각 1.7%, 0.57%의 성능 향상이 있음을 확인하였다.
블록체인 기반의 지리 공간 포인트 데이터 인덱싱을 위한 공간 LSM 트리
http://doi.org/10.5626/JOK.2022.49.10.898
블록체인 기술은 IoT, 헬스케어 등 다양한 분야에서 높은 활용도로 주목받으며, 분산 데이터베이스에 대한 대안으로도 활용되고 있다. 블록체인에 대한 높은 활용성에도 불구하고, 블록체인 기반의 지리 공간 데이터를 효율적으로 인덱싱하는 기법은 지금까지 많은 연구가 진행되지 않았다. 이에 본 논문에서는 블록체인의 쓰기-집중적인(write-intensive) 특성을 반영하여 지리 공간 포인트 데이터의 블록을 블록체인에 삽입 시 I/O 비용을 감소시키는 공간 LSM 트리 인덱싱 기법을 제안한다. 제안 기법은 실시간으로 대량의 업데이트가 발생하는 블록체인 상에서 지리 공간 데이터를 Geohash를 통해 선형화하고, 데이터간의 공간적 인접성을 고려하여 데이터 삽입 및 범위 질의 처리 시 I/O 비용을 최소화한다. 또한, 지리 공간 포인트 데이터 범위 질의 처리 시 공간 LSM 트리에 대한 불필요한 탐색을 줄이기 위한 공간 필터를 제안한다.
대규모 결측 영역에 강인한 Super Resolution 기반 Image Inpainting
http://doi.org/10.5626/JOK.2022.49.9.708
Image Inpainting은 이미지의 누락된 영역을 그럴듯한 이미지로 채우는 기법이다. 최근 딥러닝의 도입으로 인해 복원 성능이 크게 향상되었으나 누락된 영역이 클 경우, 복잡한 장면을 담고 있는 경우, 그리고 고해상도일 경우에는 부자연스러운 복원 결과를 얻는다. 본 논문에서는 고해상도 이미지보다 저해상도 이미지에서 복원이 더 잘 된다는 점을 활용하여 Super Resolution 기반의 2단계 Image Inpainting 기법을 제안한다. 첫 번째 단계에서 고해상도 이미지를 저해상도로 변환하여 복원을 수행하고, 두 번째 단계에서 Super Resolution 모델을 통해 원래의 고해상도로 복원한다. 제안하는 기법의 효과를 검증하기 위해 고해상도의 Urban100 데이터셋을 사용하여 정량 및 정성 평가를 수행하였다. 또한, 누락된 영역의 크기에 따른 복원 성능을 분석하고, 제안하는 기법이 자유로운 형태의 마스크에서 만족할 만한 복원 결과를 생성할 수 있음을 입증하였다.