검색 : [ keyword: MAC ] (115)

순환 신경망 기반 소프트웨어 신뢰성 추정 모델의 정확성 및 안정성 비교 분석 연구

김태현, 류덕산, 백종문

http://doi.org/10.5626/JOK.2023.50.8.688

순환 신경망 기반 소프트웨어 신뢰성 추정에 관한 기존 연구들은 순환 신경망을 이용하여 동일한 조건에서 하나의 모델을 생성하고 그 모델의 정확성을 평가하였다. 하지만 순환 신경망은 인공 신경망의 무작위성으로 인해 같은 조건에서도 모델의 훈련 결과를 다르게 생성할 수 있으며 이는 부정확한 소프트웨어 신뢰성 추정을 초래할 수 있다. 따라서 본 논문에서는 어떤 순환 신경망이 소프트웨어 신뢰성을 더 안정적이고 정확하게 추정하는지 비교 분석하고 그 결과를 제시한다. 이를 위해 3개의 대표적인 순환신경망을 이용하여 8개의 실제 프로젝트에서 소프트웨어 신뢰성을 추정하고 정확성과 안정성 측면에서 모델들의 성능을 비교 분석하였다. 그 결과 Long Short Term Memory가 가장 안정되고 정확한 소프트웨어 신뢰성 추정 성능을 보임을 확인하였다. 본 논문을 통해 우리는 보다 정확하고 안정된 소프트웨어 신뢰성 추정 모델을 선택할 수 있기를 기대한다.

Mini-Batching with Similar-Length Sentences to Quickly Train NMT Models

Daniela N. Rim, Richard Kimera, Heeyoul Choi

http://doi.org/10.5626/JOK.2023.50.7.614

Transformer 모델은 Neural Machine Translation과 같은 자연 언어 처리 작업에 혁명을 일으켰고, 아키텍처 연구에 많은 노력을 통해 효율성과 정확성을 높여왔다. 개선을 위한 잠재적인 영역 중 하나는 Transformer가 사용하지 않을 빈 토큰의 계산 횟수를 줄여 불필요한 계산 부담을 줄이는 것이다. 계산 부담을 줄이는 방법으로, 우리는 데이터 로더에서 mini-batch 를 만들기 전에, 길이에 따라 번역 문장 쌍을 정렬한 뒤 유사한 길이의 문장들로 mini-batch 를 구성함으로써 계산 능력의 낭비를 최소화하는 방법을 제안한다. 이때, 정렬의 양은 독립적이고 동일하게 분포 된 (i.i.d) 데이터 가정을 위반 할 수 있으므로 부분 정렬한다. 실험에서 영어-한국어 및 영어-루간다 언어 쌍에 적용하여 기계 번역을 수행했고, 번역 성능을 유지하면서 계산 시간에 이득이 있음을 확인했다. 제안된 방법은 모델 구조와 독립적이여서 다양한 길이를 갖는 데이터로부터 학습하는 경우에 쉽게 사용될 수 있다.

문장의 의미적 유사도와 정보량을 사용한 다중 문서 요약

임연수, 권성구, 김봉민, 박성배

http://doi.org/10.5626/JOK.2023.50.7.561

간결한 형식으로 정보를 전달하는 문서 요약 기술은 최근 자연어처리 분야의 중요한 과제로 떠오르고 있다. 하지만, 여러 문서가 주어질 때 이들의 정보를 파악하고 요약하는 다중 문서 요약은 학습에 적합한 데이터가 부족해 연구에 어려움이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 단일 문서에 대한 요약문을 생성한 뒤 요약문을 후처리하는 방식의 다중 문서 요약 모델을 제안한다. 제안 모델은 요약 모듈, 유사도 측정 모듈, 정보량 랭킹 모듈로 이루어져 있다. 다중 문서가 제안 모델에 입력되면 요약 모듈은 각 문서에 대한 요약문을 생성한다. 유사도 측정 모듈에서 생성된 요약문에 대해 의미적 유사도를 측정해 유사한 요약문들을 클러스터링한다. 정보량 랭킹 모듈은 유사한 요약문 그룹에서 가장 정보량이 큰 요약문을 선택하고, 선택된 요약문을 모아 최종 요약문으로 출력한다. 실험을 통해 본 논문에서 제안한 다중 문서 요약 모델과 개별 모듈의 우수성을 확인했다.

한국어 과학기술 논문 초록 문장 분류를 위한 데이터셋 및 학습 모델

안홍비, 박소영, 정유철

http://doi.org/10.5626/JOK.2023.50.6.468

문서에 존재하는 각 문장을 역할 또는 기능에 따라 분류하는 것은 매우 중요하다. 특히, 과학기술 논문의 초록에는 여러 가지 연구 관련 내용이 등장하는데, 이것을 각 의미에 따라 분별하고, 적절한 의미 태그를 부여하는 것은 콘텐츠 큐레이션 측면에서 매우 필요하지만, 작업의 복잡성과 다양성으로 인하여 쉽지 않은 일로 여겨지고 있다. 예를 들어, 생물 의학 관련 외국어 초록 데이터(PubMed)의 경우 초록을 구성하는 문장들은 대체로 일관된 의미적 순서(예, 배경-목적-방법-결과-결론)를 지키고 있지만, 한국어 논문 초록에서 문장들은 저자에 따라 매우 상이한 순서로 기술되어 있다. 본 연구에서는 한국어로 기술된 과학기술 도메인의 논문초록들을 대상으로 각 문장을 그 역할에 따라 태깅한 데이터셋(PubKorSci-1k)을 구축을 하고, 데이터셋에 맞는 문장 분류를 위한 학습 기법을 제안한다.

군집 알고리즘과 NSP를 이용한 문서 단위 기계 번역 데이터 증강

김도경, 이창기

http://doi.org/10.5626/JOK.2023.50.5.401

최근 전체 문서의 문맥을 파악해 자연스러운 번역을 하기 위한 문서 단위 기계 번역 연구가 활발히 이루어지고 있다. 문서 단위 기계 번역 모델의 학습을 위해서 문장 단위 기계 번역 모델과 마찬가지로 많은 양의 학습 데이터가 필요로 하지만 대량의 문서 단위 병렬 코퍼스를 구축하는 데 큰 어려움이 있다. 따라서 본 논문에서는 문서 단위 병렬 코퍼스 부족 현상을 개선하기 위해서 문서 단위 기계 번역에 효과적인 데이터 증강 기법을 제안한다. 실험 결과, 문맥이 없는 문장 단위 병렬 코퍼스에 군집 알고리즘과 NSP를 이용한 데이터 증강 기법을 적용하여 문서 단위 기계 번역의 성능을 데이터 증강 기법 적용 전에 비해 S-BLEU 3.0, D-BLEU 2.7 향상할 수 있었다.

일반 상식 기반 기계 독해를 위한 Type-specific 다중 헤드 공유 인코더 모델

채진영, 김지희

http://doi.org/10.5626/JOK.2023.50.5.376

기계 독해는 주어진 컨텍스트를 기반으로 다양한 문제를 해결함으로써 기계의 자연어 이해를 평가할 수 있도록 도입된 태스크이다. 기계의 자연어 이해 평가를 위해서는 주어진 맥락을 완전히 이해한 상태에서 상식적인 추론이 가능해야 한다. 이러한 추론이 가능하도록 본 연구에서는 일반 상식 기반 기계 독해를 위한 멀티-태스크 학습 방법과 모델을 제안한다. 연구의 기여는 다음과 같이 요약된다: 1) 일반 상식 기반 기계 독해 기술 학습을 위한 태스크 유형별 데이터셋 구성 방법을 제안한다. 2) 상식 학습이 가능한 Type-specific 다중 헤드 공유 인코더 모델을 포함해 멀티-태스크 학습 방법과 배치 샘플링 기법을 제안한다. 3) 제안된 방법을 CosmosQA데이터셋에 평가했을 때 기존 베이스라인 모델보다 2.38% 향상된 성능을 보인다.

탐색적 데이터 분석과 기계학습을 통한 상부 요로감염 환자 Ciprofloxacin 항생제 내성 예측 연구

이종법, 이현규

http://doi.org/10.5626/JOK.2023.50.3.263

응급의학과 의사는 요로감염 환자에 대해 임상적으로 감염 병원균 또는 항생제 내성 프로파일이 확인되기 전에 항생제를 선택해야 하는 경험적 치료전략을 사용한다. 지역사회의 요로 병원균의 항생제 내성 증가를 우려하였을 때 경험적 치료는 도전적인 과업이다. 본 연구는 단일 기관 후향적 연구로써, 응급실에서 상부 요로 감염 진단을 받은 환자를 대상으로 기계학습 알고리즘을 통한 항생제 내성 예측 방법을 제안한다. 먼저, 통계적 검정 방법과 게임 이론적 방식 기반의 SHAP(SHapley Additive exPlanation)을 수행하여 유의미한 예측 변수를 선택한다. 그리고 4개의 분류기의 성능을 비교하고 예측 확률 임계치 조절을 통해 의사의 경험적 치료를 보조할 수 있는 알고리즘을 제안한다. 결과적으로, SHAP를 통해 선별된 전체 예측 변수의 65%만을 사용한 SVM 분류기는 실험에 사용된 모든 분류기 중에 AUROC 0.775로 가장 높은 성능을 보였고, 모든 예측 변수를 사용했을 때보다 AUROC 0.015 증가했다. 그리고 예측 확률 임계치를 조절 과정을 통해 의사의 경험적 치료의 민감도를 98% 수준으로 유지하면서 특이도가 3.9배 향상된 분류 정확도를 달성했다.

학습 가능한 재순위화 및 응답 필터링 모델을 적용한 오픈 도메인 질의응답 시스템의 성능 향상

신현호, 이명훈, 전홍우, 이재민, 최성필

http://doi.org/10.5626/JOK.2023.50.3.273

딥러닝 기술이 자연어처리에 적용되면서, 사용자 질문에 대상 단락을 미리 준비하지 않은 상황에서도 정답을 찾을 수 있는 오픈 도메인 질의응답에 대한 연구가 활발히 진행되고 있다. 그러나 기존 연구는 키워드 기반 정보 검색을 사용하여 의미론적 매칭에 한계가 존재한다. 이를 보완하기 위해 딥러닝 기반 정보 검색 연구가 진행되고 있으나 실증적으로 실 시스템에 적용한 국내 연구는 아직 많지는 않은 상황이다. 이에 본 논문에서는 한국어 오픈 도메인 질의응답 시스템의 성능을 높이기 위해 2단계 성능 고도화 방법을 제안하였다. 제안된 방법은 검색엔진과 기계독해 모델이 결합된 형태의 베이스라인 시스템에 기계학습 기반의 재순위화 모델과 응답 필터링 모델을 순차적으로 적용하는 방법이다. 베이스라인 시스템의 경우 초기 성능은 F1 스코어 74.43, EM 스코어 60.79이며, 제안된 방법을 활용하였을 때 F1 스코어 82.5, EM 스코어 68.82로 성능이 향상되는 것을 확인하였다.

Few-shot 이미지 분류를 위한 프로토타입 노드 기반 그래프 신경망

장성은, 김준태

http://doi.org/10.5626/JOK.2023.50.2.127

딥러닝 모델의 우수한 성능은 많은 양의 학습 데이터를 기반으로 이루어진다. 그러나 이러한 대량의 데이터를 얻기 어려운 다수의 도메인이 있으며, 이러한 도메인에서는 데이터의 수집과 정제에 많은 자원을 투자해야 한다. 이러한 한계를 극복하기 위한 방법으로 적은 수의 데이터만으로도 학습이 가능하도록 하는 few-shot 학습에 대한 연구가 활발하게 이루어지고 있다. 특히 메타러닝 방법론 중 데이터 간의 유사도를 활용하는 메트릭 기반 학습은 새로운 태스크에 대한 모델의 미세 조정이 필요하지 않다는 장점을 지니며, 최근에는 여기에 그래프 신경망을 활용한 연구들이 좋은 결과를 보이고 있다. 그래프 신경망 기반의 few-shot 분류 모델은 주어진 서포트 셋과 쿼리 셋의 데이터를 노드로 하는 태스크 그래프를 구성함으로써, 데이터의 특성과 데이터 사이의 관계를 명시적으로 처리할 수 있다. EGNN(Egde-labeling Graph Neural Net) 모델의 경우, 데이터 간의 유사도를 엣지 레이블의 형태로 표현하여 보다 명확한 클래스 내 유사도와 클래스 간 유사도를 모델링한다. 본 논문에서는 이러한 few-shot 태스크 그래프에 각 클래스를 대표하는 프로토타입 노드를 적용하여, 데이터 간 유사도와 클래스-데이터 간 유사도를 동시에 모델링하는 방법을 제안한다. 제안하는 모델은 태스크의 데이터와 클래스 구성에 적합하게 생성되는 일반화된 프로토타입 노드를 제공하며, 프로토타입-쿼리 엣지 레이블 기반, 혹은 프로토타입-쿼리 노드 사이의 유클리드 거리를 기반으로 하는 두 가지의 서로 다른 few-shot 이미지 분류 예측을 수행할 수 있다. miniImageNet 데이터셋에 대한 5-way 5-shot 분류 성능을 EGNN 모델 및 기타 메타러닝 기반의 few-shot 분류 모델들과 비교한 결과, 제안하는 모델에서 의미 있는 성능 향상을 확인하였다.

비지도 기계 번역을 이용한 채팅체 문체 변환

정영준, 이창기, 황정인, 노형종

http://doi.org/10.5626/JOK.2023.50.1.19

문체 변환(style transfer)은 소스 문체(source style)로 쓰여진 텍스트가 주어지면 내용(content)을 유지하면서 타겟 문체(target style)의 텍스트를 생성하는 작업이다. 일반적으로 내용은 불변성(invariance), 문체는 가변성(variance)이라고 가정하여 텍스트의 문체를 변환하게 된다. 하지만, 채팅체의 경우 기존의 문체 변환 모델로 학습이 잘 안 되는 문제가 있다. 본 논문에서는 비지도 기계 번역(unsupervised machine translation)을 이용한 문체 변환 모델을 사용하여 채팅체를 문어체로 변환하는 방법을 제안한다. 또한, 변환된 결과를 활용하여 문체 변환에 사용될 수 있는 문체 간 단어 변환 사전을 구축할 수 있음을 보인다. 추가로, 변환된 결과 쌍에 대해 잘 변환된 결과만 사용할 수 있도록 필터링 방법을 적용하고, 필터링 된 결과를 이용한 지도 학습 방법으로 문체 변환 모델을 학습하여 변환 결과가 개선됨을 보인다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr