디지털 라이브러리[ 검색결과 ]
사전 훈련된 기계 학습 모델의 효과적인 조합을 위한 공유 모델 허브 분석
http://doi.org/10.5626/JOK.2025.52.1.42
최근, 딥 뉴럴 네트워크(DNN) 모델이 소프트웨어 시스템의 주요 구성 요소로 자리 잡고 있다. 이러한 DNN의 설계와 훈련은 도메인 전문 지식, DNN 프레임워크에 대한 숙련도, 상당한 컴퓨팅 자원 및 대규모 훈련 데이터를 요구하므로 간단하지 않은 과정이다. 개발자들은 전통적인 소프트웨어 공학의 철학에 따라 모델 허브에서 사전 훈련된 모델(PTM)을 재사용하곤 한다. 그러나 개발자의 특정 요구사항과 일치하는 PTM이 없을 때에는 어려움이 발생한다. 본 논문에서는 PTM 조합의 개념을 탐구하고, 여러 PTM을 결합하여 애플리케이션 요구 사항을 미세 조정이나 새 DNN 개발 없이 충족할 수 있는지를 조사한다. 사례 연구를 통해 PTM 조합의 현재 도전과제와 모델 허브의 한계를 도출하고, PTM 조합과 웹 서비스 구성 간의 유사성을 바탕으로 성공적인 조합을 위한 필수 기술과 해결책을 논의한다.
협동 로봇 모션 결함 데이터셋 구축을 위한 비전 기반 위치 편차 모의 결함 주입 방법
http://doi.org/10.5626/JOK.2023.50.9.795
스마트팩토리의 핵심 설비인 협동 로봇에는 기기의 고장을 진단하기 위해 내부, 외부 센서로부터 데이터를 실시간으로 수집하고 결함을 예측하는 데이터 기반 결함 진단 방법이 도입되고 있다. 데이터 기반 결함 진단 방법은 학습을 위한 많은 양의 데이터가 필요하며, 특히 결함 상태로 레이블링된 대량의 데이터가 필수적으로 요구된다. 그러나, 산업 현장에서 실제 결함 데이터를 대량으로 얻기 어렵다. 따라서 본 논문에서는 비전 센서를 기반으로 협동 로봇 결함 상태의 출력을 정상 상태의 출력을 비교 분석하고, 분석된 출력 신호간의 편차를 바탕으로 모의 결함 주입 방법을 제안한다. 실제 결함 상태에서 수집된 협동 로봇 데이터는 제안하는 모의 결함 주입 상태에서 수집된 데이터로 대체 가능하다. 결함 주입 데이터로 학습된 모델의 성능과 실제 결함 데이터로 학습된 모델의 성능 비교 결과, 정확도의 경우 평균 0.97, 0.98로 차이가 거의 없음을 확인하여 제안하는 결함 주입 방법의 효용성을 검증하였다.
순환 신경망 기반 소프트웨어 신뢰성 추정 모델의 정확성 및 안정성 비교 분석 연구
http://doi.org/10.5626/JOK.2023.50.8.688
순환 신경망 기반 소프트웨어 신뢰성 추정에 관한 기존 연구들은 순환 신경망을 이용하여 동일한 조건에서 하나의 모델을 생성하고 그 모델의 정확성을 평가하였다. 하지만 순환 신경망은 인공 신경망의 무작위성으로 인해 같은 조건에서도 모델의 훈련 결과를 다르게 생성할 수 있으며 이는 부정확한 소프트웨어 신뢰성 추정을 초래할 수 있다. 따라서 본 논문에서는 어떤 순환 신경망이 소프트웨어 신뢰성을 더 안정적이고 정확하게 추정하는지 비교 분석하고 그 결과를 제시한다. 이를 위해 3개의 대표적인 순환신경망을 이용하여 8개의 실제 프로젝트에서 소프트웨어 신뢰성을 추정하고 정확성과 안정성 측면에서 모델들의 성능을 비교 분석하였다. 그 결과 Long Short Term Memory가 가장 안정되고 정확한 소프트웨어 신뢰성 추정 성능을 보임을 확인하였다. 본 논문을 통해 우리는 보다 정확하고 안정된 소프트웨어 신뢰성 추정 모델을 선택할 수 있기를 기대한다.
데이터-기반 소프트웨어 신뢰도 예측을 이용한 소프트웨어 신뢰도 모델 선택
http://doi.org/10.5626/JOK.2022.49.6.443
다양한 유형의 실패 데이터에 대해서 모두 최적의 성능을 보이는 모델은 없다는 문제를 해결하기 위해서 모델 선택 방법과 데이터-기반 신뢰도 예측 방법이 제안되었다. 그러나 모델 선택 방법은 여전히 모든 유형의 실패 데이터에 대해서 최적의 모델을 선택할 수는 없으며 데이터-기반 방법은 예측 결과로부터 얻을 수 있는 신뢰도 관련 척도가 한정적인 문제가 있다. 본 연구의 목표는 신뢰도를 정확하게 예측하면서도 다양한 신뢰도 관련 척도를 얻는 것이다. 이를 위해 데이터-기반 신뢰도 예측 결과를 이용하여 모델을 선택하는 기법을 제안한다. 이 기법은 과거 실패 데이터로부터 모델 선택 방법과 데이터-기반 방법 중 어떤 방법을 사용할지 선정한다. 데이터-기반 방법을 선정하면 데이터-기반 방법으로 예측한 값으로 증강된 데이터를 만들고 가장 적합한 신뢰도 모델을 선택한다. 제안 기법의 예측 성능을 평가한 결과 예측 오차의 중위 값이 비교대상 기법들 중 가장 정확한 기법에 비해 21% 작은 것을 확인했다.
유전자 임베딩을 이용한 암 예후 예측 방법
http://doi.org/10.5626/JOK.2021.48.7.842
암의 예후와 관련이 있는 유전자를 식별하고 이를 이용하여 암환자의 예후를 예측하는 것은 환자에게 효과적인 치료방법을 제공하는데 기여하는 바가 크다. 유전자 발현 데이터를 이용하여 예후 관련 유전자를 탐색하거나 암의 예후를 예측하기 위한 다양한 연구방법들이 제시되었으며, 최근에는 딥러닝을 비롯한 머신러닝 기법들이 집중적으로 연구되고 있다. 하지만 유전자 발현량 데이터에 기계학습 방법을 적용하는 것은 사용 가능한 샘플의 수가 적고 유전자의 수가 많다는 근본적인 문제가 있다. 본 연구에서는 유전자 네트워크 데이터를 추가적으로 사용하여, 많은 수의 무작위 유전자 경로를 학습 데이터 사용함으로써 적은 수의 샘플이라는 문제를 보완하고자 한다. 본 연구에서 제시하는 방법을 이용하여 5가지 암에 대한 유전자 발현 데이터와 유전자 네트워크를 이용하여 예후 특이적 유전자를 식별하고 환자의 예후를 예측한 결과, 다른 기존 방법들과 비교하여 높은 정확도로 예측을 하는 것을 확인할 수 있었으며, 적은 샘플을 사용한 예측에서 높은 성능을 확인할 수 있었다.
딥러닝을 이용한 약물 화학 구조 예측
http://doi.org/10.5626/JOK.2021.48.2.234
신약 개발에 필요한 시간과 비용을 줄이기 위해서 많은 컴퓨터 기반 방법들이 연구되고 있다. 특히 최근 딥러닝 기법의 발전과 함께 후보 화합물의 화학식을 생성하기 위한 여러 가지 생성 모델(Generative model) 및 조건에 맞는 화학식을 생성하기 위한 강화학습 모델(Reinforcement learning model) 이 많이 연구되고 있다. 본 논문에서는 화합물과 단백질 간의 예측된 결합 친화력 정보를 이용한 강화학습 모델을 제시한다. 구체적으로, 본 논문에서 사용하고 있는 생성 모델은 Stack-RNN이며, 생성된 화학식이 특정한 화학적 특성을 가짐과 동시에 특정한 단백질과 높은 결합 친화력을 가지도록 Stack-RNN을 에이전트로 이용함으로써 강화학습을 구현한다. 본 논문에서는 소라페닙(Sorafenib), 수니티닙(Sunitinib), 다사티닙(Dasatinib)의 3가지 항암제들이 가지는 표적 단백질 정보를 이용하여 해당 항암제와 유사한 화합물의 화학식을 생성해 보았다.
순환 신경망을 활용한 코드 변경 추천 시스템의 학습 시간 단축 방법
http://doi.org/10.5626/JOK.2020.47.10.948
개발자에게 수정이 필요한 파일을 추천하는 시스템은 개발자의 작업 시간을 줄여 준다. 그러나 이런 추천 시스템은 일반적으로 축적된 데이터를 학습할 때 많은 시간이 들며, 또한 새로운 데이터가 축적될 때마다 새로이 학습하는데 많은 시간을 소모한다. 본 연구는 순환 신경망을 이용한 코드 변경 추천시스템(RNN-CRS)에 새로운 데이터가 축적되어 학습을 다시 해야 할 때 불필요한 학습을 회피하여 학습에 드는 시간을 줄이는 방법을 제안한다. 제안 방법의 실험 평가에서 제안 방법은 데이터가 새로 축적되어 학습 모델을 다시 생성하는데 소요되는 시간을, 실험에 사용된 다섯 개의 제품들에 대하여 시간 단축이 큰 경우에는 기존 연구에 비해 49.08%~68.15% 단축시켰고 작은 경우에는 10.66% 단축시켰다.
복수의 엣지 디바이스에서의 CNN 모델 분산 처리를 위한 축소된 분류 모델 활용 기법
http://doi.org/10.5626/JOK.2020.47.8.787
최근 클라우드 서버로 전송되는 막대한 양의 데이터로 인해 발생하는 네트워크 부하 등의 여러 문제로 인하여, 데이터의 수집이 이루어지는 네트워크의 말단에서 자체적으로 데이터를 처리하는 엣지 컴퓨팅에 대한 요구가 증가하고 있다. 그러나 네트워크 말단에 위치한 엣지 디바이스는 대부분 성능이 제한되어 있어 클라우드 서버에서 사용되는 딥러닝 응용을 그대로 사용하기에는 어려움이 있다. 이러한 문제를 극복하기 위해, 본 논문에서는 딥러닝 모델을 축소된 분류 모델들로 나누어 활용해 복수의 엣지 디바이스에서 공동으로 추론을 수행하는 분산 처리 기법을 제안하였다. 여기서 사용된 축소된 분류 모델은 경량화 된 모델 가중치를 가지며, 전체 분류 레이블 중 일부에 해당하는 레이블에 대해 추론을 진행한다. 성능 측정 결과 제안하는 축소된 분류 모델의 결과를 취합하는 분산 처리 기법의 정확도가 기존 모델 대비 더 적은 파라미터를 갖도록 경량화를 하여도 기존 모델과 유사한 수준을 유지할 수 있음을 확인하였다.
객체 Attention을 이용한 이미지 캡션 생성
http://doi.org/10.5626/JOK.2019.46.4.369
이미지 데이터가 폭발적으로 증가함에 따라 이미지를 자연어로 표현하기 위한 이미지 캡션 생성 기술에 대한 연구도 활발하게 이루어지고 있다. 기존 한국어 이미지 캡션 생성 기술에서는 영어권 데이터를 번역하여 사용함으로 인해 동시 발생 객체들에 의한 오류가 있다. 본 논문에서는 입력 이미지에 대한 캡션을 생성하여 추출한 명사와 이미지의 정답 캡션에서 추출한 명사를 이용하는 attention 함수를 새로운 손실 함수로 사용하는 이미지 캡션 모델을 제안한다. 공개된 실험 데이터를 사용한 실험에서 BLEU1 0.686, BLEU2 0.557, BLEU3 0.456, BLEU4 0.372를 보였다. 이를 이용하여 제안된 모델이 고빈도 동시 발생 객체 오류 해결에 효과적임을 입증하고 기존 연구보다 높은 성능을 얻음을 보이며 중복된 출력 문장을 줄임으로써 이미지 캡션의 다양한 표현들이 생성에 효과적임을 보였다. 또한 본 논문에서 제안하는 방법을 이용하여 이미지 캡션 모델을 학습하기 위한 코퍼스를 생성할 수 있다.
멀티 모달 데이터를 이용한 한국형 주요 우울 장애 진단 및 치료 모델
최용화, 김아람, 전민지, 김선규, 한규만, 원은수, 함병주, 강재우
http://doi.org/10.5626/JOK.2019.46.1.71
우울증은 현대 사회에서 가장 흔한 정신질환 중 하나로, 반복되는 재발에 따른 만성화로 인해 사회적인 부담을 증가시킨다. 그러나 다양한 요인들이 복합적으로 관여하는 질병이기 때문에 여러 요인을 효율적으로 고려할 수 있는 기계학습 모델이 필요하다. 본 논문에서는 기본 정보, MRI, 유전자, 인지 검사의 4가지 멀티 모달 데이터를 이용해 우울증 여부를 진단하고 항우울제 반응의 정도를 예측할 수 있는 모델을 제안하여 우울증 진단의 경우 AUROC 점수 0.923, 항우울제 반응성 예측의 경우 MSE 0.08의 정확도를 얻었다. 그리고 제안한 모델의 결과를 정량적으로 분석하여 환자의 데이터를 추가할수록 정확한 진단 및 약물 반응성 예측이 가능함을 확인하고, 정성적으로 분석하여 우울증에 관해 기존에 알려진 주요 요인을 찾는 것뿐 아니라 새로운 가설을 제시하였다.