디지털 라이브러리[ 검색결과 ]
돌연변이 단백질에 대한 사전 학습 대규모 언어 모델 기반 약물-표적 결합 친화도 예측
http://doi.org/10.5626/JOK.2025.52.6.539
신약 개발은 높은 비용과 긴 시간이 소요되며, 특히 단백질 돌연변이가 약물-표적 결합 친화도에 미치는 영향을 정량적으로 예측하는 것은 중요한 과제이다. 기존 연구에서는 아미노산 서열 처리를 위해 LSTM과 트랜스포머 모델이 활용되었으나, LSTM은 장기 의존성 문제, 트랜스포머는 높은 연산 비용의 한계를 가진다. 반면, 사전 학습된 거대 언어 모델(pLLM)은 긴 시퀀스 처리에 강점을 가지지만, 프롬프트 기반 접근만으로는 정확한 결합 친화도 예측이 어렵다. 본 연구에서는 pLLM을 활용하여 단백질 구조 데이터를 임베딩 벡터로 변환하고, 별도의 머신러닝 모델로 결합 친화도를 예측하는 방법을 제안한다. 실험 결과, 제안된 방법은 기존 LSTM 및 프롬프트 접근법보다 우수한 성능을 보였으며, 돌연변이 특이적 예측에서도 낮은 RMSE와 높은 PCC를 기록하였다. 또한, pLLM 모델의 양자화에 따른 성능 분석을 통해 낮은 연산 비용으로도 충분한 성능을 발휘할 수 있음을 확인하였다.
UnityPGTA : 강화학습을 이용한 유니티 플랫포머 게임의 테스팅 자동화 도구
http://doi.org/10.5626/JOK.2024.51.2.149
수십억 명 규모의 거대한 비디오 게임 산업에서 게임 테스트 비용은 절반에 달할 정도로 상당하여 테스팅 비용 절감을 위한 자동화 연구들이 이루어지고 있다. 그러나 기존 테스트 자동화 기존 연구들은 스크립트 작성 등의 사람의 개입을 요구하는 수동 작업이 남아 있어 테스트 비용이 많이 든다. 또는 VGDL과 GVG-AI의 가상 환경으로 구현되어 실제 게임 테스팅에 활용하기 어렵다. 본 논문에서는 유니티 플랫포머 게임을 대상으로 유니티와 유니티 머신러닝 에이전트를 활용하여 시스템 결함 탐지를 목적으로 게임 테스팅을 자동화하는 도구를 제안한다. 제안하는 도구는 실제 상용 게임 엔진 기반이며 사람의 개입 없이 게임을 스스로 분석하여 게임 자동 테스팅 환경을 구축한다. 그리고 실제 오픈소스 게임들을 대상으로 제안하는 도구와 랜덤 베이스라인 모델의 에러 탐지 결과를 비교 분석하여 제안하는 도구가 효율적으로 자동 게임 분석과 테스팅 환경 구축을 수행하여 테스트 비용을 줄이고 품질과 안정성을 개선할 수 있음을 보인다.
자이로 센서 데이터를 활용한 양치 위치 추정 및 비지도 학습 클러스터링을 통한 검증
김도윤, 권민욱, 백승주, 윤혜린, 임대연, 조은아, 류승재, 김영욱, 김진현
http://doi.org/10.5626/JOK.2023.50.12.1143
구강 건강은 수명과도 직접적 관련을 갖는 중요한 건강 지표다. 이러한 이유로 영유아부터 노인에 이르기까지 구강 건강은 국민 건강의 핵심으로 자리를 잡았다. 이러한 구강 건강의 기본은 올바른 양치 습관이다. 하지만 권장되는 올바른 양치 방법은 습관화하기 쉽지 않으며, 그러한 이유로 구강 건강에 해로운 영향을 준다. 본 논문은 올바른 양치 방법을 추적하기 위한 저비용의 IMU 센서를 통해 양치 구역을 구별하는 방법을 제안하고, 머신러닝의 클러스터링 알고리즘으로 양치 구역의 추정 방법의 정확성을 평가한다. 본 논문에서는 IMU 센서의 자이로 센서만을 사용하여 칫솔 자세만으로 양치 구역을 판단하는 방법을 제안한다. 이 논문에서는 비교적 저렴한 6축 IMU 자이로 센서 데이터만으로도 80.6%의 정확도로 사용자 양치 부위를 추정할 수 있음을 보였다. 또한, 이러한 데이터에 클러스터링 알고리즘을 적용하고 클러스터링 된 데이터를 활용하여 Logistic regression을 훈련하여 양치 구역을 추정한 결과 86.7%의 정확도로 얻을 수 있었으며 이를 통해 클러스터링이 효과적임과 함께 본 논문에서 제안한 칫솔 자세 기반의 양치 구역 추정이 효과가 있음을 보였다. 결론적으로 본 양치 구역 추정 알고리즘이 비교적 적은 비용의 칫솔로 기능이 구현될 수 있으며, 이를 통해 개인 양치 습관을 분석하고 개선함으로써 구강 건강 유지하는데에 도움이 될 것으로 기대할 수 있다.
특징 최소화와 선택을 이용한 욕창 발생 예측을 위한 중요 혈액 특징값 예측
http://doi.org/10.5626/JOK.2023.50.12.1054
욕창은 한번 발생하면 치료가 어려울 뿐만 아니라 치료 과정에서 막대한 경제적 비용이 발생한다. 그러므로 욕창의 발생을 예측하는 것은 환자의 고통 측면과 경제적 측면에서 중요하다. 본 연구에서는 척수손상환자의 혈액검사를 통해 얻은 임상 정보들과 욕창 간의 상관관계를 분석하여 욕창 예측에 있어 유의미한 특징 정보를 제공한다. 특징 선택 기법에서 주로 쓰이는 피어슨, 스피어만, 켄달타우의 상관계수를 비교 분석하였을 뿐만 아니라, 머신러닝 기법인 XGBoost와 LightGBM을 사용하여 특징의 중요도를 구하였다. 마지막으로, 특징의 중요도 관점에서 상위 5개의 특징들을 입력 값으로 활용한 장단기메모리 모델을 통해 다른 주요 특징들을 예측하게 한 결과, 우수한 예측력을 보이는 것을 확인하였다. 본 연구결과를 통해 의료인들에게 욕창 조기 예측 모델에 있어 주요한 임상 특징들에 대한 가이드라인을 제공할 수 있을 것으로 기대된다.
해석가능한 머신러닝을 위한 시각적 분석 시스템 제안
http://doi.org/10.5626/JOK.2023.50.1.57
해석가능한 머신러닝은 머신러닝 시스템의 행동과 예측을 사람이 이해할 수 있도록 돕는 기술을 말한다. 본 연구는 사용자가 쉽고 명확하게 머신러닝 모델을 해석할 수 있도록 지원하기 위하여 머신러닝 모델이 입력 데이터로부터 출력 결과를 어떻게 연결 짓는지에 대한 관계성을 해석하는 시각적 분석 시스템을 제안한다. 본 연구가 제안한 시각적 분석 시스템은 머신러닝 수행 결과를 입력 변수, 목표 변수, 예측 값에 따라 필터링하고 그룹 지어 해석할 수 있는 반복적인 조정 절차를 통해 효과적으로 머신러닝 모델을 해석할 수 있는 접근 방식을 취한다. 유스 케이스 분석과 사용자 심층 인터뷰를 통해 본 연구에서 제시한 시각적 분석 시스템이 머신러닝 모델의 복잡한 동작에 대한 통찰을 얻고, 입력 변수와 목표 변수 및 모델 예측에 대한 과학적 이해를 확보하고, 모델의 안정성과 신뢰성을 파악하는데 도움을 제공함을 확인했다.
OANet: 데이터베이스 성능 예측을 위한 주의관심 메커니즘 기반 Ortho-Attention Net
http://doi.org/10.5626/JOK.2022.49.11.1026
데이터베이스에는 수정할 수 있는 다양한 매개변수들이 있는데, 이를 Knob이라 한다. Knob들의 설정에 따라 데이터베이스의 성능이 상이하기 때문에 데이터베이스의 Knob을 튜닝 하는 것이 중요하다. 이 때 Knob 설정에 따른 데이터베이스 성능을 신뢰할 수 있고 신속하게 예측할 수 있는 모델이 필요하다. 하지만 Knob 설정이 같더라도 벤치마크를 수행하는 워크로드가 다른 경우 그 결과가 다를 수 있다. 따라서 본 논문에서는 주의관심 메커니즘을 기반으로 한 OANet을 제안함으로써 Knob뿐만 아니라 워크로드와 Knob 간의 연관성도 고려할 수 있도록 하였다. 그리고 제안한 모델의 성능을 확인하기 위해 기존에 사용하던 기계학습 기법들과 데이터베이스의 성능 예측 결과를 비교하였고 가장 높은 결과를 보임으로써 모델의 우수성을 검증하였다.
사전 학습 언어 모델의 미세 튜닝을 활용한 버그 담당자 추천 기법
http://doi.org/10.5626/JOK.2022.49.11.987
최근 소프트웨어의 규모와 복잡성이 지속해서 증가하고 있으며, 이는 다양한 버그를 유발하고 있다. 이에 따라 체계적 버그 관리의 필요성이 지속해서 제기되고 있다. 산업계에서는 다수의 연구들은 단어 기반의 학습 모델을 이용하여 버그 담당자 배정을 자동화하는 방법을 제시하였다. 하지만 이들은 대체로 단어 맥락 미고려, 클래스 개수 과다 등의 요인으로 정확도가 만족스럽지 못한 성능을 보인다. 본 논문에서는 BERT 및 이를 기반으로 한 RoBERTa, DeBERTa, CodeBERT등을 기반으로 사전 학습 언어 모델을 파인 튜닝하여 Top-10 정확도 기준 약 27%p의 정확도 향상을 이루어 냈으며, 결과적으로 약 70%의 정확도를 보이는 것을 실험을 통해 확인하였다. 이를 통해 파인 튜닝된 사전 학습 언어 모델 기반의 접근 방법이 버그 담당자 배정 자동화 문제에 효과적으로 적용될 수 있음을 보였다.
비지도 학습 기반의 VNF 이상 탐지 방법
http://doi.org/10.5626/JOK.2022.49.9.780
가상화 기술을 네트워크에 적용하면 하드웨어 의존성을 줄일 수 있으며, 상황에 맞는 유연한 제어 및 관리가 가능하다. 또한 Capital Expenditure(CAPEX)와 Operating Expenditure(OPEX)를 감소시킬 수 있기 때문에 현대의 통신 사업자나 서비스 제공업체는 Software-Defined Networking(SDN)과 Network Function Virtualization(NFV) 기술을 활용해 기존의 서비스를 효율적으로 제공하고 있다. SDN/NFV 기술이 널리 사용됨에 따라 Vitualized Network Function(VNF)에 대한 사이버 공격이 늘어나고 있으며, 이로 인해 서비스 품질이 저하되거나 서비스를 제공하지 못하는 경우가 발생하고 있다. 본 논문에서는 VNF의 성능 정보를 수집하고, 수집된 데이터와 비지도 학습을 이용해 VNF의 정상상태를 모델링하고, 이를 이용해 사이버 공격으로 인한 이상상태를 탐지하는 기법을 제안한다.
웨어러블 기기를 이용한 음주운전 감지 시스템
http://doi.org/10.5626/JOK.2022.49.5.397
음주 운전은 교통사고에 따른 인명피해를 불러일으킬 수 있다. 음주운전의 위험성이 충분히 각인되고 있음에도 불구하고 음주상태에서는 저하된 판단력으로 인하여 음주운전 교통사고는 매년 다수 발생하고 있다. 본 논문에서는 웨어러블 기기를 이용한 음주운전 감지시스템을 제안한다. 먼저 웨어러블 디바이스인 스마트워치의 범용적인 센서만을 이용하여 데이터를 수집한 후 스마트폰을 통해 서버에 전송하여 머신러닝을 수행하여 음주여부를 판단한다. 이후 차량 내 비콘을 이용한 운전자 감지 알고리즘에 의해 사용자에게 경보를 줌으로써 음주운전을 방지한다. 본 연구에서는 음주 운전을 방지할 수 있도록 하는 시스템을 스마트워치, 스마트폰과 서버에 실제 구현하고 실용화할 수 있는 앱을 개발하였다. 실험 결과 음주운전 판단 정확도는 약 92%, 운전자 감지 알고리즘은 약 99%의 결과를 나타냈다.
머신러닝을 이용한 내장형 소프트웨어의 동시성 오류 탐지 방안 설계 및 구현
http://doi.org/10.5626/JOK.2022.49.5.327
내장형 소프트웨어(embedded software)는 범용 소프트웨어와는 다르게 특정 목적에 맞게 하드웨어를 최적화하여 설계하기 때문에 제한된 환경에서의 목표하는 성능을 만족시키는 것이 중요하다. 오늘날 내장형 소프트웨어는 규모와 복잡도가 과거에 비해 크게 증가하고 있다. 규모와 복잡도가 커짐에 따라 소프트웨어에 발생하는 오류의 형태도 다양해지는데 그 중 복잡해진 소프트웨어 모듈 사이에서 발생가능한 동시성 오류(concurrency error)에 대한 이슈가 많다. 이러한 내장형 소프트웨어의 동시성 오류를 검출하기 위해 기존에는 사용자의 수동 입력에 의존하였으나, 본 논문에서는 SVM과 딥러닝을 활용한 머신러닝 기반의 동시성 오류 탐지 도구(MCED)를 제안한다.