디지털 라이브러리[ 검색결과 ]
약물 분자 임베딩을 활용한 만성 B형간염 환자의 약물 치료반응 예측 정확도 향상
http://doi.org/10.5626/JOK.2024.51.7.627
만성 B형 간염 환자는 적절한 시기에 치료를 받지 못하는 경우 간경변증이나 간암과 같은 합병증으로 진행될 위험이 높다. 이에 따라 여러 B형 간염 항바이러스제가 개발되어 있으며, 항바이러스제의 성 분에 따라 환자 별 반응상 차이가 나타날 수 있어 긍정적인 치료반응을 기대할 수 있는 올바른 약제 선택 이 중요하게 여겨진다. 본 연구에는 환자의 혈액 검사 결과, 약물 처방 여부를 나타내는 전자 의무기록과 함께 B형간염 항바이러스제의 성분 정보를 함께 학습하여 만성 B형간염 환자의 1년 후 치료반응 예측 성 능을 향상시키는 것을 목표로 한다. 보다 효과적인 항바이러스제의 분자 표현을 위하여 고정된 분자 임베딩 및 그래프 신경망 모델을 활용한 종단형(end-to-end) 구조를 통해 생성된 분자 임베딩을 사용하였으며, 기반 모델과의 비교를 통해 약물 분자 임베딩이 성능 향상에 도움을 줄 수 있음을 확인하였다.
옵저버 패턴에서 Kotlin 흐름 API의 도출
http://doi.org/10.5626/JOK.2023.50.9.821
Kotlin 흐름은 비동기식 리액티브 스트림 데이터 처리를 위해 Kotlin 코루틴의 중단 함수를 기반으로 개발된 라이브러리이다. 그동안 널리 사용되어 왔던 무거운 라이브러리인 RxJava와는 달리 Kotlin 흐름은 코루틴의 중단 함수를 통해 자연스런 역압력 기능을 제공하기 때문에 최근 들어 리액티브 응용프로그램 개발 시 그 활용도가 높아지고 있다. 그럼에도 불구하고, 프로그래머는 흐름 API의 동작을 이해하는 데 어려움을 겪고 있는데, 이는 리액티브한 흐름 API의 동작이 일반적 API에 비해 익숙하지 않기 때문일 수도 있지만 흐름 API가 옵저버 패턴을 기본으로 하고 있다는 사실을 인지하지 못하고 있는 점 또한 주요 원인이라고 할 수 있다. 본 논문에서는 옵저버 패턴으로부터 흐름 API가 도출되는 과정을 단계별로 제시함으로써 Kotlin 흐름 API가 옵저버 패턴과 Kotlin 코루틴에 기초하여 정의되었으며, 이를 기반으로 리액티브 스트림 기능을 제공하고 있음을 보여준다.
밀도기반 군집화와 딥러닝 모델을 이용한 COVID-19 바이러스 전장 유전체 임베딩 전략
http://doi.org/10.5626/JOK.2022.49.4.261
세계적으로 유행하게 된 코로나바이러스는 유전자, 백신 등 다방면에서 연구가 이루어지고 있다. 특히, 계통이나 변이에 대한 연구는 바이러스의 분류를 정의하고 특징들을 더 세분화된 수준에서 이해할 수 있도록 해줌으로써 다양한 연구에 도움을 줄 수 있다. 대다수의 코로나 아형 분석 연구는 단일 염기 변이의 빈도를 기준으로 수행되고 있어 게놈 전반적인 변이에 대한 연구가 미비하다. 이는 게놈 전체의 정보를 한 번에 고려하여 분석하기에는 게놈이 너무 길고, 탐색 공간이 크기 때문이다. 본 연구에서는 밀도기반 군집화 기법을 통해 중요 지역을 선정하여 게놈의 길이를 줄인다. 나아가 딥러닝을 통해 이러한 군집들로부터 바이러스의 아형을 효과적으로 표현할 수 있는 임베딩 벡터를 추출하는 분석 방법론을 제시한다. 그 결과, 바이러스 게놈을 임베딩 기법을 통해 약 19% 수준으로 줄였으며, 추출된 임베딩들이 기존에 알려진 아형들을 잘 구분하고 이들의 계통수를 유사하게 재건할 수 있다는 것을 확인하였다.
잠재디리슐레할당 기반 군집화를 통한 유사 범죄코드 발굴과 범죄예측
http://doi.org/10.5626/JOK.2020.47.1.45
범죄데이터를 활용한 범죄예측에 대한 연구가 선진국의 대도시를 대상으로 활발히 진행되고 있다. 이러한 범죄예측 연구는 실제로 예측 치안(Predictive Policing)에서 활용되어 범죄 사건을 예측하여 해당 예측을 기반으로 치안계획을 수립방법론들이 실제 성공적으로 적용되고 있다. 범죄데이터를 용이하게 관리하기 위하여 범죄의 종류를 구분해야 될 필요가 있고, 해외 기관들은 범죄종류별 코드를 부여하여 효율적으로 데이터를 관리하고 있다. 본 연구에서는 범죄데이터를 분류하는 범죄코드간 유사성을 기계학습 알고리즘으로 측정하여 발생되지 않은 범죄의 코드를 예측하는 모델을 제안한다. 기존의 범죄율이나 사건의 장소, 시간을 예측하는 예측방법론 외에도 범죄코드 예측은 범죄의 종류를 예측하는 측면에서 중요성이 부각된다. 범죄의 종류의 예측이 가능하여야 경찰행정을 효율적으로 계획 배치할 수 있기 때문이다. 본 연구에서 제안하는 알고리즘을 기반으로 실증 데이터를 이용하여 모델의 우수성을 검증하였다.
De novo 시퀀스 어셈블리의 overlap 단계의 최근 연구 실험 분석
http://doi.org/10.5626/JOK.2018.45.3.200
여러 DNA 리드 시퀀스가 주어졌을 때, de novo 시퀀스 어셈블리는 레퍼런스 시퀀스 없이 하나의 시퀀스를 재조립한다. 재조립을 위해 de novo 시퀀스 어셈블리는 리드 사이의 모든 겹침을 계산하는 overlap 단계가 필요하다. Overlap 단계는 전체 연산 중 비용이 가장 많이 들기 때문에 어셈블리의 계산성능을 좌우한다. 여러 분야에서 overlap 단계를 위한 연구가 많이 발표되고 있는데, 그 중 가장 최신의 세 연구 결과는 Readjoiner, SOF, Lim-Park 알고리즘이다. 최근 염기 분석기술의 큰 발전으로 DNA 리드 데이터 셋을 기존보다 저비용으로 대량 생산하는 것이 가능해져 DNA 리드 데이터 셋을 생성하는 여러 플랫폼들이 개발되었다. 각 플랫폼마다 생성하는 데이터 셋의 통계적 특성이 다르기 때문에 overlap 단계의 성능 평가 시 다양한 통계적 특성의 데이터 셋이 반영되어야 한다. 본 논문은 여러 통계적 특성을 가진 DNA 리드 데이터 셋을 이용하여 위의 세 알고리즘의 성능을 비교 분석한다.
데이터센터 내 효율적인 전력관리를 위한 온톨로지 기반 모니터링 기법
최근 그린 컴퓨팅의 일환으로 데이터센터의 효율적인 전력관리가 부각되고 있으며, 이러한 효율적인 데이터센터의 전력관리를 위해서는 서버 모니터링이 필수적이다. 하지만 기존 서버 모니터링 기법은 주로 데이터베이스만을 이용해 관리하였기 때문에, 관리자는 데이터센터 및 데이터베이스의 구조를 명확하게 알고 있어야 하고, 관측한 데이터 간 상관관계를 분석해야 한다. 또한 관리자는 데이터베이스에 명시되지 않은 부분에 대한 모니터링이 불가능하다. 이에 본 논문에서는 효율적인 데이터센터 내 전력관리를 위한 온톨로지 기반의 모니터링 기법을 제안한다. 제안된 기법은 서버관리를 위한 도메인 온톨로지를 구축하고, 구축한 온톨로지를 시맨틱 어노테이션 기술을 통해 데이터베이스와 연동하였으며, 서버의 상태 및 질의문 생성에 대한 규칙을 정의하였다. 그리고 제안하는 기법의 유효성 입증을 위해 온톨로지 기반 모니터링 시스템 아키텍처를 설계하고, 지식 체계를 구축하였으며, 파일럿 시스템을 구현하여 검증을 실시하였다.