디지털 라이브러리[ 검색결과 ]
검색 : [ author: Sangseon Lee ] (1)
밀도기반 군집화와 딥러닝 모델을 이용한 COVID-19 바이러스 전장 유전체 임베딩 전략
http://doi.org/10.5626/JOK.2022.49.4.261
세계적으로 유행하게 된 코로나바이러스는 유전자, 백신 등 다방면에서 연구가 이루어지고 있다. 특히, 계통이나 변이에 대한 연구는 바이러스의 분류를 정의하고 특징들을 더 세분화된 수준에서 이해할 수 있도록 해줌으로써 다양한 연구에 도움을 줄 수 있다. 대다수의 코로나 아형 분석 연구는 단일 염기 변이의 빈도를 기준으로 수행되고 있어 게놈 전반적인 변이에 대한 연구가 미비하다. 이는 게놈 전체의 정보를 한 번에 고려하여 분석하기에는 게놈이 너무 길고, 탐색 공간이 크기 때문이다. 본 연구에서는 밀도기반 군집화 기법을 통해 중요 지역을 선정하여 게놈의 길이를 줄인다. 나아가 딥러닝을 통해 이러한 군집들로부터 바이러스의 아형을 효과적으로 표현할 수 있는 임베딩 벡터를 추출하는 분석 방법론을 제시한다. 그 결과, 바이러스 게놈을 임베딩 기법을 통해 약 19% 수준으로 줄였으며, 추출된 임베딩들이 기존에 알려진 아형들을 잘 구분하고 이들의 계통수를 유사하게 재건할 수 있다는 것을 확인하였다.