디지털 라이브러리[ 검색결과 ]
단일 세포 분화 궤적 추론을 위한 시계열 다중 클러스터링 기법
http://doi.org/10.5626/JOK.2022.49.10.838
시계열 단일 세포 전사체 데이터에서 유전자 발현 정보는 중요한 세포의 분화 변화 시점을 관찰하기 위해 생성되며 실험조건과 관련하여 중요한 생물학적 현상 설명이 가능하다. 최근 시계열 단일 세포 전사체 데이터가 급증함에 따라 세포주기 및 분화와 같은 세포의 다양한 동적인 변화에 대한 연구가 활발히 진행되고 있다. 특히, 세포 분화에 대하여 단일 세포 수준에서의 시계열 분석은 시간 축으로의 변화 관찰이 가능하여 단일 시점에 비해 생물학적 해석이 유리하다. 본 논문에서는 시계열 단일 세포 전사체 데이터를 활용해 유전체 수준에서 시간 정보를 고려하여 세포 궤적을 추론하는 다중 클러스터링 기법을 제안한다. 해당 기법을 사용해 인간 뇌세포 분화과정에 대한 유전자 발현 데이터를 분석한 결과 사전 연구에서 밝혀낸 생물학적인 결과와 유사한 결과를 찾아냈다.
복수 개의 대장암 유전자 상관관계 네트워크 간 비교 분석 향상을 위한 네트워크 스케일링 방법
http://doi.org/10.5626/JOK.2022.49.8.646
질병 분석 모델에서 유전자 발현정보를 바탕으로 다양한 연구방법들이 제시되고 있다. 암 유전체 데이터 분석에 있어 패스웨이를 바탕으로 숨겨진 특성을 발굴하는 방법들은 결과 해석에 유용하다. 본 연구에서는 유전자들의 발현조절 정보를 토대로 한 패스웨이 단위의 유전자 상관관계 네트워크를 비교분석 하였다. 비교하고자 하는 두 네트워크의 규모의 차이가 생기게 되면 정보량의 편향성으로 인해 보다 큰 규모의 네트워크 정보에 치우쳐진 결과를 나타내게 된다. 이러한 편향성을 해소하기 위해 네트워크 망 구성에 대한 정보량을 이용하여 서로 다른 배경을 가진 환자군의 네트워크를 조정하는 방법을 제안한다. 정규화된 네트워크들은 주요 유전자군들의 비교분석법을 적용했으며, 총 4종류의 대장암의 아형 데이터를 활용하여 202개의 패스웨이 네트워크를 분석한 후 아형 특이적인 5개 패스웨이를 발굴했다. 이들은 모두 대장암과 연관된 주요 패스웨이로 선행연구에서 보고된 바가 있어 제안하는 방법의 유효성을 보였다.
밀도기반 군집화와 딥러닝 모델을 이용한 COVID-19 바이러스 전장 유전체 임베딩 전략
http://doi.org/10.5626/JOK.2022.49.4.261
세계적으로 유행하게 된 코로나바이러스는 유전자, 백신 등 다방면에서 연구가 이루어지고 있다. 특히, 계통이나 변이에 대한 연구는 바이러스의 분류를 정의하고 특징들을 더 세분화된 수준에서 이해할 수 있도록 해줌으로써 다양한 연구에 도움을 줄 수 있다. 대다수의 코로나 아형 분석 연구는 단일 염기 변이의 빈도를 기준으로 수행되고 있어 게놈 전반적인 변이에 대한 연구가 미비하다. 이는 게놈 전체의 정보를 한 번에 고려하여 분석하기에는 게놈이 너무 길고, 탐색 공간이 크기 때문이다. 본 연구에서는 밀도기반 군집화 기법을 통해 중요 지역을 선정하여 게놈의 길이를 줄인다. 나아가 딥러닝을 통해 이러한 군집들로부터 바이러스의 아형을 효과적으로 표현할 수 있는 임베딩 벡터를 추출하는 분석 방법론을 제시한다. 그 결과, 바이러스 게놈을 임베딩 기법을 통해 약 19% 수준으로 줄였으며, 추출된 임베딩들이 기존에 알려진 아형들을 잘 구분하고 이들의 계통수를 유사하게 재건할 수 있다는 것을 확인하였다.
대규모 대장암 데이터를 활용한 다중오믹스 데이터 통합 기법과 매개변수 분석
http://doi.org/10.5626/JOK.2020.47.8.779
유전자 발현정보를 포함한 다양한 유전체 데이터의 분석을 통해 질환과 생물체의 기작을 밝히기 위한 연구들이 활발히 수행되고 있다. 유전자 발현 조절 기작은 유전체 수준에서 수많은 유전자 간의 매우 정교하고 복잡한 관계에 의해 조절된다. 유전자 이외에 다양한 오믹스 또한 유전자 발현 조절에 관여한다. 최근 차세대 시퀀싱 비용의 하락으로 생성되는 유전체 데이터는 급속도로 증가하고 있다. 또한, 다양한 오믹스 데이터 생성을 위한 새로운 차세대 시퀀싱 기술들이 개발되고 있어 동일 생물체에 대해 여러 오믹스 데이터 측정이 가능하다. 본 논문에서는 제안하는 비음수텐서분해기법과 기존 다중오믹스 통합 기법들의 성능을 평가하고 데이터의 양 및 유전자 수와 같은 변수가 분석정확도에 미치는 영향력을 분석하였다. 대장암 데이터의 아형 분류를 위해 최소 100~150개 샘플과 5,000개 이하의 오믹스 개체가 필요한 것으로 분석됐다. 텐서분해기법이 가장 높은 분류정확도를 보였다.