디지털 라이브러리[ 검색결과 ]
심층 신경망과 랜덤포레스트를 이용한 유전암 관련 단일 염기 변이의 병원성 예측
http://doi.org/10.5626/JOK.2023.50.9.746
최근 유전자 검사의 보급으로 인해 개인의 유전자 변이를 탐색하고, 병원성 정보를 통해 유전적 질병을 진단 및 예방하는 것이 가능해졌다. 하지만, 밝혀진 변이 중 병원성 정보가 있는 것의 수는 상당히 적다. 이러한 문제점을 해결하기 위해 기계학습을 통해 변이의 병원성을 예측하는 방법이 제안되었다. 본 논문에서는 심층 신경망과 기존 연구들에서 널리 사용되었던 랜덤포레스트 및 로지스틱회귀를 변이 병원성 예측에 적용 및 비교한다. 실험 데이터는 유전암과 관련된 유전자 내에 존재하는 1,068 개의 단일 염기 변이들로 구성된다. 초매개변수 설정을 위해 생성된 100 개의 무작위 데이터 집합에 대한 실험 결과 랜덤 포레스트가 area under the precision recall curve에서 가장 우수한 성능을 보였다. 15 개의 홀드아웃 유전자 집합에 대한 실험에서는 심층 신경망이 평균적으로 가장 우수한 결과를 보였으나 두 번째로 우수한 랜덤포레스트와의 성능 차이는 유의미하지 않았다. 또한 로지스틱회귀는 두 모델에 비해 통계적으로 유의미하게 낮은 성능을 보였다. 결론적으로 심층 신경망과 랜덤포레스트가 로지스틱 회귀에 비해 유전암 관련 단일 염기 변이의 병원성 예측에 일반적으로 더 적합함을 알 수 있었다.