검색 : [ keyword: next-generation sequencing ] (2)

분산병렬 클러스터 컴퓨팅을 이용한 GVCF(Genome Variant Call Format) 파일의 정렬 및 병합 방법

이진우, 원정임, 윤지희

http://doi.org/10.5626/JOK.2021.48.3.358

차세대 시퀀싱(next-generation sequencing, NGS) 기법의 발달로 인하여 방대한 유전체 데이터의 분산, 병렬처리가 필수적인 방법론으로 대두되고 있다. NGS 유전체 데이터 처리는 데이터 규모로 인하여 일반적으로 매우 긴 실행 시간을 필요로 한다. 본 논문에서는 GVCF 파일 정렬/병합 실행 시간을 단축하기 위하여 분산병렬 클러스터 컴퓨팅을 이용한 새로운 GVCF 파일 정렬/병합 모듈을 제안한다. 제안하는 모듈에서는 분산병렬 클러스터인 Spark를 사용하며, 클러스터 내의 자원을 효율적으로 사용하기 위해 GVCF 파일의 특성을 고려한 두 단계의 과정으로 정렬/병합을 진행한다. 성능 평가를 위하여 GATK의 Combine-GVCFs 모듈과 제안하는 모듈의 GVCF 파일의 개수에 따른 정렬/병합 실행시간을 측정하여 비교 및 평가를 진행하였다. 실험 결과에 의하여 제안하는 방식이 실행시간을 매우 효율적으로 단축시키고 있음을 확인하였으며, 제안하는 방식의 유용성을 입증하였다.

AGB (Ancestral Genome Browser) : 조상유전체 데이터의 시각적 열람을 위한 웹 인터페이스

이대환, 이종인, 홍운영, 장은지, 김재범

http://doi.org/

차세대 시퀀싱(Next generation sequencing) 기술의 발달로 여러 생물 종의 유전체 데이터를 다양한 관점에서 비교 분석한 결과를 직관적으로 해석할 수 있게 해 주는 다양한 유전체 브라우저(Genome browser)들이 활발하게 서비스되고 있다. 그러나 기존 유전체 브라우저들은 현존 생물 종의 유전체 데이터에 국한되어 있기 때문에 생물의 진화 현상에 주목하는 연구자들의 수요를 충족시키지 못하고 있다. 본 논문에서는 현존 생물 종의 유전체 데이터를 이용하여 복원된 조상 유전체 정보를 열람할 수 있게 해주는 유전체 브라우저인 AGB (Ancestral Genome Browser)를 소개한다. AGB를 이용하면 진화 과정중에서 발생한 유전체 변이 현상을 직관적으로 빠르게 추적할 수 있다. AGB는 현재 http://bioinfo.konkuk. ac.kr/genomebrowser/에서 이용 가능하다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr