디지털 라이브러리[ 검색결과 ]
지속적인 그래프 임베딩에서 효과적인 중요도 기반 개체 그룹화 기법
http://doi.org/10.5626/JOK.2025.52.7.627
본 연구는 지속적인 그래프 임베딩에서 개체 중요도 평가의 정확성을 개선하기 위해 관계의 매개 중심성을 가중치 기반 페이지랭크 알고리즘의 가중치로 적용하는 새로운 방법론을 제안한다. 간선 매개 중심성을 정규화해 모델에 통합함으로써, 제안 기법은 간선을 통한 정보 흐름의 중요성을 반영하면서 개체 중요도를 효과적으로 전파해 네트워크 전반의 학습 성능을 향상시킨다. 실험 결과, 다양한 데이터셋 에서 MRR 및 Hit@N 지표에서 기존 기법 대비 유의미한 성능 향상을 보였다. 특히, 새로운 개체와 관계가 지속적으로 추가되는 환경에서 제안 방법은 첫 번째 스냅샷 이후 높은 성능 개선을 나타냈다. 이러한 결과는 관계의 중심성을 활용한 개체 중요도 전파가 지속적인 지식 그래프 임베딩의 학습 효율성을 크게 증대시킬 수 있음을 시사한다.
큰 그래프 상에서의 개인화된 페이지 랭크에 대한 빠른 계산 기법
http://doi.org/10.5626/JOK.2022.49.10.859
그래프 내에서 개인화된 페이지랭크(Personalized PageRank, PPR)를 계산하는 것은 검색, 추천, 지식발견 등 여러 분야에서 광범위하게 활용되는 중요한 작업이다. 개인화된 페이지랭크를 계산하는 것은 고비용의 과정이 필요하므로, 개인화된 페이지랭크를 계산하는 효율적이고 혁신적인 방법들이 다수 개발되어왔다. 그러나 수백만 이상의 노드를 가진 대용량 그래프에 대한 PPR 계산은 여전히 시간이 크게 소요되는 작업이다. 그에 더하여, 기존에 제시된 알고리즘들은 그래프 갱신을 효율적으로 처리하지 못하여, 동적으로 변화하는 그래프 처리에 한계가 있다. 이에 대응하여, 본 연구에서는 높은 정밀도를 보장하면서도 빠르게 수렴하는 PPR 계산 알고리즘을 제시한다. 전통적인 거듭제곱법(Power Iteration)에, 축차가속완화법(Successive Over Relaxation)과 초기 추측값 보정법(Initial Guess Revision)을 활용한 벡터 재사용 전략을 적용하여 수렴 속도를 개선하였다. 제시된 방법은 기존 거듭제곱법의 장점인 단순성과 엄밀성을 유지하면서도 수렴율과 계산속도를 크게 개선한다. 또한 개인화된 페이지랭크 벡터의 갱신을 위하여 이전에 계산되어 저장된 벡터를 재사용하여, 갱신에 드는 시간이 크게 단축된다. 본 방법은 주어진 오차 한계에 도달하는 즉시 결과값을 산출하므로 정확도와 계산시간을 유연하게 조절할 수 있으며, 이는 표본 기반 추정방법이나 역행렬 기반 방법이 가지지 못한 특성이다. 실험 결과, 본 방법은 거듭제곱법에 비하여 20배 이상 빠르게 수렴한다는 것이 확인되었으며, 기 제시된 최속 알고리즘과 비교하여도 결과 품질을 일정 수준 이상으로 유지하면서도 수행시간 면에서 우수한 성능을 보이는 것 또한 확인되었다.
페이지랭크를 이용한 암환자의 이질적인 예후 유전자 식별 및 예후 예측
http://doi.org/10.5626/JOK.2018.45.1.61
암환자의 예후 예측에 기여하는 유전자를 찾는 것은 환자에게 보다 적합한 치료를 제공하기 위한 도전 과제 중 하나이다. 예후 유전자를 찾기 위해 유전자 발현 데이터를 이용한 분류 모델 개발 연구가 많이 이루어지고 있다. 하지만 암의 이질성으로 인해 예후 예측의 정확도 향상에 한계가 있다는 문제가 있다. 본 논문에서는 유방암을 비롯한 6개의 암에 대한 암환자의 마이크로어레이 데이터와 생물학적 네트워크 데이터를 이용하여 페이지랭크 알고리즘을 통해 예후 유전자들을 식별하고, K-Nearest Neighbor 알고리즘을 사용하여 암 환자의 예후를 예측하는 모델을 제안한다. 그리고 페이지랭크를 사용하기 전에 K-Means 클러스터링으로 유전자 발현 패턴이 비슷한 샘플들을 나누어 이질성을 극복하고자 한다. 본 논문에서 제안한 방법은 기존의 유전자 바이오마커를 찾는 알고리즘보다 높은 예측 정확도를 보여주었으며, GO 검증을 통해 클러스터에 특이적인 생물학적 기능을 확인하였다.