디지털 라이브러리[ 검색결과 ]
공정성과 정확성을 고려한 그래프 링크 예측 지표와 모델
양희윤, 강용훈, 김가형, 임지영, 윤수현, 김호승, 이지형
http://doi.org/10.5626/JOK.2023.50.2.179
여러 사회 분야에서 빅데이터와 컴퓨팅 기술의 발전을 기반으로 인공지능 기술의 도입이 활발히 이루어지고 있다. 하지만 빅데이터에 내재되어 있는 사회적인 차별요소로 인하여 인공지능의 예측이 편향된 경우가 많아 공정성 논란이 발생하고 있다. 특히, 소셜 네트워크 데이터를 다루기에 적당한 그래프 신경망에서는 유사한 노드들을 연결하려는 동질성 효과(Homophily effect) 때문에 성별, 종교 등과 같은 민감한 속성(Sensitive Attribute)에 편향된 예측이 이루어지기 쉬워서 공정성 문제가 더욱 심각하다. 이러한 공정성 문제를 해결하기 위하여, 공정한 모델 연구와 편향된 정도를 평가하기 위한 공정성 지표들이 제안되고 있다. 그러나 관련 연구들에서 각기 다른 지표를 사용해 공정성을 평가하기 때문에 통일된 기준이 없고, 모델의 정확성과 공정성이 상충관계(trade-off)에 있음을 고려하지 않아 두 성능 모두를 고려한 판단 지표가 필요하다. 본 논문은 공정성과 정확도의 관계를 고려한 지표인 Fairβ-metric을 제안하고, 이 지표에서 우수한 성능을 내는 그래프 링크 예측 모델 FairU를 제안한다.
문장 수반 관계를 고려한 문서 요약
문서의 요약은 요약문 내의 문장들끼리 서로 연관성 있게 이어져야 하고 하나의 짜임새 있는 글이 되어야 한다. 본 논문에서는 위의 목적을 달성하기 위해 문장 간의 유사도와 수반 관계(Entailment)를 고려하여 문서 내에서 연관성이 크고 의미, 개념적인 연결성이 높은 문장들을 추출할 수 있도록 하였다. 본 논문에서는 Recurrent Neural Network 기반의 문장 관계 추론 모델과 그래프 기반의 랭킹(Graphbased ranking) 알고리즘을 혼합하여 단일 문서 추출요약 작업에 적용한 새로운 알고리즘인 TextRank-NLI를 제안한다. 새로운 알고리즘의 성능을 평가하기 위해 기존의 문서요약 알고리즘인 TextRank와 동일한 데이터 셋을 사용하여 성능을 비교 분석하였으며 기존의 알고리즘보다 약 2.3% 더 나은 성능을 보이는 것을 확인하였다.