디지털 라이브러리[ 검색결과 ]
이진 분류 데이터 세트 내 편향 제거를 위한 다차원 서브셋 기반 시스템
http://doi.org/10.5626/JOK.2023.50.5.383
인공지능 기술이 발전함에 따라 인공지능 관련 공정성 문제가 주목받고 있다. 이에 따라 관련 연구가 많이 진행되었으나 모델 및 학습 방법 연구가 주를 이루고 있으며 근본적인 원인인 학습에 쓰이는 데이터 내에 존재하는 편향을 제거하기 위한 연구는 아직 미흡하다. 따라서 이 논문에서는 데이터 내에 존재하는 편향을 레이블 편향과 서브 그룹 편향으로 구분하고 편향을 제거함으로써 공정성이 향상된 데이터셋을 생성하는 시스템을 설계 및 구현한다. 제안하는 시스템은 서브셋 생성 단계와 편향 제거 단계로 구성된다. 먼저 서브셋 생성기는 기존 데이터 세트 내 각 값의 조합이 형성하는 고윳값들에 따라 단일 값만을 가지는 서브셋으로 나눈다. 이후 검증 데이터셋을 기반으로 기존 데이터셋을 검증하여 얻은 공정성 지표값을 기준으로 우세그룹과 약세그룹으로 서브셋을 구분한다. 다음으로 편향 제거기는 각 서브셋의 우세그룹을 대상으로 순차 추출 및 검증을 병행하여 약세그룹과의 차이를 줄이는 과정을 반복하여 서브셋에서 나타난 편향을 줄인다. 이후 편향이 제거된 서브셋들을 병합하며 공정한 데이터셋을 반환한다. 검증에 사용된 공정성 지표는 F1 score와 균등 확률(equalized odd)을 사용한다. 실제 Census income 데이터, COMPAS 데이터 및 Bank marketing 데이터를 검증 데이터로 사용한 포괄적인 실험을 통해 제안된 시스템이 더 나은 공정성 개선율을 산출하고 대부분의 기계 학습 알고리즘에서 더 높은 정확성을 제공함으로써 기존 기술을 능가한다는 것을 보여준다.
공정성과 정확성을 고려한 그래프 링크 예측 지표와 모델
양희윤, 강용훈, 김가형, 임지영, 윤수현, 김호승, 이지형
http://doi.org/10.5626/JOK.2023.50.2.179
여러 사회 분야에서 빅데이터와 컴퓨팅 기술의 발전을 기반으로 인공지능 기술의 도입이 활발히 이루어지고 있다. 하지만 빅데이터에 내재되어 있는 사회적인 차별요소로 인하여 인공지능의 예측이 편향된 경우가 많아 공정성 논란이 발생하고 있다. 특히, 소셜 네트워크 데이터를 다루기에 적당한 그래프 신경망에서는 유사한 노드들을 연결하려는 동질성 효과(Homophily effect) 때문에 성별, 종교 등과 같은 민감한 속성(Sensitive Attribute)에 편향된 예측이 이루어지기 쉬워서 공정성 문제가 더욱 심각하다. 이러한 공정성 문제를 해결하기 위하여, 공정한 모델 연구와 편향된 정도를 평가하기 위한 공정성 지표들이 제안되고 있다. 그러나 관련 연구들에서 각기 다른 지표를 사용해 공정성을 평가하기 때문에 통일된 기준이 없고, 모델의 정확성과 공정성이 상충관계(trade-off)에 있음을 고려하지 않아 두 성능 모두를 고려한 판단 지표가 필요하다. 본 논문은 공정성과 정확도의 관계를 고려한 지표인 Fairβ-metric을 제안하고, 이 지표에서 우수한 성능을 내는 그래프 링크 예측 모델 FairU를 제안한다.
Fair Feature Distillation Using Teacher Models of Larger Architecture
http://doi.org/10.5626/JOK.2021.48.11.1176
다양한 비전 어플리케이션에서 알고리즘의 공정성을 달성하는 것은 중요해지고 있다. MMD 기반 공정한 특징 증류(MFD)라는 최신 공정성 기법은 Maximum Mean Discrepancy (MMD) 를 사용한 특징 증류 방법을 통해 기존 방법들과 비교했을 때 정확도와 공정성을 상당히 개선시켰지만, 그들은 교사 모델의 구조가 학생 모델과 같을 때만 적용될 수 있었다. 본 논문에서는, MFD를 기반으로, 더 큰 구조를 가진 교사 모델에서의 특징 증류를 통해 불공정한 편향성을 완화하는 체계적 접근법인 MFD-R을 제안한다. 광범위한 실험을 통해 우리는 MFD-R이 다른 기준 방법이나 MFD와 비교했을 때, 더 큰 교사 모델을 사용하는 이점이 있다는 것을 보인다.
HBDP 네트워크에서 C-TCP의 성능 향상을 위한 네트워크 적응적 혼잡제어 기법
오늘날 네트워크는 HBDP (High Bandwidth Delay Product) 특징을 가지고 있으며, 기존 TCP는 혼잡 윈도우 크기의 느린 증가와 패킷 손실 시 급격한 감소로 인하여 HBDP 네트워크에 적합하지 못하다. 기존 TCP의 문제를 해결하기 위해 새로운 혼잡 제어 기법에 관한 많은 연구들이 진행되었다. C-TCP (Compound-TCP)는 손실기반 TCP와 지연기반 TCP를 결합한 하이브리드 TCP이다. C-TCP의 목적은 빠른 대역폭 점유, 조기 혼잡예측에 의한 혼잡 방지와 공정성 보장이다. 하지만 C-TCP는 혼잡 정도를 고려하지 않는 지연 윈도우 감소율을 적용하기 때문에 성능의 저하를 초래한다. 제안하는 기법은 네트워크의 혼잡 상태에 따라 적응적으로 지연 윈도우의 증감률을 조절함으로써 C-TCP의 대역폭 점유 효율과 공정성을 개선한다. 실험 결과를 통해 HBDP 네트워크에서 제안하는 기법이 기존 C-TCP보다 향상된 성능을 보임을 확인하였다.
HBDP 네트워크에서 대역폭 점유와 RTT 공정성 향상을 위한 네트워크 적응적 혼잡제어 기법
오늘날 네트워크는 높은 대역폭과 높은 지연을 갖는 HBDP (High Bandwidth Delay Product) 네트워크의 특징을 보인다. 기존 TCP는 혼잡윈도우 크기의 느린 증가와 급격한 감소로 인하여 HBDP 네트워크에 부적절하다. 기존 TCP의 문제점을 해결하기 위해 연구된 TCP들은 손실기반 TCP와 지연기반 TCP로 구분한다. 대다수의 TCP는 기존 Slow Start 동작을 사용하며 오버슈트로 인한 대량의 패킷 손실을 초래한다. Congestion Avoidance 동작의 경우 손실기반 TCP는 대역폭 낭비와 RTT (Round Trip Time) 공정성 문제가 있으며 지연기반 TCP는 낮고 느린 대역폭 점유 문제가 있다. 제안하는 기법은 병목구간의 버퍼상태를 통해 혼잡제어를 함으로써 Slow Start와 Congestion Avoidance의 문제를 개선한다. 성능평가를 통해 HBDP 네트워크에서 제안하는 기법이 기존 TCP보다 향상된 성능을 보임을 확인하였다.