디지털 라이브러리[ 검색결과 ]
텍스트 부가 정보를 활용한 선형 기반 순차적 추천 모델
http://doi.org/10.5626/JOK.2025.52.6.529
최근 순차적 추천 시스템에서는 부가 정보를 활용한 연구가 활발히 시도되고 있다. 대부분의 접근은 언어 모델과 심층 신경망을 결합에 집중하지만, 이는 높은 연산 비용과 지연 시간 문제를 초래한다. 비신경망 기반의 선형 추천 모델은 효율적인 대안이 될 수 있으나, 부가 정보를 효과적으로 활용하는 방법에 대한 연구는 부족하다. 본 연구는 선형 모델에서 부가 정보를 효과적으로 활용할 수 있는 프레임워크를 제안한다. 텍스트 정보는 선형 모델의 학습에 직접 사용되기 어려우므로, 사전 학습된 텍스트 인코더를 통해 항목의 텍스트를 밀집 벡터로 변환한다. 이들은 풍부한 정보를 담고 있지만 항목 간 연관성은 이해하지 못한다. 이를 해결하기 위해 그래프 합성곱을 적용해 강화된 항목 표현을 얻는다. 얻어진 항목 표현은 사용자-항목 상호작용 행렬과 함께 선형 모델 학습에 활용된다. 광범위한 실험을 통해 제안 방법이 전체 성능을 향상하고, 특히 비인기 항목의 성능 개선에 효과적임을 확인하였다.
언어-영상 사전 학습 모델 기반 샘플 선택을 활용한 노이즈 레이블 학습
http://doi.org/10.5626/JOK.2023.50.6.511
심층신경망은 부정확한 레이블을 가진 데이터를 학습하는 경우 일반화 성능이 크게 저하되는 문제가 있다. 기존 연구는 모델이 학습 초기 단계에 정답 레이블을 가진 깨끗한 데이터를 주로 학습하는 경향을 관찰하였고, 이를 기반으로 손실 값이 작은 샘플을 깨끗한 데이터로 간주하여 데이터를 선별적으로 학습하는 샘플 선택 방법을 통해 성능을 개선하였다. 그러나 노이즈 레이블이 정답 레이블과 유사한 경우(예: 물개 vs 수달) 모델이 초기 학습 과정에서 노이즈 데이터를 빠르게 학습하여 샘플 선택 방법이 효과적이지 못한 한계가 있다. 본 논문에서는 사전 학습된 언어-영상 모델의 제로 샷 예측을 기반으로 모델의 초기 학습 과정 없이 깨끗한 데이터를 효과적으로 구분하여 학습하는 SLIP을 제안한다. 본 연구의 제안모델은 CIFAR-10, CIFAR-100, WebVision 데이터셋에서 학습 결과 기존 제안 방법들 대비 최대 18.45%p 개선된 성능을 보인다.