검색 : [ author: Jongwuk Lee ] (15)

항목 인기도 편향 관점에서의 잡음제거 오토인코더의 효과

김진홍, 이재웅, 이종욱

http://doi.org/10.5626/JOK.2021.48.5.575

잡음제거 오토인코더는 추천 시스템에서 최근 흔히 사용되고 있는 모델이다. 이 모델은 입력에 잡음을 주어 학습시키는 오토인코더의 신경망 기반 추천 모델로 오토인코더에 비해 높은 정확도를 보인다. 본 논문에서는 잡음제거 오토인코더의 학습 과정을 이해하기 위해서, 항목의 인기도 편향 관점에서 잡음의 효과를 분석한다. 분석을 위해 우리는 다음의 두 가지 방법으로 실험을 설계한다. 우선, 오토인코더에 잡음을 주는 방법으로 학습된 항목 벡터의 L2 노름(L2-norm)의 변화를 관찰한다. 다음으로는, 항목의 인기도에 의해 일차적으로 추출된 항목에만 잡음을 주는 방법을 통해, 잡음제거 오토인코더의 성능 향상 효과와 항목의 인기도간 관련성을 분석한다. 실험결과를 통해 인기도에 의해 생긴 항목 벡터 노름의 분산의 크기가 잡음에 의해 줄어드는 것을 확인하였으며, 또한 인기도가 높은 항목에 잡음을 줄 때 정확도 향상에 도움이 되는 것을 확인하였다.

신경망 및 비신경망 오토인코더 기반 추천 모델의 성능 비교 및 분석

정윤기, 이종욱

http://doi.org/10.5626/JOK.2020.47.11.1078

다양한 분야에 심층 신경망이 도입되어 획기적인 성능 개선을 보이고 있으나, 최근 심층 신경 망 기반 추천 모델의 성능 개선이 크게 보이지 않는다는 주장이 나오고 있다. 이와 같은 문제는 추천 연구에 통용되는 실험 환경의 부재와 제안 모델 성능에 대한 엄밀한 분석 부재에 기인한다. 본 논문에서는 1) 추천 모델의 공정한 비교를 위한 실험 프로토콜을 구성하고, 2) 추천 모델의 한 축인 오토인코더 기반추천 모델에 대해서 실험적 검증을 수행하며, 3) 사용자와 항목 인기도를 기준으로 여러 개의 세부 그룹으로 나누어 실험 결과를 분석한다. 실험 결과, 모든 데이터셋에서 신경망 기반 모델의 추천 성능이 비신경망 대비 일관적인 성능 개선을 보이지 않았으며, 신경망 모델 내에서도 주된 정확도 개선을 확인할 수 없었다. 한편, 세부 그룹별 성능 평가 결과에서는 인기 항목에선 비신경망 모델의, 비인기 항목에선 신경망 모델의 정확도가 높음이 확인하였고, 이를 통해 신경망 모델의 복잡성이 비인기 항목에 대한 추천에 도움이 될 수 있다고 판단된다.

자연어를 활용한 SQL문 생성을 위한 합성곱 신경망 기반 칼럼 예측 모델

정윤기, 김동민, 이종욱

http://doi.org/10.5626/JOK.2019.46.2.202

관계형 데이터베이스 시스템을 이용하여 대규모의 데이터를 검색하기 위해서는 테이블 스키마 및 SQL문을 이해해야 하는 필요성이 있다. 이를 해결하기 위해 자연어가 입력으로 주어질 때, 이에 대응하는 SQL문을 생성하는 연구가 최근 진행되고 있다. 기존 연구에서 가장 어려운 부분은 SQL문의 조건에 해당되는 칼럼을 효과적으로 예측하는 부분이며, 예측해야 하는 칼럼의 개수가 여러 개일 때 정확도가 크게 떨어지는 문제점이 있다. 본 논문에서는 칼럼 어텐션 메카니즘을 이용하여, 자연어 데이터의 숨겨진 표현을 효과적으로 추출하는 합성곱 신경망 모델을 제안한다. 본 연구의 제안 방법은 기존 방법 대비 약 6%이상 정확도가 향상되는 것을 확인할 수 있었다.

다차원 공간에서 정확한 선형 스카이라인 알고리즘

박희수, 이종욱

http://doi.org/10.5626/JOK.2018.45.10.1089

스카이라인 질의는 지배 개념을 이용하여 사용자 선호도에 적합한 후보 집합을 찾아주는 질의로, 여러 개의 데이터의 속성을 고려한 의사 결정 문제에 효과적이다. 하지만 데이터의 속성이 많아질 경우 스카이라인의 결과가 지나치게 많아지는 문제가 발생한다. 본 논문에서는 이와 같은 문제를 해결하기 위해서 사용자의 선호도 함수를 선형 함수로 제약한 선형 스카이라인 질의를 정확하게 계산하는 알고리즘을 제안한다. 기존 연구에서는 데이터 속성의 수만큼 가상의 점을 데이터에 추가하여 선형 스카이라인을 구하는 방법을 제안하였으며, 이와 같은 방법은 정확한 선형 스카이라인을 구하지 못함이 확인되었다. 본 논문에서는 이와 같은 문제점을 해결하기 위해 가상의 점을 추가하는 방법을 수정하였으며, 정확한 선형 스카이라인을 찾을 수 있도록 증명하고, 다양한 실험을 통해 제안 방법의 정확함을 검증하였다.

상위 N개 항목의 추천 정확도 향상을 위한 효과적인 선호도 표현방법

이재웅, 이종욱

http://doi.org/10.5626/JOK.2017.44.6.621

협업필터링은 사용자들이 평가한 항목들의 유사성을 기반으로 평가되지 않은 항목을 효과적으로 추천해주는 기법이다. 기존에는 사용자가 평가하지 않은 항목 중 상위  개 항목의 추천 정확도를 높이기 위하여 사용자의 항목의 대한 상대적 선호도를 반영하는 쌍 기반 선호도(pair-wise preference)와 목록 기반 선호도(list-wise preference)가 제안되었다. 하지만 이러한 방법들은 사용자가 평가한 항목 간의 상대적인 선호도를 표현하는데 한계가 있으며, 각각의 항목들의 중요도를 반영할 수 없는 단점이 있다. 본 논문에서는 유사도 및 순위 값을 계산할 때 평점 선호도 표현 방법과 역 사용자 빈도수(inverse user frequency)를 이용하여 사용자의 잠재된 선호도를 표현하는 새로운 방법을 제안한다. 제안 방법을 메모리 기반 협업필터링에 적용하여 비교한 결과 기존 방법보다 최대 2배 이상 정확도가 향상되는 것을 확인할 수 있었다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr