검색 : [ author: Jae-Gil Lee ] (4)

오토 인코더 기반 추천 시스템을 위한 잠재 표현 학습 방법

박동민, 강준혁, 이재길

http://doi.org/10.5626/JOK.2020.47.2.207

온라인 상의 상품의 수가 기하 급수적으로 증가함에 따라 고객이 스스로 원하는 상품을 찾는 것이 어려워졌다. 적절한 상품의 추천은 고객의 잠재적 수요를 만족시키고 판매자의 이윤을 증대시키기에 그 중요성이 상당히 크다. 최근에는 인공신경망을 활용한 차원 축소 기법인 오토 인코더 기반의 협업 필터링 방법이 성능 면에서 두각을 나타내었다. 하지만, 오토 인코더의 잠재 표현 분포 조정을 통해 추천 성능을 향상시키는 방법은 아직 많이 연구되지 않았다. 본 연구에서는 오토 인코더 기반 협업 필터링 방법에 결합되어 상품 추천 성능을 더욱 향상시키는 밀집 잠재 표현 학습방법 (DenseLR)을 제안한다. 본 연구의 핵심 아이디어는 유저 구매 정보 벡터들의 잠재 표현을 효과적으로 밀집 시킴에 따라 축소 차원에서의 협업 필터링 효과를 강화하는 것이다. 3가지 실제 구매 데이터 셋에 대해 기존 최첨단 연구들과 성능비교실험을 진행한 결과 제안 방법이 모든 데이터 셋에 대해 가장 높은 성능을 보였다.

효율적인 분산 복합 이벤트 처리를 위한 탐욕적 규칙 분배 알고리즘

신유주, 이재길

http://doi.org/10.5626/JOK.2019.46.12.1222

복합 이벤트 처리 시스템은 여러 스트림 데이터를 실시간으로 받아 유의미한 복잡한 상황을 이벤트 규칙이나 질의, 연산으로 찾아내고 분석하는 시스템을 말한다. 실시간으로 들어오는 데이터양이 증가하게 되면 여러 스트림 데이터와 이벤트 규칙을 여러 대의 서버에 분배해 처리하게 된다. 하지만 각 서버에 가해질 부하에 대한 고려 없이 스트림 데이터와 이벤트 규칙을 분배하게 되면 스트림 데이터가 과도하게 복제되어 네트워크 입출력에 부하를 주고 분배된 이벤트 규칙과 스트림 데이터를 맞춰보는 시간이 증가하게 된다. 본 논문에서는 이를 막기 위해 효율적인 스트림 데이터 빛 이벤트 규칙 분배 알고리즘을 제안한다. 이 알고리즘은 이벤트 규칙에 점수를 부여하고 점수가 큰 순서대로 이벤트 규칙을 정렬한다. 분배 시에는 주어진 전체 부하 함숫값을 가장 작게 증가시키는 서버에 각 이벤트 규칙을 정렬된 순서대로 하나씩 분배한다. 제안한 알고리즘은 최적화 검증과 성능 실험을 통해 그 우수성을 보였다. 최적화 검증에서는 합성 데이터를 이용해 이 알고리즘이 다른 알고리즘에 비해 최적의 분배 결과에 가장 가깝다는 것을 보인다. 성능 실험에서는 실제 데이터와 이벤트 규칙을 사용한 분산 복합 이벤트 처리 시스템에서 복제율과 지연시간을 다른 대안 알고리즘과 비교해 제안한 알고리즘의 성능 우위를 입증했다.

실시간 공간 빅데이터 스트림 분산 처리를 위한 부하 균형화 방법

윤수식, 이재길

http://doi.org/10.5626/JOK.2017.44.11.1209

최근 스마트 자동차, 스마트폰과 같은 다양한 소스로부터 공간 빅데이터 스트림을 수집하는 것이 매우 용이해졌다. 공간 데이터 스트림은 편중되고 동적으로 변화하는 분포를 지니기 때문에 전체 부하가 분산 클러스터 내의 작업자들에게 효율적으로 분배되지 않을 경우 전체 시스템의 성능이 저하된다. 본 연구에서는 공간 데이터 스트림에 특화된 부하 균형화 알고리즘인 적응적 공간 키 그룹핑(ASKG)을 제안한다. ASKG의 핵심 아이디어는 공간 데이터 스트림의 최근 분포를 학습하고 이를 기반으로 향후 유입되는 데이터 스트림이 각 작업자에게 고르게 분배되도록 하는 새로운 그룹핑 스키마를 제안하는 것이다. 이를 공간 분포의 변화에 맞춰 주기적으로 반복함으로서 적응적으로 부하 불균형을 해결할 수 있다. 실제 데이터셋에 대해 작업자의 수, 입력 속도, 공간 질의 처리 시간을 변화시키며 성능을 평가한 결과, 대안 알고리즘 대비 제안 방법이 부하 불균형, 처리량, 지연 시간에서 높은 개선효과를 보였다.

MapReduce 기반 분산 이미지 특징점 추출을 활용한 빠르고 확장성 있는 이미지 검색 알고리즘

송환준, 이진우, 이재길

http://doi.org/

IoT 시대를 맞아 모바일 기기의 급격한 성능 향상에 힘입어 폭발적으로 증가하는 멀티미디어 빅데이터의 빠른 처리가 요구되고 있다. 하지만, 이런 환경의 대격변 속에서도 이미지 검색 연구 분야에서는 정확도 향상에 주로 초점을 맞춘 나머지, 고해상도 멀티미디어 데이터 Query에 대한 빠른 처리 측면에서는 제대로 대응하지 못하고 있다. 이에 우리는 이미지 검색만을 분산화한 선행연구와 달리 MapReduce 기반 분산 이미지 특징점 추출 기법을 활용하여 정확도는 유지하면서 빠른 응답시간을 확보하며, BIRCH 인덱싱을 기반으로 메모리 확장성까지 해결한 새로운 분산 이미지 검색 알고리즘을 제안한다. 그리고 제안하는 분산 이미지 검색 알고리즘의 정확도, 처리시간, 확장성에 대한 실험을 통해 뛰어난 성능을 확인한다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr