디지털 라이브러리[ 검색결과 ]
분포 외 데이터 문제를 활용한 암묵적 언어폭력 탐지
http://doi.org/10.5626/JOK.2022.49.11.948
암묵적 언어폭력 탐지는 표현의 다양성과 명확한 기준의 부재로 인하여 해결하기 어려운 문제이다. 선행연구에 따르면 암묵적 언어폭력을 세세하게 분류하고 정의함과 동시에 이에 해당하는 데이터셋을 만드는 과정이 필요하다. 그러나 이는 효율적이지 않을 뿐만 아니라 언어의 변화에 유연하게 대처하기 어렵다는 단점이 있다. 본 연구는 이를 해결하기 위한 효율적이고 효과적인 방법론으로 암묵적 언어폭력을 분포 외 데이터로 처리하는 방법을 처음으로 제안한다. 암묵적 언어폭력 탐지에서 분포 외 데이터 방법론을 적용한 사전학습 모델이 일반 사전학습 모델과 어휘 기반 모델보다 효과적임을 실험을 통해 확인하였다. 또한 감성분석과 사례 연구를 통하여 암묵적 언어폭력의 특성을 살펴보았으며 일반 사전학습 모델과 본 연구에서 제안하는 모델의 차이를 자세히 분석하였다.
위치 정보 공유 사물(LISO) : 사용자 관심을 기반으로 소셜 미디어 데이터를 사용하는 상황 인식 지능형 서비스
http://doi.org/10.5626/JOK.2020.47.9.814
소셜 미디어(SNS) 데이터를 학습 알고리즘으로 분석하면, 개인적 관심사나 사회적 관심사 정보를 추출할 수 있다. 학습 알고리즘은 분석에 사용되는 정보의 양이 많을수록 정확도가 높아지지만, 분석시간이 증가하는 문제점을 가지고 있다. 이러한 문제를 극복하기 위한 방안으로, 위치 정보 공유 사물(Location Information Sharing Objects, LISO)시스템을 제안한다. LISO는 사물의 타입에 따라 사물의 상황 분석의 역할을 나눔으로써 매우 큰 데이터로부터 학습이 가능하도록 하는 것을 목표로 한다. 고정위치 사물은 위치 기반의 소셜 미디어 데이터를 수집하여 사회적 관심사를 분석하는 사물로서, 광범위한 데이터의 수집과 분석을 담당하여 정보를 가진다. 모바일 사물은 수시로 변동되는 상황 정보와 사용자의 개인적 관심사에 대한 정보를 분석한다. 이러한 사물의 유형에 따른 대용량 소셜 미디어 데이터의 분석의 역할 분담은, 대용량 정보의 분석의 짐을 분산시킨다.
소셜 데이터 기반 실시간 식자재 물가 예측 모형
http://doi.org/10.5626/JOK.2017.44.12.1258
신속하고 정확한 시장의 물가 파악은 소비자 개인을 넘어 정부와 관련 기업의 주요 관심 사항이다. 그러나 국가 단위의 물가 데이터 취합은 적지 않은 시간과 비용이 필요하다. 특히 통계 데이터 관련 인프라가 미약한 개발도상국의 경우 물가 지표 파악은 일 혹은 주 단위로 지연되어 국가의 정책 결정에 필요한 주요한 데이터의 부재가 있을 뿐만 아니라 투자 잠재성을 저하시킨다. 이러한 배경에서 이 연구는 온라인 소셜 네트워크 빅데이터를 활용한 실시간 물가 예측(Nowcast) 모델을 제시한다. 제안하는 모델은 트위터와 같은 온라인 빅데이터를 수집 및 분석함으로써 주요 소비재 시장물가를 실시간으로 단기 예측하는 알고리즘으로, 실제 15개월간 인도네시아를 대상으로 주요 식자재의 일별 물가 추이 예측에서 높은 정확도를 보임을 검증하였다. 해당 모델은 다양한 언어와 상품군으로 확장 가능하며, 기존 경제 통계를 보조함으로써 시장동향의 파악으로 정부와 기업의 전략 수립에 기여할 것으로 기대된다.
소셜 미디어에서 사용자 행위 분석을 통한 사용자 평판 관리 기법
최근 소셜 네트워크 서비스는 단순히 사용자들의 인맥 관계 형성뿐만 아니라 다양한 형태의 정보를 생성하고 공유하는 개방형 플랫폼으로 변화하고 있다. 기존 사용자 평판 관리 기법은 사용자 프로필, 명시적 관계, 명시적 평가를 기반으로 사용자 신뢰성을 판별하기 때문에 명시적 평가가 잘 이루어지지 않는 소셜 미디어에서 사용자 신뢰성을 판별하기에는 부적합하다. 본 논문에서는 소셜 미디어에 대한 소셜행위들을 분석하고 명시적인 평가 뿐만 아니라 암시적 평가를 고려한 사용자 평판 관리 기법을 제안한다. 제안하는 기법은 소셜 행위로부터 긍정적 암시적 평가와 부정적 암시적 평가를 도출한다. 또한, 사용자의 전문성을 고려하기 위해 분야별로 사용자 평판 정보를 생성하고 사용자의 영향력을 판단하기 위해 평가에 참여한 사용자들의 수를 반영한다. 이를 통해 명시적 평가가 없는 사용자도 평판 정보를 생성할 수 있도록 하고 소셜 미디어에 더 적합한 사용자 평판 정보를 생성한다.