디지털 라이브러리[ 검색결과 ]
대형 언어 모델 응답의 신뢰성 향상을 위한 환각 탐지 및 설명 모델
http://doi.org/10.5626/JOK.2025.52.5.404
최근 대형 언어 모델(LLM)의 발전은 자연어 처리 분야에서 주목할 만한 성과를 거두었으나, 환각 현상으로 인한 신뢰성 문제가 여전히 존재한다. 기존의 환각 연구는 주로 탐지 자체에 초점을 맞추고 있어, 환각 발생의 원인과 맥락을 설명하는 능력이 부족하다. 이에 본 연구에서는 단순한 탐지를 넘어 환각의 근거까지 제시하는 환각 특화 모델을 제안한다. 제안하는 모델은 환각 여부를 분류하는 동시에, 탐지된 환각에 대한 설명을 생성하여 사용자가 모델의 응답을 보다 신뢰할 수 있도록 설계되었다. 실험 결과, 본 모델은 Llama3 70B 및 GPT4o와 같은 대형 모델보다 높은 환각 탐지 정확도를 보였으며, 신뢰도 높은 설명을 일관되게 생성하는 것으로 나타났다. 특히, 제안하는 모델은 다양한 데이터 세트에서도 안정적인 탐지 및 설명 성능을 유지하며 높은 적응력을 보였다. 본 연구는 환각 탐지와 설명 생성을 통합함으로써, 언어 모델의 환각을 평가하는 새로운 방법을 제시한다.
트랜스포머 기반 시계열 데이터 분류작업을 위한 GASF와 CNN을 사용한 CLS 토큰 추가 임베딩 방법
http://doi.org/10.5626/JOK.2023.50.7.573
시계열 데이터란 일정한 시간 동안 수집된 일련의 순차적으로 정해진 데이터 셋의 집합을 의미하며 예측, 분류, 이상치 탐지 등에 활용되고 있다. 기존 시계열 분야는 순환신경망으로 구성된 모델을 주로 활용하여 분석하였지만, 최근 트랜스포머의 개발로 인하여 연구 추세가 변화하고 있다. 하지만 트랜스포머는 시계열 데이터 예측에는 좋은 성능을 보이지만, 분류 작업에는 상대적으로 부족한 성능을 보인다. 본 논문에서는 시계열 데이터를 트랜스포머에 입력으로 활용하기 위해 그라미안 각도 합산 필드와 컨볼루션 신경망을 사용하여 생성한 분류 토큰을 추가하는 임베딩 방식을 제안하며, 사전 학습 기법을 활용하여 성능을 향상시킴을 보인다. 제안하는 모델 성능을 비교하기 위하여 12개의 서로 다른 모델들과 평균 정확도를 기준으로 성능 평가를 진행하였으며, 제안하는 모델은 다른 모델에 비해 최소 1.4% 최대 21.1%까지 성능 향상을 보인다.
그래프 기반 Wi-Fi 신호 지도 구축 및 갱신 기법
http://doi.org/10.5626/JOK.2017.44.6.643
Wi-Fi 기반 실내 측위 기법 중 핑거프린팅 측위는 높은 정밀도로 가장 보편적인 기술 중 하나이다. 그러나 초기 신호 지도 구축과 이 후 갱신 과정은 수동으로 이루어져 많은 노동력과 시간 비용을 발생시키는 단점이 있다. 본 논문에서는 그래프를 기반으로 각 정점에서 초기 신호 지도를 구축 하는 것을 제안한다. 그리고 사용자로부터 획득한 신호 세기 데이터를 각 간선에 참조 위치를 생성하여 자동으로 매핑하여 신호 지도를 갱신하는 방법을 제안한다. 제안하는 방식은 초기 신호 지도를 그래프의 정점에서만 신호를 수집하여 구축하고 갱신은 자동으로 수행하므로 기존 핑거프린팅 무선 측위 기법의 단점인 노동력과 시간 비용을 크게 감소시킬 수 있다. 실험 결과, 실제 위치에서의 데이터와의 비교를 통해 신호 지도 갱신 기법을 검증할 수 있었고 자동으로 신호 지도를 갱신하는 작업으로 약 3.2m, 3.5m의 정밀도를 갖는 신호 지도를 구축할 수 있었다.
IFC 기반 웹 가시화를 위한 데이터 구조 설계
IFC 국제표준 규격은 EXPRESS 언어기반의 STEP 스키마 구조로 기술되어 있으므로 BIM 협업에 참여하는 주체자들이 BIM 모델링 형상정보를 공유하는데 접근성이 용이하지 않음을 확인할 수 있었다. IFC 내에 정의된 BIM 모델링 형상정보를 검토하기 위해서는 데스크탑 PC에 IFC 뷰어 어플리케이션을 설치하여 STEP 구조를 파싱하고 3D 가시화를 위한 형상구성 처리를 해야 하기 때문이다. 따라서 IFC 정보모델을 파싱하여 완전한 3D 모델링 형태의 정보구조로 변환하여 web 클라이언트에서 가시화가 용이하도록 경량화 데이터 구조로 설계하였으며, 실험결과 약 40%의 감량효과가 나타났으며, PC에서 스마트폰에 이르기까지 WebGL을 지원하는 모든 web browser에서 동일한 품질의 3D 렌더링 결과를 확인할 수 있었다. 시공 프로세스가 끝난 후 완성된 IFC 데이터를 기반으로 web 표준에 관한 응용연구를 진행한다면 일반 건축물의 유지관리에서 실내공간 위치기반 서비스에 이르는 여러 분야에 활용이 가능할 것이다.
무선 멀티미디어 센서 네트워크에서 에너지 효율적인 협력 통신 방법
무선 센서 네트워크에서 에너지 효율을 높이기 위해 클러스터링 방법이 제안되었다. 클러스터링 방법은 데이터를 수집하고 전달하는 계층 구조를 형성하고 있다. 그러나 대용량 데이터를 전송하는 무선 멀티미디어 센서 네트워크에서 기존의 무선 센서 네트워크의 클러스터링 기법은 과도한 데이터 전송에너지 소모량과 극도로 짧은 수명으로 인하여 적용하는 데에 어려움이 있다. 본 논문에서는 기존의 문제점을 해결하기 위하여 상황에 따른 협력 통신 기법을 적용한 대용량 데이터 전송 방법으로 EEAC를 제안하여 에너지 효율을 높였다. 실험결과 제안방법은 기존의 방법보다 에너지 효율이 약 2.5배 향상되었음을 보였다.
다중 GPU를 이용한 R-tree의 병렬 범위 질의 처리 기법
다차원의 데이터를 색인하기 위해 처음 R-tree가 제안된 이후 다양한 방법으로 질의 성능을 향상시키기 위한 많은 연구가 이루어졌다. 그 가운데 다중프로세서를 이용한 병렬 기법으로 질의 성능을 향상시킨 GPU기반의 R-tree가 제안되었다. 하지만 GPU가 갖는 물리적 메모리 크기의 한계가 있어 데이터의 크기가 제한된다. 이에 본 논문에서는 다중 GPU를 이용한 R-tree의 병렬 범위 질의 처리 기법인 MGR-tree 제안한다. 제안하는 MGR-tree는 기존의 GPU기반의 R-tree 질의 처리 기법을 기반으로 하여 다중 GPU에서 질의 처리를 가능하게 R-tree의 노드를 다중 GPU상에 분할하여 분산 처리 하였다. 실험을 통해 MGR-tree는 GPU에서의 선형검색에 비해 최대 9.1배, GPU기반 R-tree에 비해 최대 1.6배 가량의 성능이 향상된 것을 확인하였다.
GPGPU를 이용한 Hilbert R-tree 벌크로딩 고속화 기법
R tree는 공간 데이터베이스 분야에서 가장 널리 쓰이는 색인 구조이며 다양한 변형된 기법들이 제안되었다. 이 기법들 중 Hilbert R tree는 공간 채움 곡선인 Hilbert 곡선을 이용해서 대용량의 데이터를 고비용의 분할 과정 없이 R tree를 구성하는 기법이다. 하지만 기존의 CPU기반의 Hilbert R tree는 대용량의 데이터를 처리할 때는 순차적인 접근으로 발생되는 고비용의 전처리 비용과 느린 구축시간으로 실제 응용에 적용되기에는 한계가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 GPU를 이용해서 데이터의 Hilbert 매핑을 병렬화 하고 이를 통해서 최종적으로 GPU의 메모리에 Hilbert R tree의 벌크로딩을 고속화하는 기법을 제안한다. GPU기반의 Hilbert R tree는 inversed cell 기법과 트리구조 패킹의 병렬화 기법을 통해서 벌크로딩의 성능을 향상시켰다. 실험 결과에서는 기존의 CPU 기반의 벌크로딩에 비해 최대 45배의 성능향상을 보여주었다.