51권 9호,
9월 2024
디지털 라이브러리
상용 시스템에서 구동 가능한 소프트웨어 기반의 안전한 분리 메모리 시스템
http://doi.org/10.5626/JOK.2024.51.9.757
분리 메모리 시스템은 여러 서버의 메모리를 통합해 응용에 대규모 메모리를 제공하는 기술이 다. 그런데 여러 서버의 메모리를 통합하기 때문에 한 서버의 보안 위협이 다른 서버로 쉽게 전파될 수 있다는 문제가 있다. 이를 해결하기 위한 기존 연구들은 특수 하드웨어를 기반으로 하기 때문에 추가 비용 이 발생하며 상용 서버에 즉시 도입하기 어렵다. 본 논문은 소프트웨어만을 활용한 분리 메모리 시스템 보 안 보장 기법을 제시한다. 제안 기법은 분리 메모리 시스템에서 발생할 수 있는 보안 위협을 방지하기 위 해 시스템 내 서버 간 전송되는 데이터들에 대한 암호화와 무결성 검증을 소프트웨어로 수행한다. 소프트 웨어 구현으로 인한 성능 부하를 줄이기 위해 데이터 전송과 복호화를 중첩시키고 민감 데이터만 선택적 으로 암호화한다. 또, 암호화 메타데이터 크기를 최적화해 메모리 부하를 줄인다. 실험 결과, 분리 메모리 로 인한 성능 부하가 적은 경우 보안 기법 적용에 따른 추가 성능 부하가 거의 없음을 확인하였다.
CCTV 동영상에서 보행자 이상행동 이벤트 검출을 위한 딥러닝 기반 이상행동 이벤트 인식 방법
http://doi.org/10.5626/JOK.2024.51.9.771
CCTV의 설치가 증가하면서 모니터링 업무량이 크게 증가했다. 하지만, 단순히 인력을 늘리는 것만으로는 해결할 수 없는 한계에 부딪혔다. 이 문제를 해결하기 위해, 지능형 CCTV 기술이 개발되었으나, 이마저도 다양한 상황에서 성능 저하의 문제를 겪고 있다. 본 논문에서는 다양한 상황에 적용 가능하고 강건 한 CCTV 동영상 통합 이상행동 인식 방법을 제안한다. 동영상으로부터 프레임 이미지를 추출하여 원시 이 미지, 히트맵 표현 이미지 입력을 사용하며, 이미지 단계와 특징 벡터 단계에서의 병합 방식을 통해 특징 벡터를 추출하고, 이를 바탕으로 2차원 합성곱 신경망 모델과 3차원 합성곱 신경망 모델, 그리고 LSTM과 평균 풀링을 활용한 이상행동 인식 방법을 제안한다. 성능 검증을 위해 소분류 클래스를 정의하고 총 1,957개의 이상행동 동영상 클립 데이터를 생성하여 검증한다. 제안하는 방법은 CCTV 영상을 통한 이상 행동 인식의 정확도를 향상시키며, 보안 및 감시 시스템의 효율성을 증대시킬 수 있을 것으로 기대한다.
대규모 자연어 모델의 병렬 학습 가속화를 위한 서버 할당 최적화 알고리즘 비교 연구
http://doi.org/10.5626/JOK.2024.51.9.783
최근 대규모 언어모델(LLM)이 다양한 분야에 활용됨에 따라 보다 높은 성능을 보유한 모델 개발에 대한 수요가 증가하고 있다. 지금까지 대부분의 사용자들은 모델 학습에 필요한 계산 능력과 메모리 용 량을 충족시키기 위해 GPU가 장착된 다수의 서버를 활용하고 있고, 이들을 효율적으로 이용하는 방법론으로 3D 병렬화 방법론을 대표적으로 채택하고 있다. 그러나 3D 병렬화는 빈번하게 진행되는 서버간 대규모 데이 터 전송 시간이 길어 전체 학습 시간을 지연시키는 문제가 있다. 이를 해결 하기 위해 비균일한 클러스터 네 트워크 상태를 사전에 파악하여 서버 및 GPU를 최적화된 병렬 구성으로 배치하는 방법론이 기존 연구에서 제안되었으나, 이 역시 고전적인 최적화 알고리즘인 SA(Simulated Annealing)가 매핑을 위해 사용되었다는 한계가 있다. 이에 이러한 문제를 해결하고자 본 연구에서는 유전(Genetic) 알고리즘, SAT(Satisfiability) 알 고리즘을 해당 문제에 추가 적용하여 다양한 실험 환경에서 각 알고리즘의 성능을 비교 분석하였다.
Octave-YOLO: 실시간 객체 탐지를 위한 직접적 다중 스케일 특징 융합
http://doi.org/10.5626/JOK.2024.51.9.792
최근 객체 탐지 분야에서는 다양한 크기의 객체를 감지하기 위하여 여러 스케일의 특징 맵들을 융합하는 다중 스케일 특징 융합을 위한 많은 연구가 진행되고 있다. 이러한 다중 스케일의 특징맵을 융합하기 위해, FPN(Feature Pyramid Network)이나 PANet(Path Aggregation Network) 등의 다양한 네트워크 구조가 제시되었다. FPN을 개선한 PANet은 하향식 경로뿐만 아니라 상향식 경로를 추가하여 객체 탐지 분야에서 큰 성능 향상을 이루었다. 그러나 기존 PANet에서의 다중 스케일 특징 융합을 위한 업스케일링 또는 다운스케일링 과정은 원래 특징 맵에서 보존된 저수준 또는 고수준 정보의 손실을 야기 했다. 본 논문에서는 옥타브 합성곱(Octave Convolution)을 통한 별도의 처리 없이 다양한 크기의 특징 맵을 원활하게 융합할 수 있는 Octave C2f 모듈을 제안하여 정확성을 향상시키고 계산 복잡도를 줄였다. PASCAL VOC 및 MS COCO 데이터 세트를 사용한 실험 결과, YOLOv8 기본 모델과 비교하여 개선된 정확성과 감소된 계산 작업량 및 매개변수 개수를 확인할 수 있었다.
시공간 그래프 랜덤워크를 활용한 비디오 의미구조 이해
http://doi.org/10.5626/JOK.2024.51.9.801
긴 비디오 이해는 비디오 내 다양한 의미단위들을 찾고, 이들 간 복잡한 관계 해석에 초점을 맞춘다. 기존 방식은 합성곱 신경망이나 transformer 기반 모델을 활용하여 짧은 클립들에 대한 문맥정보 를 인코딩하고, 이들 간의 시간적 관계를 고려한다. 그러나 해당 방식으로는 비디오 내부에 존재하는 의미 단위들간 복잡한 관계 포착이 어렵다. 본 논문에서는 이러한 의미단위들 간 관계를 명시적으로 표현하기 위해 객체를 정점, 객체들 간 시공간 관계를 간선으로 하는 시공간 그래프로 비디오 입력을 재표현한다. 또한, 해당 그래프에서 시공간 랜덤워크를 통해 얻은 고차원적 의미관계(high-order relationship) 정보를 활용하여, 주요 의미단위를 더 작은 단위들의 구성으로 표현하는 새로운 방법을 제안한다. 다양한 물체들 의 복잡한 행동에 관련된 비디오 데이터셋 CATER를 활용한 실험으로, 제안하는 방식이 효과적인 의미단 위 포착능력을 가짐을 입증하였다.
신용카드 거래 데이터를 활용한 BiLSTM-GAT 기반 매출 예측 모델 연구
http://doi.org/10.5626/JOK.2024.51.9.807
신용카드 거래데이터를 통한 매출 예측은 소비자 구매 패턴 및 시장 동향을 파악하는데 중요한 역할을 한다. 그러나 기존의 통계 및 기계 학습 모델은 지리적 데이터와 서비스 업종, 인구 및 거래시 간의 매출 정보 등 다양한 특성 간의 관계와 시간적 특성을 분석하는데 한계가 있다. 본 논문에서는 상권 간의 특성에 따른 관계와 매출의 시계열 특성을 동시에 분석할 수 있는 두 가지 모델을 제안한다. 제안된 두 모델의 성능을 비교 분석하기 위해 상권 간 거리 및 특성별 매출 유사도를 기반으로 그래프를 구성하 였다. 이후, 제안 모델의 성능을 기존 시계열 모델인 LSTM 및 BiLSTM과 비교하였다. 실험 결과, RMSE를 기준으로 GAT-BiLSTM 모델은 BiLSTM 모델 대비 약 15%, BiLSTM-GAT 모델은 BiLSTM 모델 대비 약 29% 예측 정확도가 향상되었다.
구름(KULLM): 한국어 지시어에 특화된 거대 언어 모델
http://doi.org/10.5626/JOK.2024.51.9.817
Large Language Models (LLM)의 출현은 자연어 처리 분야의 연구 패러다임을 전환시켰다. LLM의 핵심적인 성능 향상은 지시어 튜닝(instruction-tuning)기법의 결과로 알려져 있다. 그러나, 현재 대부분의 연구가 영어 중심으로 진행되고 있어, 다양한 언어에 대한 접근이 필요하다. 본 연구는 한국어 지시어(instruction-following)모델의 개발 및 평가 방법을 제시한다. 본 연구에서는 한국어 지시어 데이터 셋을 활용하여 LLM 모델을 튜닝하며, 다양한 데이터셋 조합의 효과에 대한 성능 분석을 수행한다. 최종 결과로 개발된 한국어 지시어 모델을 오픈소스로 제공하여 한국어 LLM 연구의 발전에 기여하고자 한다.
한국어 버그리포트에서 번역을 활용한 정보검색기반 버그 추적
http://doi.org/10.5626/JOK.2024.51.9.827
정보검색기반 버그 추적 기술은 버그리포트를 쿼리로 사용하여 결함이 있는 소스 파일을 자동 으로 찾아주는 기술로, 개발자들이 버그 위치를 찾는데 소모되는 시간을 크게 단축시킬 수 있다. 이 기술 의 핵심은 버그리포트와 소스 파일 텍스트 간 유사도를 계산하는 것이다. 그러나 한국어로 작성된 버그리 포트의 경우, 영어를 기반으로 하는 소스 코드와의 단어 매칭이 어렵기 때문에, 텍스트 유사도가 효과적이 지 않을 수 있다. 본 연구에서는 국내 개발자들이 이 기술을 효과적으로 사용할 수 있도록, 번역을 활용한 한국어 버그리포트를 위한 정보검색기반 버그 추적 기술을 제안한다. 이를 위해 다양한 번역기 결과를 종 합적으로 활용하는 soft voting 방식을 적용한다. 제안 기법의 성능 검증을 위해, 269개의 한국어 버그리 포트를 수집하고, 세 종류의 번역기와 두 종류의 순위 모델을 통해 실험을 수행했다. 그 결과, 제안 기법이 기존 버그리포트 대비 결함 추적 성능을 44% 개선시킴을 확인했다.
카메라 기반 정밀도로지도 생성을 위한 노면의 높이 및 텍스쳐 모델링 기법
http://doi.org/10.5626/JOK.2024.51.9.835
자율 주행 차량을 위한 정밀도로 지도의 생성과 갱신의 요구가 증대함에 따라 구축과 운용비용이 저렴한 다중 카메라 시스템이 측량 장비의 센서로 활용되고 있다. 다시점 영상의 스테레오 정합과 특 징점 매칭 및 이를 통한 측위 등의 기술이 이러한 카메라 기반 3차원 지도 복원에 활용되고 있다. 본 논 문에서는 차량의 상부에 장착된 다중 카메라 시스템을 기반으로, 점밀도와 정확도가 높은 노면의 3차원 점 군 복원을 위한 hexgrid 기반 노면 모델 방법과 다시점 영상을 기반의 키프레임 자세와 3차원 점군을 이 용하여 높이를 추정하고 텍스쳐를 정합하는 방법론을 제안한다. 초광각 어안렌즈가 장착된 다중 카메라와 GPS를 장착한 측량 시스템에 적용한 결과 최소 점 간격 0.025 m의 정밀한 도로 모델 생성이 가능함을 확인하였다.
Re-Identification에서의 대조 연합 학습 시스템
http://doi.org/10.5626/JOK.2024.51.9.841
방대한 데이터 수집과 컴퓨팅 파워의 발전으로 AI 기술이 다양한 서비스에 활발히 적용되고 있다. 전통적인 중앙 집중형 클라우드 데이터 처리 방식은 민감한 사용자 데이터의 노출에 대한 우려를 불 러일으킨다. 이러한 문제를 해결하기 위해 연합 학습(FL)이 분산형 학습 방법으로 부상했다. FL은 클라이 언트가 로컬 데이터로 모델을 학습한 후, 로컬에서 업데이트된 모델을 중앙 서버로 보내는 방식이다. 중앙 서버는 이러한 업데이트된 모델을 집계하여 로컬 데이터를 직접 접근하지 않고도 글로벌 모델을 학습할 수 있게 한다. 본 논문에서는 다양한 도메인에서 재식별(Re-ID) 작업을 위해 특별히 설계된 새로운 FL 프레임워크인 FedCON을 제시한다. FedCON은 FL에 대조 학습을 적용하여 특징 표현을 향상시키며, 이 는 Re-ID 분야에서 특징 벡터의 유사성을 강조하여 동일한 ID를 가진 객체를 다른 이미지에서도 동일하 게 식별하는 데 유용하다. 특징 유사성에 중점을 둠으로써 FedCON은 데이터 이질성 문제를 효과적으로 해결하고 Re-ID 응용에서 글로벌 모델의 성능을 향상시킨다. 인물 및 차량 Re-ID 데이터셋에 대한 실증 연구는 FedCON이 기존의 Re-ID를 위한 FL 방법들을 능가함을 보여준다. 다양한 CCTV 데이터셋을 사 용한 인물 Re-ID 실험에서 FedCON은 여러 baseline과의 비교에서 우수한 성능을 보였다. 또한, FedCON은 VeRi-776 및 VRIC와 같은 실제 데이터셋에서 차량 Re-ID 성능을 크게 향상시켜 실제 응용 가능성을 보여준다.