디지털 라이브러리[ 검색결과 ]
불균형이 있는 소규모 드라마 데이터 셋을 위한 준지도 객체 검출 기법
http://doi.org/10.5626/JOK.2024.51.11.978
드라마 영상 속의 프레임 이미지는 주로 사람을 중심으로 줌 인 되는 경우가 많다. 결과적으로, 드라마 데이터에는 사람 중심의 이미지가 우세하며 이로 인해서 자연스럽게 클래스 불균형이 발생한다. 본 논문에서는 객체 검출 작업을 위한 드라마 데이터의 클래스 불균형 문제를 다루고 준지도 학습 프레임워크 내에서 이 문제를 해결하기 위한 다양한 샘플링 방법을 제안한다. 성능 평가를 위한 실험에서 특수한 샘플링 방법을 사용하여 제안한 준지도 학습 접근 방식이 기존의 지도 및 준지도 방법보다 성능이 우수하다는 것을 보여준다. 이 연구는 고유한 특성을 가진 특수 데이터 셋에서 객체 검출 성능을 최적화하기 위해 적절한 학습 데이터와 샘플링 방법을 선택하는 것이 중요하다는 점을 강조한다.
CCTV 동영상에서 보행자 이상행동 이벤트 검출을 위한 딥러닝 기반 이상행동 이벤트 인식 방법
http://doi.org/10.5626/JOK.2024.51.9.771
CCTV의 설치가 증가하면서 모니터링 업무량이 크게 증가했다. 하지만, 단순히 인력을 늘리는 것만으로는 해결할 수 없는 한계에 부딪혔다. 이 문제를 해결하기 위해, 지능형 CCTV 기술이 개발되었으나, 이마저도 다양한 상황에서 성능 저하의 문제를 겪고 있다. 본 논문에서는 다양한 상황에 적용 가능하고 강건 한 CCTV 동영상 통합 이상행동 인식 방법을 제안한다. 동영상으로부터 프레임 이미지를 추출하여 원시 이 미지, 히트맵 표현 이미지 입력을 사용하며, 이미지 단계와 특징 벡터 단계에서의 병합 방식을 통해 특징 벡터를 추출하고, 이를 바탕으로 2차원 합성곱 신경망 모델과 3차원 합성곱 신경망 모델, 그리고 LSTM과 평균 풀링을 활용한 이상행동 인식 방법을 제안한다. 성능 검증을 위해 소분류 클래스를 정의하고 총 1,957개의 이상행동 동영상 클립 데이터를 생성하여 검증한다. 제안하는 방법은 CCTV 영상을 통한 이상 행동 인식의 정확도를 향상시키며, 보안 및 감시 시스템의 효율성을 증대시킬 수 있을 것으로 기대한다.
다중 스케일 객체 검출을 위한 Graph Convolution Network 기반의 특성 맵 융합 기법
http://doi.org/10.5626/JOK.2022.49.8.627
FPN (Feature Pyramid Network)은 객체 검출의 다중 스케일 문제를 해결하기 위한 특성 맵 융합 기법이다. 그러나, FPN은 인접한 해상도에 초점을 맞추어 특성 맵 융합을 수행하기 때문에 인접하지 않은 계층에 포함된 의미 정보가 희석되는 문제가 있다. 본 논문에서는 다중 스케일 객체 검출을 위한 Graph Convolution Network (GCN) 기반의 특성 맵 융합 기법을 제안한다. 제안된 GCN 기반 방법은 학습 가능한 인접 행렬 가중치에 따라 모든 계층의 특성 맵 정보를 동적으로 융합한다. 인접 행렬 가중치는 객체의 스케일 정보를 적응적으로 반영하기 위해 다중 스케일 attention 메커니즘을 기반으로 생성된다. 특성 맵 융합 과정은 인접 행렬과 특성 노드 행렬 간 행렬 곱 연산을 통해 수행된다. 실험을 통해 기존 FPN 방법보다 PASCAL-VOC 벤치마크 데이터 셋에서 다중 스케일 객체 검출 성능을 향상시키는 것을 보임으로서 제안 기법의 성능을 검증하였다.
Backbone Network for Object Detection with Multiple Dilated Convolutions and Feature Summation
Vani Natalia Kuntjono, Seunghyun Ko, Yang Fang, Geunsik Jo
http://doi.org/10.5626/JOK.2018.45.8.786
컨볼루션 뉴럴 네트워크의 발전으로 인해 객체 탐지, 이미지 세분화 및 객체 분류 분야에서도 100개 이상의 컨볼루션 레이어를 사용하는 Deep CNN을 사용하는 추세로 이어지고 있다. 그러나 Deep CNN을 사용하기 위해 많은 그래픽 메모리가 필요하며 제한된 자원이나 실시간 객체 탐지를 원하는 사람들에게는 이런 Deep CNN이 적합하지 않다. 본 논문에서는 배수 팽창된 컨볼루션과 특징합계 기반의 객체 탐지를 위한 새로운 백본 네트워크를 제안한다. 특징합계는 그래디언트를 쉽게 전달하고 컨볼빙으로 인해 발생하는 공간 정보의 손실을 최소화한다. 그리고 팽창된 컨볼루션을 사용함으로써 변수를 추가하지 않고도 개별 뉴런의 수용 영역을 넓힐 수 있다. 또한, Deep하지 않은 뉴럴 네트워크를 백본으로 사용함으로써 제한된 자원으로 이미지넷 데이터 세트에서 사전 교육을 하지 않더라도 제안하는 네트워크를 사용할 수 있다. Pascal VOC 및 MS COCO 데이터를 사용한 실험 결과 제안된 네트워크는 각각 71%와 38.2%의 정확도를 보였다.