검색 : [ keyword: Convolutional Neural Network ] (25)

복수의 엣지 디바이스에서의 CNN 모델 분산 처리를 위한 축소된 분류 모델 활용 기법

김준영, 전종호, 기민관, 박기호

http://doi.org/10.5626/JOK.2020.47.8.787

최근 클라우드 서버로 전송되는 막대한 양의 데이터로 인해 발생하는 네트워크 부하 등의 여러 문제로 인하여, 데이터의 수집이 이루어지는 네트워크의 말단에서 자체적으로 데이터를 처리하는 엣지 컴퓨팅에 대한 요구가 증가하고 있다. 그러나 네트워크 말단에 위치한 엣지 디바이스는 대부분 성능이 제한되어 있어 클라우드 서버에서 사용되는 딥러닝 응용을 그대로 사용하기에는 어려움이 있다. 이러한 문제를 극복하기 위해, 본 논문에서는 딥러닝 모델을 축소된 분류 모델들로 나누어 활용해 복수의 엣지 디바이스에서 공동으로 추론을 수행하는 분산 처리 기법을 제안하였다. 여기서 사용된 축소된 분류 모델은 경량화 된 모델 가중치를 가지며, 전체 분류 레이블 중 일부에 해당하는 레이블에 대해 추론을 진행한다. 성능 측정 결과 제안하는 축소된 분류 모델의 결과를 취합하는 분산 처리 기법의 정확도가 기존 모델 대비 더 적은 파라미터를 갖도록 경량화를 하여도 기존 모델과 유사한 수준을 유지할 수 있음을 확인하였다.

SSD 방법을 이용한 Cut transition 검출 모델

박성민, 윤의녕, 조근식

http://doi.org/10.5626/JOK.2020.47.7.655

샷 경계 검출은 영상 콘텐츠 분석을 위한 필수적인 기술로 꾸준히 연구되고 있다. 본 논문에서는 기존 연구의 단점을 보완하고 Cut transition의 정확한 위치를 찾아내기 위해 SSD(Single Shot Multibox Detector) 방법을 이용한 종단간학습(End-to-End Learning) 모델을 제안한다. 여러 개의 Cut transition을 예측하기 위해 SSD의 다중 스케일 특징 맵(Multi-Scale Feature Map)과 Default box 개념을 적용하였으며, Cut transition의 특징 정보를 강화하기 위해 이미지 비교 방법 중 하나인 Image Concatenation 개념을 모델에 결합하였다. 제안하는 모델은 최신 연구와 비교하여 다시 레이블링을 한 ClipShots 데이터셋과 TRECVID 2007 데이터셋에서 각각 88.7%, 98.0%의 정확도를 보였다. 또한 기존의 딥러닝 모델보다 정답에 가까운 범위를 검출할 수 있었다.

고속 이산 코사인 변환을 이용한 새로운 경량 및 효율적인 콘볼루션 신경망

정준현, 배성호

http://doi.org/10.5626/JOK.2020.47.3.276

최근 개발된 경량화된 뉴럴 네트워크는 적은 개수의 모델 가중치 개수 및 낮은 연산량으로도 어느정도 높은 정확도를 유지한다. 그럼에도 불구하고, 기존 컨볼루션 뉴럴 네트워크들은 공통적으로 Pointwise Convolution (1×1 Convolution)에서 많은 가중치 개수를 가지며, 상당한 계산량을 유발한다. 본 논문은 최초로 Pointwise Convolution을 1차원 고속 이산 코사인 변환(FDCT)으로 대체하여 획기적으로 학습 가중치 값 개수를 줄였고 연산속도를 높였다. 본 논문은 구체적으로 두가지 측면, 즉 1) Block 단위에서의 DCT 적용 및 2) CNN 모델의 계층적 위치에 따른 DCT 적용을 통해 경량화를 제안한다. 실험결과, CIFAR100 이미지분류 데이터셋에 대해서 기존 MobileNet v1 모델 대비 학습 가중치 값 개수를 79.1% 줄이고 연산량을 48.3% 줄이면서 top-1 정확도는 0.8% 상승한 결과를 보였다.

교통 혼잡 원인과 영향을 분석하기 위한 시각적 분석 기술

피민규, 연한별, 손혜숙, 장윤

http://doi.org/10.5626/JOK.2020.47.2.195

본 논문에서는 교통 흐름 이론을 기반으로 교통 혼잡의 원인을 분석하는 기술을 제시한다. 우리는 GPS 궤적 및 차량 감지기 데이터(VD)와 같은 교통 데이터에서 차량의 흐름을 추출한다. 또한 우리는 교통 데이터에 정보이론의 엔트로피를 사용하여 차량의 흐름 변화를 식별한다. 그런 다음 혼잡 지역의 차량 흐름을 정량화할 수 있는 누적 차량 수 커브(N-curve)를 추출한다. 교통 흐름 이론에 따르면 혼잡유형에 따라 고유한 N-curve 패턴을 관찰할 수 있다. 우리는 N-curve를 네 가지의 혼잡 패턴으로 분류할 수 있는 합성곱 신경망을 설계한다. 교통 혼잡의 원인과 영향을 분석하는 것은 어렵고 상당한 경험과 지식이 필요하다. 따라서 논문에서는 교통 혼잡의 원인과 영향을 분석하기 위한 일련의 프로세스를 효율적으로 수행할 수 있는 시각적 분석 시스템을 제시한다. 논문에서는 두 가지의 사례 연구를 통해 교통 혼잡의 원인을 분석할 수 있는 시스템을 평가한다.

Dhash 기반 고속 악성코드 변종 탐지기법

김홍비, 신현석, 황준호, 이태진

http://doi.org/10.5626/JOK.2019.46.11.1207

악성코드 생성 도구와 난독화 기법의 대중화로 악성코드는 지능화되고 있지만 기존의 악성코드 탐지 기법은 악성코드에 대해 완벽하지 못한 탐지를 보여주고 있다. 이에 새롭게 등장하는 악성코드 중 다수가 기존에 발생했던 악성코드의 변종이라는 것과 변종 악성코드는 원본 악성코드와 비슷한 바이너리 데이터를 갖는 특징을 고려해 파일의 바이너리 데이터를 통해 이미지를 분류하는 Dhash 기반 악성코드 탐지 기법을 제시하며, Dhash 알고리즘의 전수비교로 인한 느린 분석 시간을 개선한 10-gram 알고리즘을 제시한다. 변종 악성코드 탐지에서 우수한 ssdeep 기법과의 비교를 통해 ssdeep이 탐지하지 못하는 영역에 대해 Dhash 알고리즘이 탐지했음을 보이며, 기존의 Dhash 알고리즘과 본 논문에서 제안하는 알고리즘의 탐지 속도 성능 비교 실험을 통해 제안하는 알고리즘의 우수성을 증명한다. 향후 다른 LSH기반 탐지 기법과 연계한 변종 악성코드 분석 기술 개발을 지속 진행할 예정이다.

K-means 클러스터링 방법과 유사도 측정 기반의 채팅 말뭉치 반자동 확장 방법

안재현, 고영중

http://doi.org/10.5626/JOK.2019.46.5.440

본 논문에서는 영화 자막, 극 대본과 같이 대량의 발화 데이터를 이용하여 채팅 말뭉치를 반자동으로 확장하는 방법을 제안한다. 채팅 말뭉치 확장을 위해 미리 구축된 채팅 말뭉치와 유사도 기법을 이용하여 채팅 유사도를 구하고, 채팅 유사도가 실험을 통해 얻은 임계값보다 크다면 올바른 채팅 쌍이라고 판단하였다. 본 논문에서 제안하는 것은 형태소 단위 임베딩 벡터와 합성곱 신경망 모델을 이용하여 발화 단위 표상을 생성하는 것이다. 그리고 반자동 구축 모델의 속도를 개선하기 위해서 K-means 클러스터링 방법을 적용하여 채팅 말뭉치를 군집, 계산량을 줄일 것을 제안한다. 그 결과 기본 발화 단위 표상생성 방법인 TF를 이용하는 것보다 정확률, 재현율, F1에서 각각 5,16%p, 6.09%p, 5.73%p 각각 상승하여 61.28%, 53.19%, 56.94%의 성능을 도출하였다. 그리고 속도 개선을 위해 발화를 클러스터링하여 속도 면에서도 103배 향상된 채팅 말뭉치 반자동 구축 모델을 구축할 수 있었다.

합성곱 신경망을 위한 Elastic Multiple Parametric Exponential Linear Units

김대호, 김재일

http://doi.org/10.5626/JOK.2019.46.5.469

활성화 함수는 신경망 모델의 비선형성과 깊이를 결정하는 중요한 요소이다. Rectified Linear Units (ReLU)가 제안된 이후, 평균값을 0에 가깝게 하여 학습의 속도를 높인 Exponential Linear Units (ELU)나 함수 기울기에 변화를 주어 성능을 향상시킨 Elastic Rectified Linear Units (EReLU)같은 다양한 형태의 활성화 함수가 소개되었다. 우리는 서로 다른 ELU와 EReLU를 일반화한 형태의 활성화 함수인 Elastic Multiple Parametric Exponential Linear Units (EMPELU)를 제안한다. EMPELU는 양수 영역에서는 임의의 범위로 기울기 변동을 주면서, 음수 영역은 학습 파라미터를 이용해 다양한 형태의 활성화 함수를 형성하도록 하였다. EMPELU는 합성곱 모델 기반 CIFAR-10/100의 이미지 분류에서 기존 활성화 함수에 비해 정확도 및 일반화에서 향상된 성능을 보였다.

자연어를 활용한 SQL문 생성을 위한 합성곱 신경망 기반 칼럼 예측 모델

정윤기, 김동민, 이종욱

http://doi.org/10.5626/JOK.2019.46.2.202

관계형 데이터베이스 시스템을 이용하여 대규모의 데이터를 검색하기 위해서는 테이블 스키마 및 SQL문을 이해해야 하는 필요성이 있다. 이를 해결하기 위해 자연어가 입력으로 주어질 때, 이에 대응하는 SQL문을 생성하는 연구가 최근 진행되고 있다. 기존 연구에서 가장 어려운 부분은 SQL문의 조건에 해당되는 칼럼을 효과적으로 예측하는 부분이며, 예측해야 하는 칼럼의 개수가 여러 개일 때 정확도가 크게 떨어지는 문제점이 있다. 본 논문에서는 칼럼 어텐션 메카니즘을 이용하여, 자연어 데이터의 숨겨진 표현을 효과적으로 추출하는 합성곱 신경망 모델을 제안한다. 본 연구의 제안 방법은 기존 방법 대비 약 6%이상 정확도가 향상되는 것을 확인할 수 있었다.

멀티모달 딥러닝 모델을 이용한 실감효과 구간 검출

임정선, 한미경, 윤현진

http://doi.org/10.5626/JOK.2018.45.12.1250

일반 영화를 4D 영화로 변환하기 위해서 실감효과를 추가할 구간을 검출 할 필요가 있다. 이를 자동화하기 위해 본 논문에서는 시각적 · 청각적 특징을 이용하여 실감효과 구간을 검출하는 멀티모달 딥러닝 모델을 제안한다. 실감효과 여부를 분류하기 위해 오디오 기반 컨볼루션 순환 신경망과 비디오 기반 롱 쇼트-텀 메모리, 다층 신경망을 이용하였다. 오디오 기반 모델과 비디오 기반 실감효과 분류 모델을 특징값-단계에서 결합하였다. 또한, 대화 구간에서는 실감효과가 잘 나타나지 않는다는 점을 이용하여 오디오 기반 컨볼루션 신경망 모델을 이용하여 비대화 구간을 검출하고, 앞서 획득한 실감효과 분류 모델결과와 스코어-단계에서 결합하였다. 마지막으로, 입력 윈도우 구간의 예측 스코어를 이용하여 전체 영화의 연속된 실감효과 구간을 검출하였다. 실제 4D 영화를 이용한 실험을 통해 시각적 · 청각적 특징을 모두 사용한 멀티모달 딥러닝 모델이 유니모달 딥러닝 모델에 비해 높은 검출 성능을 보여주는 것을 확인하였다.

합성곱 신경망과 영상 개선 신경망을 이용한 저해상도 영상 객체 인식

최인재, 서정인, 박혜영

http://doi.org/10.5626/JOK.2018.45.8.831

최근 합성곱 신경망을 비롯한 심층 학습 기술의 발전으로 영상에서의 객체 인식의 성능이 월등히 향상되었다. 하지만 객체 인식은 영상에 포함된 다양한 변형과 인식 대상이 되는 객체의 다양성 등으로 여전히 정복하기 어려운 문제들이 남아있다. 특히 저해상도 영상에서의 객체 인식에 관한 연구는 아직 초기 단계로 만족할 만한 성능을 보이지 못하고 있다. 본 논문에서는 저해상도 영상에서의 객체 인식 성능을 향상시키기 위한 영상 개선 신경망을 제안하고 이로부터 획득한 영상을 합성곱 신경망 기반의 객체인식 모델의 학습 및 인식에 추가적으로 활용함으로써 해상도 변화에 강건한 객체 인식 방법을 제안한다. 제안하는 방법의 효율성을 확인하기 위해 CIFAR-10 데이터베이스와 CIFAR-100 데이터베이스를 사용하여 저해상도 환경에서의 객체 인식 성능을 측정하였고, 제안하는 방법이 저해상도 객체 인식 성능을 향상시킴과 동시에 고해상도 객체 인식 성능도 안정적으로 유지하는 것을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr