검색 : [ keyword: Image-to-Image Translation ] (2)

RDID-GAN: 비식별화 이미지 데이터 복원을 통한 효과적인 학습데이터 생성

오원석, 배강민, 배유석

http://doi.org/10.5626/JOK.2021.48.12.1329

최근 여러 사회 문제들을 예방 및 신속하게 대처하기 위해 CCTV가 설치되고 있고 인공지능을 활용해 이를 효과적으로 처리하는 방안이 연구되고 있다. 하지만, CCTV에서 수집한 데이터는 개인정보 침해의 우려가 있어 비식별화 작업 없이는 자유롭게 사회문제 해결을 위한 모델을 연구하는데 사용할 수 없다. 따라서, 본 논문에서는 RDID-GAN을 제안하여 비식별화된 사람의 얼굴을 임의로 복원하여 개인정보 침해의 우려를 줄이고 네트워크 학습에도 부정적인 영향을 주지 않는 효과적인 데이터셋 제작 방안을 제안한다. RDID-GAN은 attention module을 활용해 비식별화된 부분에 집중하여 합당한 결과를 생성할 수 있도록 하였다. 우리는 실험을 통해 해당 모델과 기존의 제안된 image-to-image 변환 모델을 정성적 및 정량적으로 비교하였다.

적대적 생성 신경망을 이용한 얼굴 감정인식 데이터 증강

김진용, 조근식

http://doi.org/10.5626/JOK.2021.48.4.398

컴퓨터 비전의 얼굴 감정인식 분야는 딥러닝의 다양한 신경망을 통해 최근 의미있는 행보를 보이고 있다. 그러나 주요하게 사용되는 데이터셋들은 “클래스 불균형”이라는 문제를 안고 있고 이는 딥러닝 모델의 정확도를 하락시키는 요인이 된다. 그러므로 클래스 불균형이라는 문제를 해소하기 위한 연구들이 활발하게 진행되고 있다. 본 논문에서는 얼굴 감정인식 데이터셋으로 사용되는 FER2013, RAF_single 데이터셋의 클래스 불균형을 해소하기 위해 적대적 생성 신경망을 이용한 얼굴 감정인식 데이터 증강 모델인 “RDGAN”을 제안한다. RDGAN은 기존 이미지 간 변환을 위한 적대적 생성 신경망을 바탕으로 표현 판별자를 추가하여 기존 연구보다 클래스에 적합한 이미지를 생성 및 변환하는 네트워크이다. RDGAN으로 증강된 데이터셋은 데이터 증강을 하지 않은 데이터셋과 비교하여 FER2013과 RAF_single에서 각각 평균 4.805%p, 0.857%p의 성능 향상을 보였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr