효과적인 음향잡음 제거를 위한 사전 훈련된 생성자를 사용하는 적대적 생성망 


48권  3호, pp. 334-339, 3월  2021
10.5626/JOK.2021.48.3.334


PDF

  요약

Speech enhancement GAN (SEGAN)은 딥러닝 모델 중 하나인 적대적 생성망을 기반으로 음향잡음을 제거하는데 좋은 성능을 보여주는 모델 중 하나이다. 하지만 매우 넓은 분포를 가지는 비정적 잡음을 하나의 생성자로 학습하는 과정에서 생성자는 쉽게 불안정해진다는 문제가 있다. 본 논문에서는 이러한 문제를 해결하기 위해 기학습된 생성자를 활용한 적대학습 방법을 제안한다. 오토인코더와 동일한 방식으로 기학습된 생성자의 출력을 적대학습 생성자의 입력으로 사용함으로써, 일차적으로 축소된 데이터를 활용해 분포 매칭의 어려움을 완화시키고, 학습의 안정성을 높인다. 본 논문에서는 객관적으로 모델의 성능을 평가하기 위해 scale Invariant Signal to Noise Ratio (SI-SNR) 평가지표를 활용하였다. 실험결과 잡음 음성 대비 SI-SNR이 약 4.08 상승하여 제안 방법이 잡음을 제거하는 것에 유용함을 확인하였다.


  통계
2022년 11월부터 누적 집계
동일한 세션일 때 여러 번 접속해도 한 번만 카운트됩니다. 그래프 위에 마우스를 올리면 자세한 수치를 확인하실 수 있습니다.


  논문 참조

[IEEE Style]

K. Lim and S. Cho, "Generative Adversarial Networks Using Pre-trained Generator for Effective Auditory Noise Suppression," Journal of KIISE, JOK, vol. 48, no. 3, pp. 334-339, 2021. DOI: 10.5626/JOK.2021.48.3.334.


[ACM Style]

Kyunghyun Lim and Sungbae Cho. 2021. Generative Adversarial Networks Using Pre-trained Generator for Effective Auditory Noise Suppression. Journal of KIISE, JOK, 48, 3, (2021), 334-339. DOI: 10.5626/JOK.2021.48.3.334.


[KCI Style]

임경현, 조성배, "효과적인 음향잡음 제거를 위한 사전 훈련된 생성자를 사용하는 적대적 생성망," 한국정보과학회 논문지, 제48권, 제3호, 334~339쪽, 2021. DOI: 10.5626/JOK.2021.48.3.334.


[Endnote/Zotero/Mendeley (RIS)]  Download


[BibTeX]  Download



Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr