디지털 라이브러리[ 검색결과 ]
개인형 이동장치 주행 보조의 도로 분류를 위한 신경망 모델 탐색: 정확도 및 연산 효율성에 대한 비교 연구
http://doi.org/10.5626/JOK.2023.50.12.1083
개인형 이동장치 이용량과 함께 교통 사고 빈도가 증가하고 있다. 대부분의 사고는 자동차 또는 보행자와의 사고였으며 주행도로에 대한 준수율이 낮다. 주행도로를 인식해 알려주는 보조 시스템은 이 문제를 개선시킬 수 있다. 도로 이미지는 재질 특성이 강하기 때문에 Image classification 분야에서 연구되는 모델들을 적용하기에 적절하다. 이 논문에서는 도로 이미지 분류 모델을 상황에 따라 선택할 수 있도록 파라미터의 수가 200만개에서 3,000만개 사이인 여러가지 모델을 성능을 비교하고 있으며, 대부분의 모델은 95%이상의 정확도를 보였고 top2 accuracy는 대부분의 모델이 99%이상을 보이는 것을 실험으로 설명했다. 본 논문의 실험 결과에 따라 가장 가중치수가 적으면서도 좋은 성능을 보인 모델은 mobilenet v2이었으며, 모든 클래스에 대해 90%이상 정확도를 달성해 클래스 별 정확도가 안정적인 모델은 EfficientNet이었다.
적은 자원의 흉부 X-ray 분류 성능 향상을 위한 데이터 증강과 결합한 약지도 학습
http://doi.org/10.5626/JOK.2021.48.9.1027
딥러닝 기반의 의료영상 분석기술은 방사선 전문의의 판독 능력을 능가하는 정확도를 보일 정도로 발전하였다. 하지만, 의료영상 학습에 사용하는 샘플 데이터를 만드는 것(labeling)은 전문가가 필요한 영역이고 큰 비용과 시간이 소요된다. 또한, 많은 경우에 의료영상의 훈련용 데이터는 질환별로 불균형한 분포를 가진다. 예를 들어, 흉부 X-ray 분류 학습을 위한 ChestX-ray14 데이터셋의 경우, 침윤(infiltration)과 탈장(hernia)의 데이터 분포의 차이는 87배에 이른다. 본 연구에서는 불균형한 흉부 X-ray 분류의 성능 향상을 위하여 데이터 증강(data augmentation) 알고리즘인 Mixup과 약지도 학습(weakly supervised learning)을 결합하는 방법을 제안한다. 제안하는 방법은 데이터 불균형 완화를 위하여 적은 수의 레이블이 있는 데이터와 다수의 레이블이 없는 데이터에 복합적으로 Mixup 알고리즘을 적용하고, 교사 모델(teacher model)과 학생 모델(student model)을 순환하면서 레이블이 없는 데이터를 효과적으로 활용하는 커리큘럼 학습(curriculum learning)을 수행하는 것이다. 의료 현장에서 생각할 수 있는 적은 수의 레이블이 있는 데이터(labeled data)와 레이블이 없는 데이터(unlabeled data)가 존재하는 환경을 구성하여 실험을 수행한 결과 데이터 증강과 약지도 학습을 결합함으로써 분류 성능이 향상됨을 보였으며, 순환적인 커리큘럼 학습이 효과가 있음을 확인하였다.
저해상도 이미지 분류를 위한 고해상도 이미지로부터의 Self-Attention 정보 추출 네트워크
http://doi.org/10.5626/JOK.2020.47.11.1027
기존의 딥러닝 모델들은 고화질의 이미지들을 활용하여 연구 개발되었으며, 화질이 낮아질수록 급격히 성능이 낮아진다. 본 연구는 저화질 이미지에도 효과적으로 대응할 수 있는 딥러닝 모델을 개발하고자, 고화질의 이미지로부터 효과적으로 분류를 할 수 있는 정보를 Attention Map의 형태로 추출했다. 이후 Knowledge Distillation 기법을 활용하여 고화질 이미지상에서 추출한 Attention Map을 저해상도 이미지 모델에 전달하는 네트워크를 제안했으며, 16×16의 저해상도 CIFAR100 이미지를 분류했을 때 에러율을 2.94% 낮출 수 있었다. 이는 32×32에서 16×16으로 이미지 해상도를 낮췄을 때 에러 감소율의 38.43%에 해당하는 수치로, 본 네트워크의 우수성을 입증할 수 있었다.
합성곱 신경망을 위한 Elastic Multiple Parametric Exponential Linear Units
http://doi.org/10.5626/JOK.2019.46.5.469
활성화 함수는 신경망 모델의 비선형성과 깊이를 결정하는 중요한 요소이다. Rectified Linear Units (ReLU)가 제안된 이후, 평균값을 0에 가깝게 하여 학습의 속도를 높인 Exponential Linear Units (ELU)나 함수 기울기에 변화를 주어 성능을 향상시킨 Elastic Rectified Linear Units (EReLU)같은 다양한 형태의 활성화 함수가 소개되었다. 우리는 서로 다른 ELU와 EReLU를 일반화한 형태의 활성화 함수인 Elastic Multiple Parametric Exponential Linear Units (EMPELU)를 제안한다. EMPELU는 양수 영역에서는 임의의 범위로 기울기 변동을 주면서, 음수 영역은 학습 파라미터를 이용해 다양한 형태의 활성화 함수를 형성하도록 하였다. EMPELU는 합성곱 모델 기반 CIFAR-10/100의 이미지 분류에서 기존 활성화 함수에 비해 정확도 및 일반화에서 향상된 성능을 보였다.