디지털 라이브러리[ 검색결과 ]
자기 교사 학습 모델의 특장점 분석과 사진 분류 및 객체 탐지 성능 분석 연구
http://doi.org/10.5626/JOK.2024.51.7.609
최근, 교사 학습 기반의 인공지능 분야가 급속도로 발전하고 있다. 그러나 교사 학습은 정답 값이 지정된 데이터집합에 의존하기 때문에, 정답 값을 확보하기 위한 비용이 커진다. 이러한 문제점을 해 결하기 위해 정답 값없이 사진의 일반적인 특징을 학습할 수 있는 자기 교사 학습(Self-supervised learning)이 연구되고 있다. 본 논문에서는 다양한 자기 교사 학습 모델을 학습 방식과 백본 네트워크 기 준으로 분류하고, 각 모델의 장단점, 성능을 비교 분석하였다. 성능 비교를 위해 사진 분류 작업을 사용하 였다. 또한 전이 학습의 성능을 비교하기 위해 세밀한 예측 과업의 성능 또한 비교 분석하였다. 그 결과, 긍정적 쌍만 사용하는 모델이 노이즈를 최소화하여 부정적인 쌍을 같이 사용하는 모델들보다 높은 성능을 달성하였다. 또한 세밀한 예측의 경우 이미지를 마스킹하여 학습하거나 멀티스테이지 모델 등을 활용하여 지역적인 정보를 추가로 학습하는 방식이 더욱 높은 성능을 달성한 것을 확인하였다.
데이터셋 품질 개선을 위한 Self-Supervised Vision Transformer 기반의 객체 Pseudo-label 생성 기법
http://doi.org/10.5626/JOK.2024.51.1.49
이미지 분할은 이미지에 존재하는 객체를 객체 상자로 지역화하고 픽셀을 적절한 범주로 분류하는 컴퓨터 비전의 중요한 분야 중 하나이다. Instance segmentation 모델의 성능을 위해서는 다양한 크기의 객체에 대한 라벨을 가진 데이터셋이 요구된다. 하지만 최근 공개된 ‘Small Object Detection을 위한 이미지’ 데이터셋은 크기가 크고 일반적인 객체에 대한 라벨이 부족하여 잠재적 성능 저하를 유발한다. 본 논문에서는 위와 같은 문제를 해결하기 위해 비지도 학습 기반의 pseudo-labeling 방법론을 응용하여 일반적인 객체에 대한 pseudo-label을 생성함으로써 데이터셋의 품질을 개선한다. 실험결과, 기존 데이터셋 대비 작은 객체 분할 성능이 (+2.54 AP) 증가하였다. 추가적으로 적은 양의 데이터를 이용한 경우에서도 성능의 증가도 확인할 수 있었다. 이에 따라 제안된 방법론을 통해 효과적으로 데이터셋의 품질이 개선된 것을 확인할 수 있었다.
자기지도학습으로 추론된 특징을 이용한 CT 영상의 보간 방법
http://doi.org/10.5626/JOK.2021.48.9.1007
볼륨 데이터는 3차원 내부 정보를 가지고 있어서 정량적인 분석이 가능하다. 특히 의료영상 데이터는 인체 내부 구조를 3차원으로 시각화 할 수 있으나 이를 위해서는 균등한 복셀이 필요하다. 하지만 CT 데이터의 경우 방사선량을 줄이기 위해 슬라이스 이미지 사이의 간격이 넓은 볼륨 데이터를 얻는 경우가 있다. 이 경우, 3차원으로 재구성할 때 불연속적으로 시각화되거나 정량적인 오차를 유발할 수 있어 이미지 보간이 필요하게 된다. 본 논문에서는 고화질의 슬라이스 이미지로부터 CT 이미지 슬라이스 간의 보간에 필요한 정보를 자기지도학습으로 유추하는 방법을 제안하고자 한다. 이를 위하여 축소한 슬라이스 이미지를 신경망의 입력값으로 넣고, 신경망은 이 이미지를 원본 이미지로 복원하는 과정을 학습한다. 본 연구에서 제안하는 방법은 최근접 이웃 보간법과 삼선형 보간법보다 세부 정보를 유추하는 장점을 보이고 참값을 가지고 지도 학습으로 학습한 신경망 결과보다 성능이 저하되지 않음을 확인하였다.