검색 : [ author: 이재구 ] (3)

대규모 드론 장면의 3D 가우시안 스플래팅 효율화: 장면 분할 및 점 보충 전략

강윤석, 이재석, 최재웅, 이재구

http://doi.org/10.5626/JOK.2025.52.7.587

본 연구는 드론 촬영을 통해 얻은 대규모 3D 매핑 환경에서 3D 가우시안 스플래팅을 적용할 때 발생하는 VRAM 부족 문제에 대응하는 전략을 제시한다. 대규모 장면을 효과적으로 처리하기 위해 입력 데이터를 분할 및 독립적인 최적화를 진행하며, 개별적으로 최적화된 장면을 병합한다. 또한, 최적화 시각 장면의 품질을 보다 향상시키기 위해 드론 촬영본의 특성을 고려하여 새로운 점을 보충하는 전략을 도입하였다. 이를 통해 기존 연구 대비 1/3로 VRAM 사용량을 줄였으며, PSNR 기준 평균 2.5%의 품질이 향상하고자 하였다. 본 연구의 접근 방식은 VRAM 사용을 최소화하면서도, 3D 재구성의 정확도와 품질을 향상시키는 데 중점을 둔다.

멀티모달 그래프-SMILES 표현을 통한 거대 언어 모델에서의 분자 이해 향상

http://doi.org/10.5626/JOK.2025.52.5.379

최근 거대 언어 모델의 발전은 다양한 과업에서 뛰어난 성과를 보이며, 특히 멀티모달로 확장하는 연구도 활발히 진행되고 있다. 특히 BLIP-2는 Q-Former를 통해 이미지와 문자를 효율적으로 정렬하여 성능을 높였으며, 멀티모달 데이터로 사전 학습되어 고정된 이미지 인코더가 이를 지원한다. 이러한 발전에 영감을 받아 MolCA 모델은 분자 분야에 BLIP-2를 확장하여 성능을 높였지만, 그래프 인코더는 단일모달 데이터로 사전 학습되어 모델 학습 중 갱신이 필요한 한계가 있다. 따라서 본 논문에서는 이를 멀티모달 데이터로 사전 학습된 그래프 인코더로 대체하고 고정하는 방안을 제시한다. 실험 결과, 멀티모달 데이터로 사전 학습된 그래프 인코더를 사용할 때 성능이 대체로 향상되었으며, 단일모달 데이터로 사전 학습된 그래프 인코더는 갱신할 때 성능이 높은 것에 비해 멀티모달 데이터로 사전 학습된 그래프 인코더는 갱신하지 않을 때 모든 지표에서 성능이 더 좋은 것을 확인할 수 있었다.

자기 교사 학습 모델의 특장점 분석과 사진 분류 및 객체 탐지 성능 분석 연구

윤의현, 이현종, 김동건, 박주찬, 김진규, 이재구

http://doi.org/10.5626/JOK.2024.51.7.609

최근, 교사 학습 기반의 인공지능 분야가 급속도로 발전하고 있다. 그러나 교사 학습은 정답 값이 지정된 데이터집합에 의존하기 때문에, 정답 값을 확보하기 위한 비용이 커진다. 이러한 문제점을 해 결하기 위해 정답 값없이 사진의 일반적인 특징을 학습할 수 있는 자기 교사 학습(Self-supervised learning)이 연구되고 있다. 본 논문에서는 다양한 자기 교사 학습 모델을 학습 방식과 백본 네트워크 기 준으로 분류하고, 각 모델의 장단점, 성능을 비교 분석하였다. 성능 비교를 위해 사진 분류 작업을 사용하 였다. 또한 전이 학습의 성능을 비교하기 위해 세밀한 예측 과업의 성능 또한 비교 분석하였다. 그 결과, 긍정적 쌍만 사용하는 모델이 노이즈를 최소화하여 부정적인 쌍을 같이 사용하는 모델들보다 높은 성능을 달성하였다. 또한 세밀한 예측의 경우 이미지를 마스킹하여 학습하거나 멀티스테이지 모델 등을 활용하여 지역적인 정보를 추가로 학습하는 방식이 더욱 높은 성능을 달성한 것을 확인하였다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr