검색 : [ keyword: 앙상블 ] (17)

멀티모달 오토인코더 앙상블 기반의 URL 문자열 및 HTML 그래프를 활용한 피싱 웹페이지 탐지

윤준호, 최석훈, 김혜정, 부석준

http://doi.org/10.5626/JOK.2025.52.6.461

인터넷의 발전으로 인해 피싱 공격에 노출되는 사용자가 증가하고 있으며, 이를 예방하기 위한 효과적인 탐지 방법이 필수적이다. 기존의 피싱 탐지 방법은 주로 URL의 문자 시퀀스를 분석하는 데 중점을 두었으나, 피싱 URL은 정상 URL과 유사한 패턴을 모방하고 그 수명이 짧아 탐지의 정확도에 한계가 있음이 알려졌다. 이러한 문제를 해결하기 위해 본 논문에서는 URL문자열과 HTML 그래프 데이터를 동시에 활용하는 멀티모달 앙상블 기반의 피싱 웹페이지 탐지 방법을 제안한다. 이 방법은 URL 데이터를 문자 단위로 분해하여 컨볼루션 오토인코더로 처리하고, HTML 의 DOM 구조를 그래프 형태로 변환한 후 그래프 컨볼루션 오토인코더를 통해 분석하여 트랜스포머 레이어를 통해 피싱 여부를 판단한다. 본 연구에서 제안한 모델은 기존 모델 대비 F1 Score 최대 18.91%p의 탐지 성능 개선을 달성했다. 또한, 케이스 분석을 통해 URL과 HTML 간의 상호관계성을 보인다.

딥러닝 기반 CCTV교통사고 탐지 및 응급구조 자동화

박창훈, 김지현, 조인희, 장순호, 권기학

http://doi.org/10.5626/JOK.2024.51.12.1061

본 연구에서는 CCTV 영상을 활용한 실시간 교통사고 탐지 및 인근 병원 정보 제공을 위한 새로운 접근법을 제시한다. 제안된 시스템은 Densenet121과 YOLOv8 모델을 결합하여 교통사고 발생 여부와 사고 유형을 효과적으로 식별할 수 있다. 사고 발생 위치를 기반으로 가장 가까운 응급실을 검색하고, 해당 병원의 수용 가능 여부를 실시간으로 확인한다. 이를 통해 사용자에게 신속하게 사고 정보와 인근 병원 정보를 제공함으로써 신고 지연 문제를 해결하고, 응급실 자원의 비효율적인 배분을 방지하여 보다 많은 생명을 구하는 것을 목표로 한다. 본 연구의 접근법은 교통사고 발생 시 초기 대응 시간을 단축시켜, 응급의료 서비스의 효율성을 극대화하고, 궁극적으로는 사고 피해를 최소화하는 데 기여할 수 있다.

S 여대 교내식당 식사 인원 예측; COVID-19 팬데믹 기간을 포함한 장기 데이터 활용

백채은, 권예슬, 오장민

http://doi.org/10.5626/JOK.2024.51.7.634

집단 급식에서 정확한 식사 인원 예측은 효율적인 운영, 잔반최소화, 그리고 사용자 만족도 향상을 위해 중요하다. 특히 대학교 교내식당은 다양한 환경 요소와 COVID-19 팬데믹으로 인한 수업 방식의 변화 로 예측이 더욱 어려워졌다. 이를 해결하기 위해, 본 연구는 COVID-19 팬데믹 기간과 대학 식당 환경에 특화 된 데이터를 활용하여 다양한 5가지의 모델을 학습하고 성능을 비교했다. 안정적인 예측을 위해 가장 성능이 좋은 앙상블 트리 기반 모델 3가지인 RandomForest, LightGBM, XGBoost의 예측값을 평균 내어 Mean Absolut Error (MAE) 30.96이라는 최종 결과를 만들었다. 주어진 최종 모델을 활용하여 정기적으로 예측 결 과를 교내식당에 제공함으로써 운영 현장에 실질적인 지원을 제공할 수 있다. 본 연구 결과는 COVID-19 팬데 믹을 포함한 비정상적 상황에서도 정확한 식사 인원 예측이 가능한 효과적인 방법론을 제시한다.

문맥과 의미 정보를 사용한 뉴로 심볼릭 앙상블 언어 표현

이주상, 옥철영

http://doi.org/10.5626/JOK.2022.49.12.1124

초거대 언어 모델의 등장으로 자연어 처리는 한 단계의 벽을 뛰어 넘는 계기가 되었다. 하지만, 초거대 언어 모델은 문맥에서 추출한 정보만을 사용하기 때문에 성능 향상을 위해 단순히 모델의 크기 또는 데이터의 양을 늘리는 방법을 선택했다. 이러한 방법은 언어 모델이 소비하는 자원의 양을 증가시켜왔다. 본 논문에서는 문맥적인 정보만을 사용하는 언어 모델에 어휘의 의미 정보를 함께 학습하는 뉴로 심볼릭 앙상블 언어 표현 방법을 제안한다. 한국어 어휘망(UWordMap)에서 상위어, 용언의 의미제약 정보 추출했으며, 단어의 의미 벡터를 추가로 사용했다. 4가지 영역에 대해서 뉴로 심볼릭 앙상블 언어 표현 모델을 테스트 했으며, 기계 독해 영역에서 기존 모델보다 좋은 성능을 보였다. 또한 기존의 모델보다 학습이 수렴하는 속도가 빠르며, 응용 영역의 데이터가 부족한 경우 기존 모델보다 좋은 성능을 보였다.

딥러닝 시계열 모형을 이용한 당분기 GDP 예측 성능 분석

이연희, 김영민, 유태완

http://doi.org/10.5626/JOK.2022.49.10.873

본 논문에서는 최근 각광 받고 있는 딥러닝 시계열 모형을 활용한 GDP 성장률 예측 알고리즘을 제안한다. 제안한 알고리즘은 빈도가 낮은 다수의 경제 시계열 데이터를 이용하여 안정적인 예측 성능을 보장하기 위한 앙상블 딥러닝 방식과, 경기변동 상황에서도 적응적 성능을 보장하기 위한 점진적 학습방법을 채택한다. 학습에 있어 경제부문 정보를 활용하여 성능이 개선됨을 보임으로써 도메인 지식과의 융합의 필요성을 확인함과 동시에 적응적 예측력을 제공하기 위한 AI 운영화 기술의 중요성을 강조한다. 코로나-19 기간에 대한 전통적 기계학습 모형과의 성능 비교를 통해 급격한 경기변동 하에서 딥러닝이 상대적으로 합리적인 예측 도구가 될 수 있음을 증명한다. 본 논문에서 제시한 딥러닝 기반의 적응적 AI 알고리즘은 AI 운영화 기술을 통해 딥러닝 기반 자율 적응 경제예측 시스템으로 발전할 것을 기대한다.

흉부 X-선 영상에서 밝기값 정규화 및 다중 스케일 폐-집중 패치를 사용한 앙상블 딥러닝 모델 기반의 폐렴 자동 분류

김윤조, 안진서, 홍헬렌

http://doi.org/10.5626/JOK.2022.49.9.677

소아 흉부 X-선 영상(CXR)은 밝기값이 불규칙하여 정상과 폐렴을 구분하기 어렵다. 또한 딥러닝 모델은 폐의 외부 영역에 잘못 집중하여 CXR을 오분류할 수 있다는 한계가 있다. 본 논문은 CXR 영상에서 밝기값 정규화 및 다중 스케일 폐-집중 패치를 사용한 앙상블 딥러닝 기반 폐렴 자동 분류 방법을 제안한다. 첫째, 불규칙한 폐 내부 밝기값을 개선하기 위해 세 가지 밝기값 정규화 방법을 각각 수행한다. 둘째, 폐 내부에 집중하여 학습하기 위해 폐 영역을 분할하여 관심 영역을 추출한다. 셋째, 다중 스케일 폐-집중 패치를 사용하여 폐렴의 특징을 학습한다. 마지막으로 분류 성능을 향상시키기 위해 어텐션 모듈을 추가한 앙상블 모델을 사용한다. 실험 결과, CLAHE를 적용한 큰 크기의 패치 사용 시 정확도 92%로 원 영상 대비 5%p 향상된 성능을 보였다. 또한 큰 크기와 중간 크기의 패치를 앙상블한 제안 방법이 정확도 93%로 가장 좋은 성능을 보였다.

비디오 질의응답 정확도 향상을 위해 신뢰성 기반 다중 선택 학습을 활용한 앙상블 모델에 관한 연구

박규민, 김아영, 박성배

http://doi.org/10.5626/JOK.2022.49.4.284

비디오 질의응답은 비디오와 질의를 입력으로 받아서 적절한 응답을 도출하는 문제로, 대표적인 멀티모달 문제 중 하나이다. 비디오 질의응답 모델은 질의에 적절한 응답을 도출하기 위해서 멀티모달 정보뿐만 아니라 시계열 정보를 처리할 수 있는 능력이 필요하다. 그래서 모든 질의에 강건하게 응답하는 단일 모델을 설계하는 것은 어려운 문제이다. 성능 향상을 위해 기존의 여러 모델들을 결합하는 방법이 있다. 하지만 기존의 여러 모델들을 결합하는 방법은 모델마다 비디오를 표현하는 관점이 다르기에 성능을 개선하기 위해서는 각 모델의 관점을 반영할 수 있는 앙상블 모델과 학습 기법이 필요하다. 본 논문에서는 비디오 질의응답 성능을 높이기 위하여 신뢰성 기반 다중 선택 학습(CMCL) 기반의 앙상블 모델을 제안한다. DramaQA 데이터셋으로 실험한 결과, 기존의 두 질의응답 모델에 CMCL을 적용한 모델이 단일 모델들보다 더 높은 성능을 보여주었으며 앙상블 방법들이 모델에 미치는 영향을 분석하였다.

시계열 access log data를 이용한 IT 인프라 이상징후 감지 앙상블 모델

김정원, 최호진

http://doi.org/10.5626/JOK.2021.48.9.1035

대규모 IT 서비스를 운영하는 곳에서 단지 하나의 시스템을 관리하는 경우는 매우 드물다. 물론 관제를 전담하는 조직이 있다면 서비스의 이상유무에 대해 모니터링이 가능하겠지만, 관제 담당자는 각 서비스의 업무 지식과 도메인에 대해 잘 알지 못하기 때문에, 특정 서비스의 비정상 여부를 판단하기 어려운 것이 사실이다. 따라서 각 서비스마다의 특성을 분석하고 패턴을 학습하여 이상여부를 판단하는 탐지 모델의 needs가 나날이 증가하고 있다. 본 연구에서는 웹서버의 access log에 기록되어 있는 시계열 데이터를 이용하여, 기존 스펙트럼 잔차 방식의 모델이 실시간으로 이상징후를 탐지할 수 있을지에 대해 살펴보고, 실시간 탐지가 어려운 문제를 해결하기 위해 다항회귀모델과 앙상블한 모델을 제시함으로써, 장애상황이 발생하기 전에 빠른 대처를 할 수 있도록 모델을 구현하였다. 그 결과 시스템 장애가 발생하기 전에 이상징후를 감지하여 선제대응을 할 수 있음을 확인할 수 있었다.

자연어 추론에서의 교차 검증 앙상블 기법

양기수, 황태선, 오동석, 박찬준, 임희석

http://doi.org/10.5626/JOK.2021.48.2.154

앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, ELMo, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

물체 추적을 위한 딥 러닝 기반의 앙상블 모델 연구

김민지, 정일채, 한보형

http://doi.org/10.5626/JOK.2021.48.2.211

컴퓨터 비전 분야에서 물체 추적은 비디오 스트림으로부터 입력되는 시각적 정보로부터 타겟물체의 위상 변화를 예측하는 분야이며, 보안 및 군사기술이 요구하는 응용분야에서 중요하게 적용될 수 있는 기술이다. 최근의 딥 러닝 기반의 물체 추적 기술들은 검출기 기반 접근법(Tracking-by-Detection) 및 템플릿 대응 기반 접근법(template matching) 등을 통해 그 성능을 크게 향상시켰지만 접근방식에 따라 그 장단점이 분명하였다. 본 논문에서는 위의 두 접근방법을 응용하는 앙상블 모델 연구를 통해 단점을 보완하는 알고리즘을 제안한다. 제안되는 앙상블 알고리즘은 최근의 저명한 추적 알고리즘을 위한 벤치마크, OTB100, UAV123, LaSOT에서 모두 높은 성능향상을 보고한다.


Search




Journal of KIISE

  • ISSN : 2383-630X(Print)
  • ISSN : 2383-6296(Electronic)
  • KCI Accredited Journal

사무국

  • Tel. +82-2-588-9240
  • Fax. +82-2-521-1352
  • E-mail. chwoo@kiise.or.kr