Notice June 17, 2025

히포티앤씨 이상호 연구원, AAAI 2025 논문 Oral Presentation 선정 (상위 6.1%)

#AAAI

히포티앤씨 이상호 연구원, AAAI 2025 논문 Oral Presentation 선정 (상위 6.1%)

히포티앤씨 이상호 연구원이 성균관대학교 전일용·박호건 교수와 함께 공동 연구한 논문이 세계 최고 권위의 인공지능 학회인 AAAI 2025 Oral Presentation으로 채택되었습니다.

(※ Oral Presentation AAAI 전체 논문 중 상위 약 6.1%에만 주어지는 발표 형식입니다.)

 

이번 논문은 “MAMS: Model-Agnostic Module Selection Framework for Video Captioning”이라는 제목으로, 영상 자막 생성(Video Captioning) 분야에서 기존 모델이 가진 정적인 프레임 처리 구조의 한계를 극복하기 위해 영상마다 최적의 프레임 수와 자막 생성 모듈을 자동 선택하는 MAMS 프레임워크를 제안했습니다.

 

이상호 연구원은 본 연구에서 프레임 및 토큰 선택 알고리즘 설계, 적응형 주의(attention) 마스킹 기법 개발, 성능 검증 실험을 주도하며 기술적 완성도를 높이는 데 핵심 역할을 수행했습니다.

 

해당 연구는 SwinBERT, UniVL, mPLUG-2 등 최신 멀티모달 기반의 영상-언어 모델에 적용되어 성능을 일관되게 향상시켰으며, 멀티모달 기반의 AI 기술 발전에 의미 있는 기여를 했다는 평가를 받고 있습니다.

 

특히, 영상(Vision) 및 언어(NLP) 기반 멀티모달 처리 기술을 핵심으로 다룬 본 연구 성과는, 다양한 형태의 의료 데이터를 통합 분석하여 질환 예측 모델을 고도화하고, 환자 맞춤형 디지털 치료 서비스를 구현하고자 하는 히포티앤씨의 핵심 프로젝트에 실질적인 기여를 할 수 있을 것으로 기대됩니다.

 

논문 링크 : https://ojs.aaai.org/index.php/AAAI/article/view/32478