IT/과학 IT조선 2026-04-09T11:40:24

“문서·사진 동시 추론”… LG, 멀티모달 AI ‘엑사원 4.5’ 공개

원문 보기

LG AI연구원은 텍스트와 이미지를 모두 이해하는 멀티모달 인공지능(AI) 모델 ‘엑사원(EXAONE) 4.5’를 공개했다고 9일 밝혔다.엑사원 4.5는 LG AI연구원이 자체 개발한 ‘비전 인코더’와 거대언어모델(LLM)을 하나의 구조로 통합한 비전-언어 모델(VLM)이다. 계약서, 기술 도면, 재무제표, 스캔 문서 등 산업 현장에서 실제로 다루는 문서를 읽고 추론하는 데 강점을 보였다. LG AI연구원이 공개한 벤치마크 점수에 따르면 엑사원 4.5는 과학·기술·공학·수학(STEM) 성능을 측정하는 5개 지표에서 평균 77.3점을