계약서-재무제표 분석 등 강점
LG AI연구원이 텍스트와 이미지를 동시에 이해하고 추론할 수 있는 멀티모달 인공지능(AI) 모델 ‘엑사원 4.5’를 공개했다고 9일 밝혔다. 멀티모달은 텍스트, 이미지, 음성, 영상 등 다양한 형태의 데이터를 동시에 이해하고 처리하는 AI다.엑사원 4.5는 자체 개발한 비전 인코더와 거대언어모델(LLM)을 결합해 글과 이미지를 함께 이해할 수 있다. 계약서나 기술 도면, 재무제표처럼 실제 산업 현장에서 쓰이는 복잡한 자료를 읽고 분석하는 데 강점이 있다. LG AI연구원은 이번 모델이 독자 파운데이션 모델인 ‘K-엑사원’이 향후 더 다양한 형태의 데이터를 처리할 수 있도록 하는 발전 단계라고 설명했다.
성능 측면에서도 경쟁력을 입증했다. 과학·기술·공학·수학(STEM) 분야 5개 지표 평균 점수는 77.3점으로, 오픈AI ‘GPT-5 미니’(73.5점)와 앤스로픽 ‘클로드 소넷 4.5’(74.6점), 알리바바 ‘큐웬3’(77.0점)를 웃돌았다. 13개 시각 능력 평가 지표 평균 점수에서도 GPT-5 미니와 클로드 소넷 4.5 등을 상회했다. LG AI연구원은 “AI가 이미지와 텍스트의 맥락을 함께 이해하고 질문에 답할 수 있는 수준에 도달한 것”이라고 설명했다.
이민아 기자 omg@donga.com
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 좋아요 0개
- 슬퍼요 0개
- 화나요 0개

1 week ago
3
![청년 식품기업 매년 100개 육성…K푸드 창업사관학교 출범[食세계]](https://image.edaily.co.kr/images/Photo/files/NP/S/2026/04/PS26041800815.jpg)


![[ET시선] 대형사로 쏠리는 돈…증권업계 과점화 우려](https://img.etnews.com/news/article/2025/05/23/news-p.v1.20250523.2ed87a4f1960439284d8b02e3f77fa3b_P1.jpg)
![기름값·세금 다 잡은 '유지비 깡패'…아빠들 설레게 한 車 [신차털기]](https://img.hankyung.com/photo/202604/01.43985168.1.jpg)



![[MK시그널] 로보티즈, 美 빅테크에 로봇 손 부품 공급 및 피지컬AI 수혜주 등에 주가 상승세, MK시그널 추천 후 상승률 12.83% 기록](https://pimg.mk.co.kr/news/cms/202603/20/news-p.v1.20260320.5ea8839301ed4284a9cb365ffae9579b_R.png)




![BTS도 대통령도 "질서와 안전" 신신당부…광화문 광장 가보니 [현장+]](https://img.hankyung.com/photo/202603/01.43664355.1.jpg)
!["사직 마운드 늘 가슴이 뛴다" 롯데 최준용, 늑골 부상→첫 실전 150㎞ 1이닝 퍼펙트! 벅찬 복귀 소감 [부산 현장]](https://image.starnewskorea.com/cdn-cgi/image/f=auto,w=1200,h=802,fit=cover,q=high,sharpen=2/21/2026/03/2026031916411352434_1.jpg)


English (US) ·