NC AI가 초경량 멀티모달 비전언어모델(VLM)을 공개했다. 이 모델은 네이버·카카오 모델과 유사한 성능을 보이거나 이를 뛰어넘기도 한 것으로 나타났다.
NC AI는 30일 온디바이스 환경에서 구동할 수 있는 초경량 멀티모달 인공지능(AI) 모델 '바르코 비전 2.0 1.7B'를 공개했다고 밝혔다. 1.7B(17억) 파라미터의 작은 크기가 특징이다.
이번 경량 모델은 지난 16일 공개된 중형 모델 '바르코 비전 2.0 14B'의 후속작이다. 14B에 이은 1.7B 공개로 NC AI는 프롬 스크래치방식의 거대언어모델(LLM) 개발 경험에 더해 멀티모달 모델과 온디바이스 모델구축 능력까지 갖춘 AI 기술력을 입증했다. 1.7B라는 작은 모델 크기에도 확보한 성능은 국내 AI 기술의 자주성과 접근성을 높였다는 점에서 의미가 있다.
NC AI의 바르코 비전 2.0은 이미지와 텍스트를 함께 이해해 질문에 답할 수 있는 차세대 인공지능 모델이다. 여러 장의 이미지를 동시에 분석할 수 있어 복잡한 문서나 표, 차트도 효과적으로 처리할 수 있다.
바르코 비전 2.0 1.7B는 텍스트 처리, 한국어 성능에서 글로벌 톱(Top) 오픈소스 멀티모달 모델인 인턴VL3 2B, 오비스2 2B 등을 압도하며 동급 최고 모델임을 입증했다. 영문 텍스트 처리 MT-Bench와 한국어 K-SEED, K-LLaVABench는 물론 광학문자 판독 CORD, ICDAR 등 다양한 벤치마크에서 글로벌 모델들의 성능을 넘었다.
NC AI는 LLM은 물론 멀티모달 구축의 기술력도 요구되는 독자AI 프로젝트를 진행 중인 국내 AI 생태계에서 매우 의미 있는 성과라고 평가했다.
바르코 비전 2.0 1.7B는 2배 더 큰 카카오와 네이버의 모델의 성능을 뛰어넘기도 했다. 대학 수준의 지식을 검증하는 MMMU 벤치마크와 과학 차트 이미지 해석 능력을 평가하는 AI2D 벤치마크에서 카카오의 카나나 3B, 네이버의 하이퍼클로바 3B 등 3B급 멀티모달 모델들과 비슷하거나 뛰어난 성능을 보였다.
시각적 맥락에서의 수학적 추론 능력을 평가하는 MathVista 벤치마크와 멀티모달 AI의 종합적인 시각언어 기능을 평가하는 MM-Vet에서도 위 체급의 모델들 사이에서 2위를 기록했다. NC AI는 자사의 기술력으로 모델의 크기가 성능을 결정하는 절대적 요소가 아니라는 것을 증명했다고 강조했다.
1.7B 파라미터의 경량 모델은 스마트폰이나 PC 등 개인 기기에서도 원활하게 동작할 수 있도록 최적화됐다. 이는 기존 멀티모달 AI가 대부분 클라우드 환경에서만 활용 가능했던 한계를 뛰어넘어 개인 디바이스에서도 고성능 멀티모달 AI를 직접 활용할 수 있게 한다.
온디바이스 AI의 핵심 장점은 개인정보 보호와 실시간 처리 능력에 있다. 사용자의 데이터가 외부 서버로 전송되지 않고 네트워크 연결 없이도 즉시 AI 기능을 사용할 수 있어서다. 통신 지연이나 서버 과부하로 서비스가 중단될 일이 없이 안정적인 AI 서비스를 받을 수 있다.
NC AI는 이번 1.7B 모델도 오픈소스로 공개한다. NC AI는 국내 AI 생태계 활성화를 위해 바르코 비전 2.0 모든 모델을 연구용 오픈소스로 공개한다고 밝힌 바 있다.
이연수 NC AI 대표는 "NC AI가 보여준 경량 고성능 모델 개발 능력을 통해 다양한 국내 산업군의 경쟁력을 크게 높일 것"이라며 "바르코 비전 2.0 1.7B는 AI 기술의 자립과 민주화를 위한 중요한 이정표로 앞으로도 더 많은 사람이 쉽게 접근할 수 있는 고성능 AI 모델 개발에 최선을 다하겠다"고 말했다.
박수빈 한경닷컴 기자 waterbean@hankyung.com