"AI가 물리적 움직임 이해한다"…메타가 공개한 AI 모델의 정체

5 days ago 4

입력2025.06.12 08:16 수정2025.06.12 08:16

메타가 주변 환경의 물리적인 움직임을 이해하는 데 특화한 새로운 인공지능(AI) 모델을 공개했다. AI가 현실과 같은 가상 공간을 구축해 물리적 세계에서 인간과 더 유사한 방식으로 학습하고 결정할 수 있도록 하는 데 초점을 맞췄다. 휴머노이드 로봇과 자율주행차 개발용 AI 수요가 급격하게 커지며 빅테크의 AI 개발 경쟁의 중심축이 대규모언어모델(LLM) 중심에서 이 같은 ‘월드 모델’로 옮겨가고 있다는 분석이 나온다.

11일(현지시간) 메타는 새 월드모델 ‘브이제파2(V-JEPA2)’를 공개했다. 지난해 처음 공개한 브이제파 모델의 후속 모델로 100만 시간 이상의 영상 데이터로 훈련됐다. 언어가 아닌 영상으로 학습한 덕분에 AI가 중력과 같은 물리적 세계의 법칙을 이해해 낯선 물체와 환경과 상호작용하며 작업을 완료할 수 있다. 메타는 “장기적인 비전은 AI 에이전트가 이 모델로 물리적 세계에서 계획하고 추론할 수 있도록 하는 것”이라며 “브이제파2는 추가적인 인간의 명령 없이 영상을 통해 자체 학습하도록 훈련됐다”고 설명했다.

브이제파2는 LLM이 아닌 월드모델이다. LLM은 방대한 텍스트 데이터를 기반으로 다음에 올 단어나 문장을 예측하는 데 최적화돼 있다. 반면 월드모델은 AI가 세상의 구조와 규칙을 내면화해 실제 관찰하지 않은 상황도 시뮬레이션을 통해 예측할 수 있도록 설계된다. 어린 아이들이 말하기 시작하기 전부터 공을 공중에 던지면 바닥으로 떨어진다는 걸 이해하듯이 언어가 아닌 물리적 움직임을 중심으로 학습시켰다는 설명이다. 얀 르쿤 메타 수석 AI 과학자는 “기계가 물리적 세계를 이해하게 하는 건 언어를 이해하는 것과는 완전히 다르다”며 “월드모델은 AI가 세상을 이해하고 자신의 행동 결과를 예측하기 위한 현실의 추상적인 ‘디지털 트윈’과 같다”고 말했다.

오픈소스 AI의 선두 주자인 메타의 참전으로 AI 개발 경쟁은 LLM에서 월드모델 중심으로 옮겨가고 있는 양상이다. 특히 휴머노이드 로봇이나 자율주행차처럼 물리적 환경에 대한 이해와 예측이 필요한 분야에서 필수적인 만큼 수요도 빠르게 높아지고 있다. 구글 딥마인드는 지난해 12월 자체 월드모델 ‘지니’를 개발해 시장에 참전했다. 세계적인 AI 석학으로 꼽히는 페이페이 리 스탠퍼드대 교수는 지난해 9월 대규모 월드모델을 만드는 걸 목표로 한 스타트업 ‘월드랩스’를 설립하고 2억3000만달러(약 3150억원)의 투자를 유치하기도 했다.

실리콘밸리=송영찬 특파원 0full@hankyung.com

Read Entire Article