AI에이전트 쓸수록 토큰 소모 급증
너도나도 가성비 높은 中모델 써
中모델, 주간 토큰 사용량 1~4위
韓도 ‘보안은 美, 데이터 中’ 투트랙

글로벌 숙박 공유 플랫폼 에어비앤비의 브라이언 체스키 최고경영자(CEO)도 최근 자사 앱에 알리바바의 AI ‘큐웬(Qwen)’을 연동했다며 “오픈AI (챗GPT)보다 빠르고 저렴하다”고 털어놨다.
AI가 사람 대신 복잡한 업무를 처리하는 ‘에이전트’ 시대가 열리면서 중국산 저가 모델이 급부상하고 있다. AI 에이전트의 천문학적인 ‘토큰(Token)’ 사용량에 기업들도 ‘가성비’를 따지게 된 셈이다.
● 中 모델, 가성비로 ‘토큰 경제’ 휩쓸어AI 모델이 처리·생산하는 데이터 연산 단위인 토큰은 쉽게 말해 AI 모델(LLM)을 돌리는 연료(기름)라 할 수 있다. 비싼 미국 최상위 AI모델이 고급 휘발유를 넣는 고성능 차라면, 중국산 모델은 싼 경유로도 달리는 실용 차인 셈이다. 에이전트는 이 차에 목적지만 알려주면 스스로 경로를 짜고 운전대를 조작하는 ‘자율주행 기사’ 격으로, 질문에 답하는 챗봇과 달리 외부 도구를 여러 차례 호출·검증하며 토큰을 순식간에 태운다.


한국에서도 중국 모델이 현장을 파고들고 있다. 보안이 중요한 서비스엔 미국 모델을, 데이터 전처리나 대량 후처리엔 중국산 모델을 쓰는 ‘투트랙’으로 운용이 흔하다. 본보가 지난해 9월 여론조사 플랫폼 리멤버에 의뢰해 국내 정보기술(IT) 담당자 306명을 조사한 결과에서도 알리바바 큐웬(10.0%) 활용률이 오픈AI 챗GPT(52.6%), 메타 라마(14.0%)에 이어 3위를 차지했다. 국내 정보기술(IT) 업계 관계자는 “바이브 코딩(일반 언어로 대화하듯 코딩하는 것)으로 개인 AI 업무 툴(도구)을 만들 때 중국산 모델을 쓰는 경우도 많다”고 말했다.
중국 가성비 AI모델의 침투에 미국에서도 엔비디아의 차세대 칩 ‘루빈(Rubin)’ 등 하드웨어 혁신으로 추론 단가(답변을 생성하는데 발생하는 비용, 일명 토큰 당 비용)를 낮추는 맞불을 놨다. 다만 글로벌 IT 연구기관 가트너는 2030년까지 거대언어모델 추론 단가가 90% 하락하더라도, 에이전트 확산으로 사용량이 최대 30배 늘어 전체 비용 부담은 지속될 것이라고 내다봤다.
윌 소머 가트너 시니어 디렉터 애널리스트는 “고급 추론을 뒷받침하는 컴퓨팅 자원과 시스템은 여전히 희소하다”고 말했다. 가트너는 작업의 경중에 따라 저비용 ‘경유’ 모델과 고성능 ‘고급 정제유’ 모델을 선택적으로 결합하는 ‘멀티 모델 오케스트레이션(조율)’ 역량이 다가올 기업과 국가의 AI 패권을 좌우할 것으로 전망했다.
김재형 기자 monami@donga.com
최지원 기자 jwchoi@donga.com
© dongA.com All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 좋아요 0개
- 슬퍼요 0개
- 화나요 0개

2 weeks ago
3

![[DBR]사스포칼립스 공포, 대응법은?](https://dimg.donga.com/wps/NEWS/IMAGE/2026/04/19/133761020.4.jpg)


![[DBR]전략-시스템 갖춘 韓 기업들, ‘소프트 파워’ 키워야](https://dimg.donga.com/wps/NEWS/IMAGE/2026/04/19/133761035.4.jpg)









English (US) ·