오픈 가중치가 조용히 닫히고 있으며, 이는 문제다
3 hours ago
1
- 오픈 가중치 모델은 누구나 자체 하드웨어에서 LLM을 직접 실행하게 해 민감한 데이터 보호, 파인튜닝·양자화 유연성, 프런티어 모델 대비 낮은 추론 비용을 제공함
- MiniMax, Z.ai, DeepSeek, Qwen 같은 중국 연구소 모델들이 선도적인 오픈 가중치 모델로 꼽히며, Google의 Gemma와 OpenAI의 gpt-oss는 대체로 그보다 뒤에 위치한다고 평가됨
- 오픈 가중치 모델은 OpenAI, Anthropic, Google 같은 프런티어 연구소에 가격 하락 압력을 주며, 저렴한 대안으로 전환할 수 있다는 가능성이 과점적 가격 행동을 억제함
- 최근 Meta는 최신 “Muse Spark”에서 모델 공개를 중단했고, Alibaba는 API 우선 또는 API 전용 공개를 늘렸으며, Kimi K2.6과 Mistral도 더 강한 라이선스 조건을 부과하는 흐름을 보임
- 경쟁적인 오픈 가중치 생태계가 약해지면 소수 프런티어 연구소와 일부 중국 연구소가 AI 사용자의 소비자 잉여를 더 크게 흡수할 수 있으며, 증류도 강력한 기반 모델 접근성이 필요해 근본적 해결책이 되기 어려움
오픈 가중치 모델의 역할
- LLM 시장에는 폐쇄형 모델과 오픈 가중치(open weights) 모델이 공존해 왔음
- 폐쇄형 모델에는 이름과 달리 OpenAI의 거의 모든 모델이 포함됨
- 오픈 가중치 모델은 다른 연구소들이 공개해 왔고, Llama 시리즈가 대표적이었음
- 최근에는 MiniMax, Z.ai, DeepSeek, Qwen(Alibaba) 같은 중국 연구소 모델들이 선도적인 오픈 가중치 모델로 꼽힘
- Google의 Gemma 시리즈와 OpenAI의 gpt-oss 모델은 대체로 중국 모델들보다 뒤에 위치한다고 평가됨
- 오픈 가중치 모델은 누구나 자기 하드웨어에서 직접 실행할 수 있게 해줌
- 가치 있게 실행할 만한 모델에는 보통 매우 강력한 하드웨어가 필요했음
- 더 작은 모델들이 훨씬 유용해지면서 이 조건이 빠르게 바뀌고 있음
- 로컬 실행은 API로 OpenAI, Anthropic, Google 같은 제공자에 요청하는 방식보다 세 가지 장점이 있음
- 민감한 데이터를 프런티어 연구소 데이터센터로 보내기 어렵거나 불가능한 경우, 온프레미스 실행으로 데이터가 네트워크 밖으로 나가지 않게 할 수 있음
- 모델을 파인튜닝 기반으로 쓰거나, 특정 하드웨어 조건에 맞춰 양자화(대략적인 압축)할 수 있어 유연성이 커짐
- 자체 하드웨어를 쓰면 하드웨어 자본 지출, 전기, 운영 비용만 고려하면 되고, 호스팅 제공자를 쓰더라도 토큰당 비용은 보통 프런티어 모델의 10% 미만임
가격 압력과 시장 규율
- 오픈 가중치 모델은 프런티어 연구소에 상당한 가격 하락 압력을 제공함
- 독점 또는 과점 시장에서도 저렴하고 신뢰할 만한 대안이 있으면 기존 사업자가 경쟁적으로 행동한다는 contestable markets 이론과 느슨하게 닮아 있음
- 이 이론은 엄밀히는 매몰비용이 거의 0이라는 전제를 두지만, 프런티어 모델 학습은 그 반대에 가까움
- 그래도 소비자가 전환할 수 있다는 잠재적 선택지가 가격을 규율한다는 핵심 메커니즘은 유지됨
- 프런티어 모델은 더 높은 품질과 계약상 이점 때문에 더 비싼 가격을 받을 수 있음
- 사용자는 더 좋은 모델에 훨씬 더 많은 비용을 지불할 수 있음
- 약 1조 달러 규모 회사와의 추론 계약은 저렴한 추론 제공자를 OpenRouter로 쓰는 것과 다른 가치를 가짐
- OpenAI 등은 SLA와 기밀성 같은 항목에 대해 법적 구속력이 있는 약속을 제공함
- 그러나 오픈 가중치 모델은 과점적 가격 행동을 어렵게 만드는 충분한 압력으로 작동함
- 프런티어 연구소들이 하룻밤 사이 가격을 5배 올리면, 특히 덜 까다로운 사용 사례에서는 많은 사용자가 오픈 가중치 모델로 전환할 수 있음
- 오픈 가중치 모델은 가격 행동 측면에서 제네릭 의약품과 비슷한 역할을 함
- 제네릭이 있으면 대형 제약사는 가격을 제네릭 가격에 훨씬 가깝게 낮추고, 가격을 유지하기 위해 제네릭보다 한 단계 앞선 새 치료제에 집중함
- 오픈 가중치 모델이 없다면 프런티어 연구소의 가격 결정력은 현재보다 훨씬 커질 수 있음
라이선스와 공개 방식의 변화
- 오픈 가중치 모델의 가용성은 당연한 전제가 아님
- 모델 학습에는 큰 비용이 들고, 이 모델을 만드는 기업들은 상업 회사임
- 중국 국가의 보조를 많이 받을 가능성이 있더라도 자선단체는 아님
- 최근 오픈 가중치 모델의 라이선스 조건은 뚜렷하게 강화되는 흐름을 보임
- Meta는 최신 “Muse Spark” 모델에서 오픈 가중치를 완전히 중단했고, 모델을 전혀 공개하지 않음
- Alibaba는 점점 더 모델을 먼저 API로 공개하거나, 일부 변형에서는 API로만 공개하고 있음
- Kimi의 K2.6 라이선스는 월간 활성 사용자 1억 명 초과 또는 월 매출 2,000만 달러 초과 제품에 대해 UI에 “Kimi K2.6”을 눈에 띄게 표시해야 하는 저작자 표시 조항을 추가함
- 프랑스 Mistral도 상업적 사용에 다양한 라이선스 조건을 부과함
- 예외도 있음
- DeepSeek은 오히려 더 관대한 방향으로 바뀜
- 하지만 전반적인 추세는 덜 관대한 라이선스이며, Meta와 Alibaba는 일부 또는 전체 모델 공개를 중단하는 방향으로 움직이고 있음
오픈 가중치 축소가 만들 수 있는 시장 구조
- 1년 뒤에는 과거라면 오픈 가중치로 공개됐을 최고 수준 모델 대부분 또는 전부가 더 이상 공개되지 않는 상황이 될 수 있음
- 이는 현재로서는 가정적 상황임
- 모델 간 가격 비교는 계속 존재할 수 있음
- 하지만 학습 비용과 복잡성이 계속 증가하면 소수의 플레이어만 남을 수 있음
- 가능한 시장 구성은 서구의 3대 프런티어 연구소와 일부 중국 연구소로 좁혀질 수 있음
- 중국 연구소들이 국가 주도의 ‘합병’을 통해 한두 개의 중국 ‘슈퍼랩’으로 통합될 가능성도 있음
- 전략 산업에서 이런 통합 전례는 많음
- 중국은 철도(CRRC), 원자력, 항공사, 통신에서 이런 방식을 사용했음
- 서구 역시 냉전 이후 방산 프라임 업체 통합 사례가 있어 예외가 아님
- 이런 변화는 AI가 만들어내는 소비자 잉여를 소수 기업이 흡수할 수 있게 만듦
- AI 사용자는 토큰 비용보다 훨씬 큰 가치를 얻고 있음
- 현재 가격의 10배를 지불해도 주저하지 않을 만큼 가치가 크다고 볼 수 있음
- 고부가가치 전문 업무나 에이전트형 작업에서는 실제 지불액과 지불 의향 사이의 격차가 더 커짐
- 오픈 가중치라는 가격 하한선이 없는 과점은 이 격차를 이윤으로 가져갈 수 있는 위치에 놓임
- 경제 이론상 이런 세계에서는 권력과 경제적 부가 소수 기업에 역사적으로 집중될 수 있음
- 연구소들은 소비자 잉여를 직접 마진으로 추출하기 시작할 수 있음
- 소수 기업 과점과 새 모델에 필요한 막대한 자본 지출이라는 진입장벽 때문에 가격 경쟁은 제한될 가능성이 큼
반대 가능성과 남는 위험
- 비관적 전망이 과도할 가능성도 있음
- 하드웨어가 더 빠르게 발전하면 “충분히 좋은” 모델을 학습하는 일이 시간이 갈수록 오히려 쉬워질 수 있음
- AI 하드웨어 제조사는 소수에 불과하지만, AI 하드웨어 시장에서는 치열한 경쟁이 나타나고 있음
- 증류(distillation) 는 탈출구로 꼽히지만 근본적 해결책은 아님
- 증류는 프런티어 모델의 출력으로 더 작은 모델을 학습하는 방식임
- 하지만 애초에 강력한 기반 모델에 접근할 수 있어야 함
- 위험에 처한 바로 그 요소가 강력한 기반 모델 접근성임
- 경쟁적인 오픈 가중치 생태계는 AI 경제 전체 아래에 조용히 깔린 하중 지지 전제였음
- 이 전제가 약해지고 있다는 사실은 주목할 필요가 있음
- 더 넓은 경제에 미칠 함의는 매우 큼
용어와 보완 설명
- 오픈 가중치 모델은 최종 모델만 공개하는 범주임
- 기술적으로는 폐쇄형, 오픈 가중치, 완전 개방 또는 재현 가능 모델이라는 세 범주로 나눌 수 있음
- 완전 개방 또는 재현 가능 모델은 학습 데이터와 관련 학습 절차 문서까지 포함함
- 이 범주가 소프트웨어에서 말하는 오픈소스와 가장 유사함
- OpenRouter는 “API들의 API” 역할을 함
- 특정 모델에 대해 가장 저렴하거나 가장 가용성이 높은 추론 제공자로 요청을 라우팅함
- 한 제공자에 문제가 생기면 즉시 다른 제공자로 전환해 신뢰성을 크게 높일 수 있음
- 더 저렴한 제공자가 있으면 그쪽으로 전환함
-
Homepage
-
Tech blog
- 오픈 가중치가 조용히 닫히고 있으며, 이는 문제다