OpenRouter Fusion API

1 week ago 20
  • 여러 모델의 결과를 종합(synthesize) 하면 개별 모델 단독 성능을 크게 능가할 수 있다는 발견에서 출발
  • 단일 프롬프트를 여러 전문가 모델이 병렬로 분석한 뒤 심판 모델(judge model) 이 결과를 종합해 최종 답변을 작성하는 멀티 모델 심의(multi-model deliberation) 방식
  • 패널 모델은 웹 검색웹 페치를 활성화한 상태로 병렬 분석을 수행하며, 심판 모델이 합의, 모순, 부분적 일치, 고유 통찰, 사각지대를 구조화한 분석으로 정리
  • 기본값은 Quality 프리셋이며, Budget 프리셋으로 저렴한 모델 전환 또는 fusion 플러그인 필드로 패널·심판 완전 재정의 가능
  • 단일 모델로 충분치 않은 리서치, 전문가 비평, 오답 비용이 추가 완성 비용을 상회하는 상황에 적합
  • 패널 구성원 전원과 심판 호출을 모두 실행하므로, 요청 비용은 단일 모델이 아닌 개별 완성(completion) 합산 방식으로 책정

동작 방식

  • 단일 프롬프트를 소규모 멀티 모델 심의로 전환하는 방식
    • 전문가 모델 패널이 웹 검색(web search)웹 페치(web fetch) 를 활성화한 상태로 프롬프트를 병렬 분석
    • 심판 모델이 패널 응답을 종합해 합의(consensus), 모순(contradictions), 부분 커버리지(partial coverage), 고유 통찰(unique insights), 사각지대(blind spots) 로 구조화한 분석 생성
    • 구조화된 분석을 기반으로 심판 모델이 최종 답변 작성

패널 구성 및 설정

  • 기본 패널은 Quality 프리셋 사용
    • 더 저렴한 구성원을 원하면 Budget 프리셋 으로 전환 가능
    • fusion 플러그인의 analysis_models 및 model 필드로 패널과 심판을 완전히 재정의(override) 가능
  • 단일 모델이 충분치 않을 때 사용 권장
    • 리서치, 전문가 비평, 또는 오답 비용이 추가 완성 비용을 초과하는 영역에 적합

가격 및 제약

  • 패널 구성원 전원과 심판 호출을 모두 실행하므로, 요청 비용은 단일 모델 기준이 아닌 개별 완성의 합산으로 책정
    • 실제 실행된 모델 확인은 Activity 페이지에서 가능
  • 컨텍스트 한도는 선택한 모델에 따라 달라짐

프리셋에서는 6개의 모델을 사용

  • 최고 품질: Claude Opus, OpenAI GPT, Google Gemini Pro
  • 최저 비용: Google Gemini Flash, DeepSeek V4 Flash, MoonshotAI Kimi

관련 발표: "Fusion으로 프론티어 성능을 넘어서다"

  • 여러 모델의 결과를 종합해 개별 모델 단독 성능을 능가하는 도구로, 참가 모델 패널과 결과를 융합하는 judge 모델을 직접 선택해 단일 모델처럼 호출
  • DRACO 벤치마크의 deep research 과제 100개 측정에서 패널이 개별 모델을 일관되게 능가
    • Fable 5 + GPT-5.5 융합이 69.0% 로 단독 Fable 5(65.3%) 포함 모든 개별 모델 능가
    • 저가형 패널(Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro)이 비용 50% 로 Fable 5 점수에 1% 이내 근접, GPT-5.5·Opus 4.8 능가
  • 프롬프트를 패널 모델에 병렬 전송, judge가 합의점·모순·고유 통찰·맹점을 분석하고 호출 모델이 이를 근거로 최종 답변 작성
  • 전체 파이프라인이 server-side에서 실행되어 개별 모델 호출과 동일한 방식으로 사용 가능
  • Opus 4.8을 자기 자신과 융합한 경우에도 65.5%로 단독(58.8%) 대비 6.7점 상승, synthesis 단계 자체의 효과 확인
  • 패널 모델이 채점 루브릭을 온라인에서 찾는 오염 위험 발견, web search·web fetch 제외 목록을 한 줄 설정으로 적용해 차단
  • 사용 방법 4가지: Chatroom(코드 불필요), Model slug(문자열 교체), Server tool(최고 수준 제어), Plugin(패널 지정)
  • Fable의 drop-in 대체재 아님, Fable이 강점인 long-horizon 과제는 미포함, 코딩에서는 선택적 호출 도구로 활용
Read Entire Article