- GPT-4.1, GPT-4.1 mini, GPT-4.1 nano 3개의 모델 공개
- GPT-4o 대비 전반적으로 개선된 성능을 제공하며, 특히 코딩, 지시 따르기, 긴 문맥 이해에서 두드러지는 성능 향상
- 세모델 모두 최대 100만 토큰의 컨텍스트 윈도우을 지원하여 대형 코드베이스 및 복잡한 문서 분석에 적합함
-
지연 시간 절감 및 비용 절감과 함께 뛰어난 성능 제공
- 주요 성능 개선
-
코딩 능력: SWE-bench Verified에서 54.6%로 GPT-4o 대비 +21.4%p 향상
-
지시 따르기: MultiChallenge 점수 38.3%로 GPT-4o보다 +10.5%p 향상
-
멀티모달 긴 문맥 이해: Video-MME(long, no subtitles)에서 72.0%, GPT-4o 대비 +6.7%p
- GPT-4.1 모델군 특징
-
GPT-4.1 mini: GPT-4o보다 뛰어난 지능 평가 결과, 지연 시간 절반, 비용 83% 절감
-
GPT-4.1 nano: 최저 비용과 최저 지연 시간, 고성능 유지
-
GPT-4.5 Preview는 2025년 7월 14일에 종료 예정, GPT-4.1 시리즈로의 전환을 권장
- 비전(이미지 이해 및 멀티모달)
- GPT-4.1 mini는 이미지 기반 벤치마크에서 GPT-4o 능가
-
MMMU, MathVista, CharXiv 등에서 높은 정확도
-
Video-MME(30~60분 자막 없는 영상 질문): 72.0% 정확도
- 가격 정책
- 전 모델 모두 공개 및 사용 가능
- GPT-4.1은 GPT-4o보다 평균 26% 저렴
-
GPT-4.1 nano는 최저 비용 모델
- 캐시 입력 시 비용 75% 할인, 긴 문맥도 추가 비용 없음
- 모델별 가격
-
GPT-4.1: 입력 100만 토큰당 $2.00, 출력 $8.00, 평균 비용 약 $1.84
-
GPT-4.1 mini: 입력 $0.40, 출력 $1.60, 평균 $0.42
-
GPT-4.1 nano: 입력 $0.10, 출력 $0.40, 평균 $0.12
- 프롬프트 캐시 할인을 기존 50%에서 75%까지 할인 확대
-
긴 문맥 요청은 추가 요금 없음, 토큰 사용량만 기준