Gemini 2.0 플래시 프리뷰: 이미지 생성 및 편집 기능 공개

10 hours ago 2

Google이 Gemini 2.0 Flash 모델을 통한 이미지 생성 기능을 개발자 프리뷰로 공개
텍스트 기반 명령으로 이미지 생성, 수정, 부분 편집까지 가능하며, 시각 품질과 텍스트 렌더링도 개선됨
제품 리스킨, SKU 생성, 실시간 공동 편집 등 다양한 활용 사례 소개
[Google AI Studio] 및 [Vertex AI]를 통해 바로 테스트 가능하며, API 사용량 제한도 상향 조정됨

Gemini 2.0 Flash 이미지 생성 기능 프리뷰 공개

개발자들의 피드백에 따라, Google은 Gemini 2.0 Flash 모델을 통해 이미지 생성 기능을 프리뷰 버전으로 제공
사용자는 Google AI Studio 또는 Vertex AI를 통해 이용 가능

주요 개선 사항

시각적 품질 향상 (이전 실험 버전 대비)
텍스트 렌더링 정확도 향상
필터 차단 비율 감소

활용 가능한 이미지 생성 기능 예시

제품 이미지 재배경화 : 기존 제품 사진을 다양한 배경과 환경으로 재구성 가능
실시간 협업 편집 : Gemini Co-Drawing 앱에서 다중 사용자 실시간 이미지 편집 지원
이미지 일부만 대화식 편집 : 전체를 변경하지 않고 특정 영역만 대화형 명령으로 수정 가능
제품 SKU 동적 생성 : 이미지와 텍스트를 조합해 신규 제품 변형(컬러, 라벨 등)을 자동 생성
Gemini와 아이디어 발상 협업 : 텍스트+이미지 조합을 통해 요리, 제품, 기획 등 다양한 시나리오 구현 가능

API 사용 예시 (Python)

from google import genai from google.genai import types client = genai.Client(api_key="GEMINI_API_KEY") response = client.models.generate_content( model="gemini-2.0-flash-preview-image-generation", contents=("Show me how to bake a macaron with images."), config=types.GenerateContentConfig( response_modalities=["TEXT", "IMAGE"] ), )