Gemini 2.0 플래시 프리뷰: 이미지 생성 및 편집 기능 공개

10 hours ago 2

  • Google이 Gemini 2.0 Flash 모델을 통한 이미지 생성 기능을 개발자 프리뷰로 공개
  • 텍스트 기반 명령으로 이미지 생성, 수정, 부분 편집까지 가능하며, 시각 품질과 텍스트 렌더링도 개선됨
  • 제품 리스킨, SKU 생성, 실시간 공동 편집 등 다양한 활용 사례 소개
  • [Google AI Studio] 및 [Vertex AI]를 통해 바로 테스트 가능하며, API 사용량 제한도 상향 조정

Gemini 2.0 Flash 이미지 생성 기능 프리뷰 공개

  • 개발자들의 피드백에 따라, Google은 Gemini 2.0 Flash 모델을 통해 이미지 생성 기능을 프리뷰 버전으로 제공
  • 사용자는 Google AI Studio 또는 Vertex AI를 통해 이용 가능

주요 개선 사항

  • 시각적 품질 향상 (이전 실험 버전 대비)
  • 텍스트 렌더링 정확도 향상
  • 필터 차단 비율 감소

활용 가능한 이미지 생성 기능 예시

  • 제품 이미지 재배경화 : 기존 제품 사진을 다양한 배경과 환경으로 재구성 가능
  • 실시간 협업 편집 : Gemini Co-Drawing 앱에서 다중 사용자 실시간 이미지 편집 지원
  • 이미지 일부만 대화식 편집 : 전체를 변경하지 않고 특정 영역만 대화형 명령으로 수정 가능
  • 제품 SKU 동적 생성 : 이미지와 텍스트를 조합해 신규 제품 변형(컬러, 라벨 등)을 자동 생성
  • Gemini와 아이디어 발상 협업 : 텍스트+이미지 조합을 통해 요리, 제품, 기획 등 다양한 시나리오 구현 가능

API 사용 예시 (Python)

from google import genai from google.genai import types client = genai.Client(api_key="GEMINI_API_KEY") response = client.models.generate_content( model="gemini-2.0-flash-preview-image-generation", contents=("Show me how to bake a macaron with images."), config=types.GenerateContentConfig( response_modalities=["TEXT", "IMAGE"] ), )

향후 계획

  • Google은 향후 더 높은 품질, 기능 추가, 속도 향상 및 요금제 개선 등을 통해 기능을 지속 확장할 예정
  • 자세한 문서는 Gemini API 이미지 생성 가이드 참조

Read Entire Article