6. Gemini API 및 Python SDK 시작

May 3. 2024

Vertex AI Gemini API는 여러 Gemini 모델과의 상호작용을 위한 통합 인터페이스를 제공합니다.

현재 Gemini API에서 사용할 수 있는 모델은 두 가지가 있습니다.

Gemini Pro 모델(gemini-pro): 자연어 태스크, 멀티턴 텍스트 및 코드 채팅, 코드 생성을 처리하도록 설계되었습니다.

Gemini Pro Vision 모델(gemini-pro-vision): 멀티모달 프롬프트를 지원합니다.

프롬프트 요청에 텍스트, 이미지, 동영상을 포함

Gemini API 사용법 3가지

빠른 테스트 및 명령어 생성에 Vertex AI Studio 사용

cURL 명령어 사용

Vertex AI SDK 사용

Python용 Vertex AI SDK를 사용

Python용 Vertex AI SDK 설치

Gemini Pro(gemini-pro) 모델을 사용해 텍스트 생성

Gemini Pro Vision(gemini-pro-vision) 멀티모달 모델을 사용해 텍스트, 이미지, 동영상 조합에서 텍스트 생성

프로젝트 ID로는 Project ID를 사용하고, 위치로는 Region을 사용

텍스트 프롬프트에서 텍스트 생성

프롬프트 요청에 텍스트, 이미지, 동영상을 포함하고 텍스트 또는 코드 응답을 얻을 수 있습니다.

로컬 이미지 및 텍스트에서 텍스트 생성 섹션을 통해 실행

텍스트 및 이미지에서 텍스트 생성 섹션을 통해

퓨샷 프롬프팅을 위해 여러 이미지 및 텍스트 프롬프트 결합 섹션을 통해 실행

동영상 파일에서 텍스트 생성

Code도 만들어 준다.

이미지 내용을 표로 만들어 준다.

이미지를 분석해준다.

문서 분석

오디오도 text로

text를 오디오로 변환

image나 동영상 sample file이 많다.

모두 하나씩 해보고 이해하자~

<1> Gemini 이미지 분석 도구 구축 <2> Gemini 태그라인 생성기 구축 <3> 이미지 분석 코드 실험 <4> 태그라인 생성 코드 실험 <1> Gemini 이미지 분석 도구 구축 마케팅 시나리오에서 제품 설명과 태그

https://brunch.co.kr/@topasvga/3791

감사합니다.

keyword