brunch

매거진 AI 전문가 되기

라이킷 댓글

You can make anything
by writing

C.S.Lewis

계정을 잊어버리셨나요?

by Master Seo Nov 23. 2024

AI 9탄-2. OpenAI Whisper로 음성 비서

<5> Text를 mp3로 만들기 (실습)-3

<6> mp3를 text로 만들기 - OpenAI Whisper (실습)-4

<7> 음성 비서 (실습)- 오류

<5> Text를 mp3로 만들기 (실습)-3

예제코드 다운로드 4장.

https://wikibook.co.kr/llm-projects/

실전! 12가지 프로젝트로 배우는 OpenAI API, 랭체인 완벽 활용법: OpenAI API부터 음성/이미지 처리, 랭

실전 프로젝트로 OpenAI API와 랭체인 마스터하기, AI 기술의 최전선에서 배우는 실전 프로젝트 12가지! 이 책은 초보자부터 전문가까지 AI 애플리케이션을 손쉽게 개발할 수 있도록 돕습니다. OpenAI

wikibook.co.kr

# VSCODE

# File > Open Folder

ch04_TTS_exp.py 에 OPENAI API 키 입력

실행하면 speech.mp3 파일 만들어짐.

from openaiimport OpenAI

# API 키 입력

client = OpenAI(api_key="여러분들의 Key 값")

# 생성할 파일명

speech_file_path = "speech.mp3"

with client.audio.speech.with_streaming_response.create(

model="tts-1",

voice="alloy",

input="""오늘은 사람들이 좋아하는 것을 만들기에 좋은 날입니다!""",

) as response:

response.stream_to_file("speech.mp3")

# VSCODE > 터미널

pip install openai

pip install streamlit

실행

PS C:\07-openai\openai-api-tutorial-main\ch04> streamlit.cmd run .\ch04_TTS_exp.py

sound.mp3 만들어짐

<6> mp3를 text로 만들기 - OpenAI Whisper (실습)-4

C:\07-openai\openai-api-tutorial-main\ch04

ch04_whisper_exp.py

from openai import OpenAI

# API 키 입력

client = OpenAI(api_key="sk-proj-A")

# 녹음 파일 열기

audio_file = open("speech.mp3", "rb")

# whisper 모델에 음원 파일 넣기

transcript = client.audio.transcriptions.create(model="whisper-1", file=audio_file, response_format="text")

# 결과 보기

print(transcript)

실행

PS C:\07-openai\openai-api-tutorial-main\ch04> python.exe .\ch04_whisper_exp.py

오늘은 사람들이 좋아하는 것을 만들기에 좋은 날입니다.

다른 mp3로 테스트 - sound.mp3 준비

speech.mp3

실행

PS C:\07-openai\openai-api-tutorial-main\ch04> python.exe .\ch04_whisper_exp.py

Whisper는 범위온 음성인식 모델입니다. 다양한 오디오의 대규모 데이터 시트를 학습하고 다국어 음성인식, 음성번역, 언어식별을 수행할 수 있는 멀티태스킹 모델이기도 합니다.

<7> 음성 비서 (실습)- 오류-5

pip install openai

pip install streamlit

API 키 입력

streamlit.cmd run .\ch04_assistant.py

ModuleNotFoundError: No module named 'audiorecorder'

python.exe -m pip install --upgrade pip

streamlit.cmd run .\ch04_assistant.py

https://brunch.co.kr/@topasvga/4157

AI 9탄-3. 이미지를 음성으로 설명 듣기

<8> 이미지를 음성으로 설명 듣기 (실습) AI 도슨트 서비스 예제코드 다운로드 5장 https://wikibook.co.kr/llm-projects/ <1> 이미지를 음성으로 설명 듣기 (실습) 1 API 키 입력 2 실행 PS C:\07-openai\openai-api-

brunch.co.kr/@topasvga/4157

브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari