본문 바로가기
인공지능(AI)

오픈 AI Whisper API 사용방법

by 친절한에릭 2023. 3. 2.

이번 포스트웨서는 챗지피티로 유명한 오픈 AI 사의 Whisper API 가 무엇인지 알아보고 사용방법에 대해서 알아보겠습니다.

오픈 AI Whisper API 는 무엇인가?

오픈AI가 개발한 자동 음성 인식(ASR) 시스템입니다. Whisper는 음성 데이터를 텍스트로 변환하는 기능을 제공하며, 이를 통해 다양한 어플리케이션에서 활용할 수 있습니다. 예를 들어, 음성 명령을 수행하는 비서 앱, 통화 내용을 자동으로 기록하는 통화 앱, 강의나 회의록을 텍스트로 변환하는 서비스 등이 있습니다. 오픈AI Whisper API를 사용하면 개발자들이 이러한 기능을 자신들의 소프트웨어에 쉽게 통합할 수 있습니다.

 

 

Introducing ChatGPT and Whisper APIs

Developers can now integrate ChatGPT and Whisper models into their apps and products through our API.

openai.com

 

 

사용방법 

 

해당 API를 사용하기 위해서는 API key를 발급 받아야 합니다.

 

https://platform.openai.com/account/api-keys

 

OpenAI API

An API for accessing new AI models developed by OpenAI

platform.openai.com

우선 Chat GPT를 이용하셔 파이썬강의 오디오 대본을 써달라고 한뒤. 역시 음성 더빙 AI tools 을 이용하여 음성 mp3 file을 만들어 봤습니다.

 

음성 mp3파일

 

이 파일에서 Whisper API 를 이용해서 스크립트를 추출해 보겠습니다.

# Create the OpenAI API client
openai.api_key = os.environ["OPENAI_API_KEY"]

# Set the model you want to use
model_engine = "gpt-3.5-turbo"
file = open("파이썬강의.mp3", "rb")

transcription = openai.Audio.transcribe("whisper-1", file)

print(transcription['text'])

 

해당 코드의 실행 결과는 아래와 같습니다.

 

"안녕하세요 여러분. 오늘은 파이썬 함수에 대해 쉽고 재미있게 알려드리려고 합니다. 파이썬 함수는 많은 프로그래머들이 일상적으로 사용하는 중요한 기능 중 하나입니다. 지금부터 파이썬 함수에 대해 10분 동안 배워보도록 합시다. 파이썬 함수란 무엇일까요? 파이썬 함수는 특정한 작업을 수행하는 코드의 블록이며, 이 블록은 함수 이름과 함께 호출될 수 있습니다... "

 

전체 코드가 필요하신 분은 아래 링크를 확인해 보세요.

 

댓글