이번 포스트웨서는 챗지피티로 유명한 오픈 AI 사의 Whisper API 가 무엇인지 알아보고 사용방법에 대해서 알아보겠습니다.
오픈 AI Whisper API 는 무엇인가?
오픈AI가 개발한 자동 음성 인식(ASR) 시스템입니다. Whisper는 음성 데이터를 텍스트로 변환하는 기능을 제공하며, 이를 통해 다양한 어플리케이션에서 활용할 수 있습니다. 예를 들어, 음성 명령을 수행하는 비서 앱, 통화 내용을 자동으로 기록하는 통화 앱, 강의나 회의록을 텍스트로 변환하는 서비스 등이 있습니다. 오픈AI Whisper API를 사용하면 개발자들이 이러한 기능을 자신들의 소프트웨어에 쉽게 통합할 수 있습니다.
사용방법
해당 API를 사용하기 위해서는 API key를 발급 받아야 합니다.
https://platform.openai.com/account/api-keys
우선 Chat GPT를 이용하셔 파이썬강의 오디오 대본을 써달라고 한뒤. 역시 음성 더빙 AI tools 을 이용하여 음성 mp3 file을 만들어 봤습니다.
이 파일에서 Whisper API 를 이용해서 스크립트를 추출해 보겠습니다.
# Create the OpenAI API client
openai.api_key = os.environ["OPENAI_API_KEY"]
# Set the model you want to use
model_engine = "gpt-3.5-turbo"
file = open("파이썬강의.mp3", "rb")
transcription = openai.Audio.transcribe("whisper-1", file)
print(transcription['text'])
해당 코드의 실행 결과는 아래와 같습니다.
"안녕하세요 여러분. 오늘은 파이썬 함수에 대해 쉽고 재미있게 알려드리려고 합니다. 파이썬 함수는 많은 프로그래머들이 일상적으로 사용하는 중요한 기능 중 하나입니다. 지금부터 파이썬 함수에 대해 10분 동안 배워보도록 합시다. 파이썬 함수란 무엇일까요? 파이썬 함수는 특정한 작업을 수행하는 코드의 블록이며, 이 블록은 함수 이름과 함께 호출될 수 있습니다... "
전체 코드가 필요하신 분은 아래 링크를 확인해 보세요.
'인공지능(AI)' 카테고리의 다른 글
다음 주 ChatGPT4 출시 소식 (0) | 2023.03.12 |
---|---|
머신러닝에서 파이프라인(Pipeline) 은 무엇일까? (0) | 2023.03.08 |
딥러닝으로 병든 농작물 분류하는 웹앱 만들어보기 (0) | 2023.03.06 |
인공지능이 대체할 가능성 높은 직업들 (0) | 2023.03.01 |
Chat GPT, AGI 시대의 도래와 자본주의 그리고 우리의 미래 (0) | 2023.03.01 |
댓글