그룹리스트

팝업닫기

이동 할 그룹을 선택하여 주세요.

전체메뉴 닫기
API 음성 인식

음성인식 서비스(IBM Watson Speech To Text)는 오디오 음성을 텍스트로 변환합니다.

서비스 소개

음성인식 서비스(IBM Watson Speech To Text)는 오디오 음성을 텍스트로 변환합니다. 음성인식을 사용하면, 음성 제어 응용 프로그램을 만들 수 있습니다.

서비스 특징

오디오 음성을 텍스트로 변환하기 위해 다음과 같은 오디오 입력 기능을 제공합니다.


  • 언어 : 한국어, 브라질 포르투갈어, 프랑스어, 일본어, 만다린 중국어, 현대 표준 아랍어, 스페인어, 영국 영어 및 미국 영어
  • 모델 : 광대역(최소 16KHz 샘플링 오디오) 및 협대역(최소 8KHz 샘플링 오디오) 모델 지원
  • 오디오 포맷 : FLAC(Free Lossless Audio Codec), PCM(Linear 16-bit Pulse-Code Modulation), WAV(Waveform Audio File Format), Opus 또는 Vorbis 코덱을 사용하는 Ogg 포맷, Opus를 사용하는 Web Media (WebM) 또는 Vorbis 코덱, mu-law(또는 u-law) 오디오 데이터 또는 기본 오디오
  • 오디오 전송 : 클라이언트가 100MB의 오디오 데이터를 원샷 전송 기술을 이용하여 데이터 청크의 연속 스트림 또는 한 번에 모든 데이터를 서비스에 전달. 스트리밍 사용 시에는 다양한 시간 제한을 적용하여 리소스 보존

활용 예시

음성 또는 오디오 파일을 입력 데이터로 사용하고, 텍스트 형식으로 출력하는 모든 애플리케이션에서 활용 할 수 있습니다.


  • 응용 프로그램, 내장 장치, 차량 액세서리 등에 대한 음성 제어
  • 이메일, 메시지, 메모 등의 서비스에서 음성 입력

이용요금

  • 과금 기준: 월 음성인식 시간
  • 기본 모델 사용 시 (Baseline) : ₩26원 / 분(Minute) , 처음 1,000분(Minute) 무료
  • 커스텀 언어 모델 적용 시 (LM Customization) : 기본 모델 사용료 (\26원/분) + \40원/ 분(Minute), 처음 1,000분(Minute) 무료
  • 커스텀 음향 모델 적용 시 (AM Customization) : 베타 서비스. 가격 미정
  • 자세한 요금 안내는 고객 센터로 문의해 주시기 바랍니다.


리소스

이용약관

팝업닫기

문의하기

팝업닫기

AIBRIL 요금 계산기

팝업닫기

AIBRIL ChatBot.

prvBtn 팝업닫기

안녕하세요. AIBRIL챗봇 상담원입니다.

AIBRIL이 궁금하시면 무엇이든 물어보세요.