그룹리스트

팝업닫기

이동 할 그룹을 선택하여 주세요.

카탈로그
Service 음성 인식

음성인식 서비스(Watson Speech To Text)는 오디오 음성을 텍스트로 변환합니다.

서비스소개

음성인식 서비스(Watson Speech To Text)는 오디오 음성을 텍스트로 변환합니다. 음성인식을 사용하면, 음성 제어 응용 프로그램을 만들 수 있습니다.

서비스특징

오디오 음성을 텍스트로 변환하기 위해 다음과 같은 오디오 입력 기능을 제공합니다.

  • 언어 : 한국어, 브라질 포르투갈어, 프랑스어, 일본어, 만다린 중국어, 현대 표준 아랍어, 스페인어, 영국 영어 및 미국 영어
  • 모델 : 광대역(최소 16KHz 샘플링 오디오) 및 협대역(최소 8KHz 샘플링 오디오) 모델 지원
  • 오디오 포맷 : FLAC(Free Lossless Audio Codec), PCM(Linear 16-bit Pulse-Code Modulation), WAV(Waveform Audio File Format), Opus 또는 Vorbis 코덱을 사용하는 Ogg 포맷, Opus를 사용하는 Web Media (WebM) 또는 Vorbis 코덱, mu-law(또는 u-law) 오디오 데이터 또는 기본 오디오
  • 오디오 전송 : 클라이언트가 100MB의 오디오 데이터를 원샷 전송 기술을 이용하여 데이터 청크의 연속 스트림 또는 한 번에 모든 데이터를 서비스에 전달. 스트리밍 사용 시에는 다양한 시간 제한을 적용하여 리소스 보존

활용 예시

음성 또는 오디오 파일을 입력 데이터로 사용하고, 텍스트 형식으로 출력하는 모든 애플리케이션에서 활용 할 수 있습니다.

  • 응용 프로그램, 내장 장치, 차량 액세서리 등에 대한 음성 제어
  • 이메일, 메시지, 메모 등의 서비스에서 음성 입력

시도해보세요!

음성인식을 이용한 음성 인식 처리를 직접 체험해보세요.

이용요금

  • 과금 기준: 월 음성인식 시간
  • 기본 모델 사용 시 (Baseline) : ₩26원 / 분(Minute) , 처음 1,000분(Minute) 무료
  • 커스텀 언어 모델 적용 시 (LM Customization) : ₩40원 / 분(Minute) , 처음 1,000분(Minute) 무료
  • 커스텀 음향 모델 적용 시 (AM Customization) : 베타 서비스. 가격 미정
  • 자세한 요금 안내는 고객 센터로 문의해 주시기 바랍니다.

시작하기

  • AIBRIL과 시작할 준비가 되셨나요?

    AIBRIL과 함께라면 무엇이든지
    쉽고 빠릅니다.

    Get started
  • AIBRIL의 자료가 필요하신가요?

    AIBRIL에서는 개발을 위한
    유용한 자료들을 제공합니다.

    Resource


이용약관

팝업닫기

문의하기

팝업닫기

AIBRIL 요금 계산기

팝업닫기

AIBRIL ChatBot.

prvBtn 팝업닫기

안녕하세요. AIBRIL챗봇 상담원입니다.

AIBRIL이 궁금하시면 무엇이든 물어보세요.