많은 기업은 특정 대화형 애플리케이션에 원하는 다국어 정확도를 달성하기 위해 음성 및 번역 AI 모델을 맞춤화해야 합니다. 그러나 음성 AI 모델을 처음부터 맞춤화하려면 대규모 훈련 데이터 세트와 AI 전문 지식이 필요합니다.
개발 속도를 높이고 음성 모델을 고도로 맞춤화하려면 NVIDIA NeMo™를 사용하여 자동 음성 인식(ASR) 및 텍스트 음성 변환(TTS) 및 자연어 처리(NLP) 파이프라인을 구축, 맞춤화 및 배포할 수 있습니다. NeMo를 사용하면 기존의 사전 구축된 음성 AI 모듈을 맞춤화하고, 확장하고, 구성하여 새로운 모델을 만들 수 있습니다. NeMo로 최적화된 모델은 온프레미스 또는 클라우드에서 음성 서비스로 쉽게 내보내고 배포할 수 있습니다.