
Boxes.dev
Freemium

짧은 음성 샘플로 목소리를 똑같이 만들고 감정까지 조절할 수 있는 15개 언어 지원 TTS 기술입니다. 음성 에이전트 개발에 최적화되어 있습니다.


마이크로소프트의 가장 표현력이 풍부한 TTS 모델로, 짧은 샘플로 음성을 복제하고 미세한 감정 제어가 가능하며 15개 언어에서 일관된 음성 정체성을 유지합니다. 현재 Azure AI Foundry에서 백만 자당 22달러로 제공되며, VSCode, Dynamics 365 Contact Center, Teams에 통합될 예정입니다. OpenAI Realtime API의 가격 부담 없이 프로덕션 수준의 운율이 필요한 음성 에이전트 개발자에게 유용합니다.