음성을 생성하지 않고 예상 길이만 반환하는 API로, 과금 예측이나 텍스트 길이 조절에 활용할 수 있습니다.
이 API는 음성을 실제로 생성하지 않고,
입력된 텍스트를 기반으로 예상 음성 길이(초 단위)만 반환합니다.
TTS 호출 전에 예상 크레딧 소모량을 파악하거나, 텍스트 길이를 조절할 때 유용합니다.
text-to-speech
API와 거의 동일합니다.duration
값만 반환됩니다.항목 | 필수 | 설명 |
---|---|---|
text | ✅ | 분석 대상 텍스트. 최대 300자 |
language | ✅ | 텍스트 언어. ko , en , ja 중 하나 |
style | ❌ | 감정 스타일. 지정하지 않으면 default 스타일이 사용됩니다 |
model | ❌ | 기본값은 sona_speech_1 . 현재는 해당 모델만 사용 가능 |
voice_settings | ❌ | 발화 속도나 피치 조절 값. 결과 길이에 영향 줄 수 있음 |
해당 텍스트를 생성하면 약 3.57초 분량의 오디오가 만들어진다는 의미입니다.
voice_settings.speed
를 조절하면 길이가 달라지므로, 고정된 발화 속도로 테스트하는 것이 좋습니다.API key for the service
Returns predicted duration of the audio in seconds
The response is of type object
.