TTS呼び出し前に予想クレジット消費量を把握したり、テキスト長を調節する際に有用です。
エンドポイント
リクエストパラメータ
Item | Required | Description |
---|---|---|
text | Yes | 解析するテキストです。最大 300 文字です。 |
language | Yes | テキストの言語です。ko 、en 、ja のいずれかです。 |
style | No | 感情スタイルです。未指定の場合はデフォルトスタイルが使用されます。 |
model | No | デフォルトは sona_speech_1 です。現在はこのモデルのみ利用可能です。 |
voice_settings | No | 発話速度やピッチの調整値です。結果の長さに影響する場合があります。 |
使用方式
- 呼び出し方法と Request Body は text-to-speech API とほぼ同一です。
- ただしオーディオは返されず、結果として duration のみが返ります。
- Predict Duration API の呼び出しでは クレジットは消費されません。
- 実際のクレジットは減りません。(音声生成が行われないため)
- 同一テキストで実際に呼び出した場合と非常に近い結果を得られます。
- voice_settings.speed を調整すると長さが変わるため、一定の発話速度でテストすることをおすすめします。
Authorizations
Path Parameters
Body
application/json
The text to convert to speech. Max length is 300 characters.
Maximum length:
300
Language code of the voice
Available options:
en
, ko
, ja
The style of character to use for the text-to-speech conversion
The model type to use for the text-to-speech conversion
The desired output format of the audio file (wav, mp3). Default is wav.
Available options:
wav
, mp3
Response
Returns predicted duration of the audio in seconds