テキストを音声に変換し、オーディオストリーム形式で返すTTS APIのリクエスト構造、パラメーターの使用方法、エラーに関する注意事項について説明します。
{voice_id}
: キャラクター単位のIDのみ使用可能language
、style
、model
などのパラメーターはRequest Bodyに含める必要があります項目 | 必須 | 説明 |
---|---|---|
text | ✅ | 変換するテキスト。最大300文字まで入力可能 |
language | ✅ | テキストの言語。ko 、en 、ja のいずれか |
style | ❌ | 感情スタイル。例:neutral 、happy 、sad など。指定がない場合、キャラクターの基本スタイルが適用されます |
model | ❌ | 使用するモデル。デフォルトは sona_speech_1 。現在はこのモデルのみ利用可能 |
voice_settings | ❌ | 音程/速度の調整。pitch_shift 、pitch_variance 、speed フィールドを含む(デフォルト:0、1、1) |
output_format | ❌ | 出力する音声ファイルの形式。wav または mp3 。(デフォルト:wav ) |
wav
ですoutput_format=mp3
を指定すると、MP3形式での応答も可能ですtext
の長さが300文字を超えると、400エラーが発生します。style
を指定しなくても呼び出しは可能ですが、キャラクターごとにデフォルトスタイルが異なる場合があります。API key for the service
The desired output format of the audio file (wav, mp3). Default is wav.
wav
, mp3
Streaming audio data in binary format
The response is of type file
.