選択したボイスと設定可能なボイス設定を使用してテキストを音声に変換します。
{voice_id}
:キャラクター単位のIDのみ使用可能language
、style
、model
などのパラメータはRequest Bodyに含まれます項目 | 必須 | 説明 |
---|---|---|
text | ✅ | 変換するテキスト。最大300文字まで入力可能 |
language | ✅ | テキストの言語。ko 、en 、ja のうち一つ |
style | ❌ | 感情スタイル。例:neutral 、happy 、sad など。指定しない場合、そのキャラクターのデフォルトスタイルが適用 |
model | ❌ | 使用モデル。デフォルト値はsona_speech_1 。現在はこのモデルのみ使用可能 |
voice_settings | ❌ | ピッチ/速度調節。pitch_shift 、pitch_variance 、speed フィールド含む(デフォルト値:0、1、1) |
output_format | ❌ | 出力する音声ファイルの形式。wav または mp3 。(デフォルト:wav ) |
wav
output_format=mp3
をクエリパラメータとして渡すとmp3形式でもレスポンス可能X-Audio-Length
ヘッダーを通じて音声の長さ(秒)を確認可能text
の長さが300文字を超過すると400エラーが発生します。style
がない場合でも呼び出し可能ですが、キャラクターによってdefault styleが異なる可能性があるため、Get Voices APIを呼び出してデフォルトスタイルを確認してください(スタイル配列の最初の値がデフォルト)。API key for the service
Choose TTS engine: "supercage" or "torchserve"
The desired output format of the audio file (wav, mp3). Default is wav.
wav
, mp3
Audio file converted from text. The response includes an X-Audio-Length header with the duration in seconds.
The response is of type file
.