選択したボイスと設定可能なボイス設定を使用してテキストを音声に変換します。
| Name | Required | Description |
|---|---|---|
voice_id | Yes | 対象ボイスの ID です。 |
sona_speech_1 — en, ko, jasupertonic_api_1 — en, ko, ja, es, ptsona_speech_2 — en, ko, ja, bg, cs, da, el, es, et, fi, hu, it, nl, pl, pt, ro, ar, de, fr, hi, id, ru, vi| Name | Required | Description |
|---|---|---|
text | Yes | 変換するテキストです(最大 300 文字)。 |
language | Yes | 言語コードです。サポート: en, ko, ja, bg, cs, da, el, es, et, fi, hu, it, nl, pl, pt, ro, ar, de, fr, hi, id, ru, vi。 |
style | No | 感情スタイルです。例: neutral, happy, sad など。未指定の場合はキャラクターのデフォルトが適用されます。 |
model | No | TTS モデルです。デフォルト: sona_speech_1。 |
output_format | No | 出力フォーマットです。オプション: wav, mp3。デフォルト: wav。 |
voice_settings | No | 高度なボイスパラメータです(下記参照)。 |
include_phonemes | No | true の場合、オーディオ(Base64 エンコード)に加えて音素タイミングデータを返します。デフォルト: false。 |
sona_speech_1 — 以下に記載された すべて の Voice Settings に対応しています。supertonic_api_1 — speed のみ対応し、その他の設定は無効となります。sona_speech_2 — 対応する Voice Settings は次の 3 つのみです:pitch_shift, pitch_variance, speed.| Name | Range | Default | Description |
|---|---|---|---|
pitch_shift | -24 → 24 | 0 | 半音(semitone)単位のピッチ調整です。 |
pitch_variance | 0 → 2 | 1 | ピッチ変動の度合いです。 |
speed | 0.5 → 2 | 1 | 生成オーディオを一様に速く/遅くします(比率)。 |
duration | 0 → 60 | 0 | 値を指定すると、その長さ(秒)に合わせて音声が生成されます。 |
similarity | 1 → 5 | 3 | 生成音声が元のキャラクターボイスにどれだけ近いかを制御します。 |
text_guidance | 0 → 4 | 1 | 入力テキストに対して発話特性がどの程度敏感に適応するかを制御します。 |
subharmonic_amplitude_control | 0 → 2 | 1 | 生成音声のサブハーモニック振幅量を制御します。 |
The text to convert to speech
300The language code of the text
en, ko, ja, bg, cs, da, el, es, et, fi, hu, it, nl, pl, pt, ro, ar, de, fr, hi, id, ru, vi The style of character to use for the text-to-speech conversion
The model type to use for the text-to-speech conversion
sona_speech_1, sona_speech_2, supertonic_api_1 The desired output format of the audio file (wav, mp3). Default is wav.
wav, mp3 Return phoneme timing data with the audio
Returns either binary audio or JSON with phoneme data based on include_phonemes parameter
Binary audio file (when include_phonemes=false or omitted)