Documentation Index
Fetch the complete documentation index at: https://docs.supertoneapi.com/llms.txt
Use this file to discover all available pages before exploring further.
このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。
voice_settings はすべての TTS リクエストで指定できる任意のオブジェクトで、オーディオの発話表現 — ピッチ、抑揚、速度、そしてフラッグシップモデル向けのいくつかの高度なパラメータ — を調整します。
クイックリファレンス
| Setting | Range | Default | What it does |
|---|---|---|---|
pitch_shift | -24 → 24 | 0 | 半音単位のピッチシフトです。±12 で 1 オクターブ分にあたります。 |
pitch_variance | 0 → 2 | 1 | ピッチの変動幅です — 値が小さいほど平板に、大きいほど抑揚豊かになります。 |
speed | 0.5 → 2 | 1 | 再生速度の倍率です。duration の後に適用されます。 |
duration | 0 → 60 | 0 | 生成オーディオを目標長さ(秒)に合わせます(0 = 目標なし)。 |
similarity | 1 → 5 | 3 | 出力が元のキャラクターボイスにどれだけ近いかを制御します。 |
text_guidance | 0 → 4 | 1 | テキスト内容に対して発話特性がどの程度敏感に適応するかを制御します。 |
subharmonic_amplitude_control | 0 → 2 | 1 | 生成音声のサブハーモニック振幅量です。 |
ボイスパラメータの設定
- Python
- TypeScript
- cURL
モデル別のサポート状況
すべてのモデルがすべての設定に対応しているわけではありません。サポートされていない設定は 黙って無視されます — たとえばsupertonic_api_3 に subharmonic_amplitude_control を指定してもエラーにはならず、単に出力に影響しないだけです。
| Setting | sona_speech_2 | sona_speech_2_flash | supertonic_api_3 | supertonic_api_1 | sona_speech_1 |
|---|---|---|---|---|---|
pitch_shift | ✅ | ✅ | — | — | ✅ |
pitch_variance | ✅ | ✅ | — | — | ✅ |
speed | ✅ | ✅ | ✅ | ✅ | ✅ |
duration | ✅ | ✅ | — | — | ✅ |
similarity | ✅ | — | — | — | ✅ |
text_guidance | ✅ | — | — | — | ✅ |
subharmonic_amplitude_control | — | — | — | — | ✅ |
パラメータの相互作用
pitch_shiftは半音単位です。+12で 1 オクターブ上がります。自然な調整には小さい値(±1 〜 ±4)を使ってください。大きな値ではロボット的な響きになります。pitch_varianceは表現力を制御します。 0 にすると単調になり(インストラクショナル動画やニュース読み上げに向きます)、最大 2 にすると非常に表情豊かな発話になります。durationの次にspeed。 両方を指定すると、エンジンはまずduration秒を目標とし、その後speedを倍率として適用します。duration=5とspeed=2を指定すると、おおよそ 10 秒のオーディオになります。similarityとtext_guidanceは、クローンボイスやsona_speech_2/sona_speech_1でもっとも効果を発揮します。similarityを上げるとソースボイスにより忠実になり、text_guidanceを上げると発話がテキストの感情トーンに合わせて変化しやすくなります。
レシピ
穏やかでゆっくりしたナレーション:関連項目
モデル
どのモデルがどの Voice settings に対応しているかを確認します。
API リファレンス
リクエストとレスポンスの完全なスキーマ。