Documentation Index
Fetch the complete documentation index at: https://docs.supertoneapi.com/llms.txt
Use this file to discover all available pages before exploring further.
このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。
新規TTSモデル:supertonic_api_3
Supertone APIで、supertonic_api_1の次世代後継モデルであるsupertonic_api_3がサポートされるようになりました。前モデルの超低レイテンシ特性を維持しつつ、発話安定性が大幅に向上し、対応言語も拡張されています。主なアップデート
-
supertonic_api_3—supertonic_api_1の後継supertonic_api_1の超低レイテンシ特性を継承- 発話安定性が大幅に向上 — 発音や読み誤りが大幅に減少
- オープンウェイトの Supertonic 3 リリースとは異なる学習を経ており、別個のモデルです
- 31言語に対応:
en、ko、ja、ar、bg、cs、da、de、el、es、et、fi、fr、hi、hr、hu、id、it、lt、lv、nl、pl、pt、ro、ru、sk、sl、sv、tr、uk、vi - voice settings:
speedのみ(supertonic_api_1と同じ)
-
supertonic_api_1はレガシーのsupertonicモデルになりました- 既存連携向けに引き続き利用可能
- 新規プロジェクトは
supertonic_api_3を使用してください
-
モデル選択の拡張 — TTSリクエストで
sona_speech_2、sona_speech_2_flash、supertonic_api_3、supertonic_api_1、sona_speech_1が利用可能になりました。
新規TTSモデル:sona_speech_2、sona_speech_2_flash、supertonic_api_1
Supertone APIに3つの新しい音声合成モデルが追加され、多言語対応の拡張とより柔軟な生成オプションを提供します。主なアップデート
-
sona_speech_2— 多言語フラッグシップ- 23言語に対応
- 音質と安定性の向上
include_phonemesとnormalized_textに対応- voice settings:
subharmonic_amplitude_controlを除くすべてのパラメータ
-
sona_speech_2_flash— 低レイテンシバリアントsona_speech_2と同じ23言語に対応- 低レイテンシ向けに最適化
- voice settings:
pitch_shift、pitch_variance、speed、duration
-
supertonic_api_1(beta) — 軽量・低レイテンシモデル- 対応言語:
en、ko、ja、es、pt - 最速の推論とシンプルなセットアップを実現する設計
- voice settings:
speedのみ
- 対応言語:
-
モデル選択の拡張 — TTSリクエストで
sona_speech_2、sona_speech_2_flash、supertonic_api_1、sona_speech_1が利用可能になりました。
カスタムボイスとストリーミングTTS(ベータ)
Supertone APIに複数の新機能が追加されました。今回のリリースではプリセットボイスとカスタムボイスが分離され、APIを通じたボイスクローンの登録が可能になりました。また、ストリーミングTTSのベータ版も公開されました。主なアップデート
-
プリセットボイスとカスタムボイスの分離
- プリセットボイスはSupertoneが設計・提供するボイスです。
- カスタムボイスはお客様が登録・管理するクローンボイスです。
- お客様所有のボイスを管理する新しいエンドポイント群(
/v1/custom-voices/...配下)。
-
APIによるボイスクローン
- これまでSupertone Playでのみ可能だったボイスクローンが、APIでもサポートされるようになりました。
- 詳しくはCreate cloned voiceをご覧ください。
-
ストリーミングTTS(ベータ)
- AIチャットボットやキャラクターチャットなど、リアルタイム性が重要なアプリケーションに最適なストリーミングTTS APIのベータ版を公開しました。
- 詳しくはStream speechをご覧ください。
Supertone APIグランドオープン
Supertone APIがクローズドベータを終了し、正式に公開されました。今回のリリースでは、サービス構造とAPIの使いやすさを全面的に刷新し、Playとの統合およびボイスシステムの一元化を通じて、より直感的で拡張性の高い音声生成プラットフォームへと進化しました。
主な変更点
-
Voice ID構造の刷新
- 既存の
{character-language-style}の組み合わせから → **キャラクター単位のvoice_id**に統一。 language、styleパラメータはリクエストボディに移動し、柔軟な呼び出しが可能になりました。
- 既存の
-
新規TTSモデル
- 既存の
proとturboを置き換え → 単一のsona_speech_1モデルに統合。 - 音声品質の改善、テキスト長制限を200文字から300文字に引き上げ。
- 既存の
-
クローンボイスAPI対応
- Playで作成したクローンボイスをAPIから呼び出せるようになりました。
- 同一アカウント内で自動連携し、権限ベースのセキュリティを維持。
-
Playと料金プランの統合
- API使用時にPlayのクレジットシステムをそのまま適用。
- 別途料金プランなしでクレジットを共有し、統合的に課金。
-
ボイス検索機能の強化
GET /voices、GET /voices/searchによるフィルタリングと探索。- 各ボイスがサポートする言語、スタイル、サンプルを公開。
-
Predict Duration API
- 生成前に音声の長さを予測可能(クレジットは差し引かれません)。
-
新しいユーザーガイドとドキュメント
- Quickstart、Voice Selection、Error Handling、FAQなど実践的なドキュメントを完備。
- Play ↔ API連携フローを考慮したドキュメント全体のリニューアル。
ボイス検索アップデート
新しい検索機能により、お求めのボイスをより簡単に見つけられるようになりました。主なアップデート
- フィルターとキーワードでボイスを検索できる新しいエンドポイント。
- 言語、性別、年齢、用途別のフィルタリング。
- ボイス名と説明文を対象としたキーワード検索。
- 大量の結果に対応するページベースのページング。

Supertone APIクローズドベータリリース
Supertone APIクローズドベータへようこそ — Supertoneの音声AI技術をサービスとして提供します。主な機能
- Text-to-speech音声合成サービス。
- ボイス一覧の照会および使用量確認API。
エンドポイント
- List voices — 利用可能なボイスを取得。
- Create speech — テキストを音声に変換。
- Get voice usage — API使用量を確認。
開始方法
- console.supertoneapi.comでサインアップ。
- クローズドベータへの参加を申請。
- コンソールからAPI Keyを発行。
- APIを連携して使用。
コンソール機能
- API Keyの発行と管理。
- 分単位のAPI使用量モニタリング。