このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。
クイックスタート
アプリケーションコードに組み込みますか? PythonまたはTypeScript SDKを使用してください。AIエージェント向けはMCPを参照してください。
インストール
- pip
- ストリーミング対応
[stream]の追加オプションは--streamによるシステムスピーカーへのリアルタイム再生を有効にします。
認証
- 環境変数
- 設定ファイル
デフォルト値を設定して入力を減らす
デフォルト値を設定して入力を減らす
デフォルト値を一度保存しておけば、毎回の呼び出しで該当するフラグを省略できます:
| 設定キー | 省略時の用途 | デフォルト |
|---|---|---|
api_key | 常時 | — |
default_voice | --voice未指定時 | — |
default_model | --model未指定時 | sona_speech_2 |
default_lang | --lang未指定時 | ko |
音声合成
ボイス管理
長さの予測と使用量の追跡
tts-predictは、クレジットを消費せずに長さとクレジットコストを見積もります — 大量の一括処理の前に便利です。
レシピ
スクリプトのフォルダを一括ナレーション
スクリプトのフォルダを一括ナレーション
.txtファイルを1つのディレクトリにまとめ、一度に合成します:LLMの出力をリアルタイムで読み上げ
LLMの出力をリアルタイムで読み上げ
任意のコマンドの出力をそのままリアルタイム音声へパイプします:
jqでカスタムボイスを探す
jqでカスタムボイスを探す
--format jsonであらゆる読み取りコマンドをスクリプト化できます:一括処理の前にコストを見積もる
一括処理の前にコストを見積もる
入力を順に処理し、予測される長さを合計してクレジット消費前に把握します:
リファレンス
対応モデル
対応モデル
sona_speech_1、sona_speech_2、sona_speech_2_flash、sona_speech_2t、supertonic_api_1、supertonic_api_3。各モデルの機能とトレードオフはモデルを参照してください。終了コード
終了コード
| コード | 意味 |
|---|---|
0 | 成功 |
1 | APIエラー |
2 | 認証エラー |
3 | 入力検証エラー |
130 | 中断(Ctrl-C) |
トラブルシューティング
command not found: supertone
command not found: supertone
インストール先が
PATHにないか、有効化されていない仮想環境にインストールされています。仮想環境を再度有効化するか、pip install --user supertone-cliで再インストールし、ユーザースクリプトのディレクトリをPATHに追加してください。認証エラー(終了コード 2)
認証エラー(終了コード 2)
API キーが未設定か無効です。
echo $SUPERTONE_API_KEYで確認するか、supertone config set api_key your-api-keyを実行してください。キーはDeveloper Consoleで取得できます。--stream で音が出ない
--stream で音が出ない
リアルタイム再生にはストリーミングの追加オプション(
pip install "supertone-cli[stream]")と**sona_speech_1モデル**が必要です — -m sona_speech_1を渡してください。他のモデルは*「Streaming requires sona_speech_1」*エラーになります。その場合は-o output.wavでファイルに保存してください。クレジット切れ(402)
クレジット切れ(402)
残高がなくなると合成は停止します。
supertone usage balanceで確認し、Developer Consoleでチャージしてください。関連ドキュメント
MCP
Model Context Protocolを通じて、AIエージェントがSupertoneを呼び出せるようにします。
Python SDK
アプリケーションコード向けの同じAPI。