Skip to main content
このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。
コード不要で、ターミナルから直接テキストを音声に変換できます。Supertone CLIは文字列・ファイル・標準入力(stdin)から合成し、スピーカーへリアルタイムでストリーミングし、ディレクトリ全体を一括処理し、ボイス・使用量・クレジットを管理します。 ソース: supertone-inc/supertone-cli

クイックスタート

1

インストール

pip install "supertone-cli[stream]"
Python 3.12+が必要です。[stream]の追加オプションでリアルタイム再生が有効になります。
2

API キーを設定

export SUPERTONE_API_KEY="Kp9mZ3xQ7v..."
3

聴いてみる

supertone tts "ターミナルから発する最初のひとこと。" \
  --voice 91992bbd4758bdcf9c9b01 -m sona_speech_1 --stream
音声が聞こえれば準備完了です。✅
アプリケーションコードに組み込みますか? PythonまたはTypeScript SDKを使用してください。AIエージェント向けはMCPを参照してください。

インストール

pip install supertone-cli
Python 3.12+が必要です。[stream]の追加オプションは--streamによるシステムスピーカーへのリアルタイム再生を有効にします。

認証

export SUPERTONE_API_KEY="Kp9mZ3xQ7v..."
デフォルト値を一度保存しておけば、毎回の呼び出しで該当するフラグを省略できます:
設定キー省略時の用途デフォルト
api_key常時
default_voice--voice未指定時
default_model--model未指定時sona_speech_2
default_lang--lang未指定時ko
supertone config set default_voice 20160a4c5ba38967330c84
supertone config set default_lang en

音声合成

# 文字列から
supertone tts "ターミナルからこんにちは。" --voice VOICE_ID -o output.wav

# ファイルから
supertone tts -i input.txt -v VOICE_ID -o output.wav

# 標準入力(stdin)から — パイプに対応
echo "パイプで渡したテキスト。" | supertone tts -v VOICE_ID -o output.wav

# 保存せずリアルタイム再生([stream] 追加オプションが必要)
supertone tts "これはリアルタイムで再生されます。" -v VOICE_ID -m sona_speech_1 --stream

# 形式・ボイス設定の調整
supertone tts "もっと遅く、もっと低く。" -v VOICE_ID --output-format mp3 --speed 0.9 --pitch -2

# フォルダ全体を一括処理 — 入力ごとにオーディオファイル1つ
supertone tts -i scripts/ --outdir audio/ -v VOICE_ID

ボイス管理

supertone voices list                                  # Supertoneが提供するプリセットボイス
supertone voices list --type custom                    # 自分のクローンボイスのみ
supertone voices search --lang en --gender female      # プリセットの絞り込み
supertone voices get VOICE_ID                         # 詳細情報
supertone voices clone --name "My Voice" --sample sample.wav
supertone voices edit VOICE_ID --name "Renamed"
supertone voices delete VOICE_ID --yes               # --yesは確認をスキップ

長さの予測と使用量の追跡

tts-predictは、クレジットを消費せずに長さとクレジットコストを見積もります — 大量の一括処理の前に便利です。
supertone tts-predict "これはどのくらいの長さになりますか?" -v VOICE_ID

supertone usage balance
supertone usage analytics --start 2026-04-01 --end 2026-04-30
supertone usage voices    --start 2026-04-01 --end 2026-04-30

レシピ

.txtファイルを1つのディレクトリにまとめ、一度に合成します:
supertone tts -i chapters/ --outdir narration/ -v VOICE_ID --output-format mp3
任意のコマンドの出力をそのままリアルタイム音声へパイプします:
my-llm "今日のヘッドラインを要約して" | supertone tts -v VOICE_ID -m sona_speech_1 --stream
--format jsonであらゆる読み取りコマンドをスクリプト化できます:
supertone voices list --type custom --format json | jq '.[].name'
入力を順に処理し、予測される長さを合計してクレジット消費前に把握します:
for f in scripts/*.txt; do supertone tts-predict -i "$f" -v VOICE_ID; done

リファレンス

sona_speech_1sona_speech_2sona_speech_2_flashsona_speech_2tsupertonic_api_1supertonic_api_3。各モデルの機能とトレードオフはモデルを参照してください。
コード意味
0成功
1APIエラー
2認証エラー
3入力検証エラー
130中断(Ctrl-C)

トラブルシューティング

インストール先がPATHにないか、有効化されていない仮想環境にインストールされています。仮想環境を再度有効化するか、pip install --user supertone-cliで再インストールし、ユーザースクリプトのディレクトリをPATHに追加してください。
API キーが未設定か無効です。echo $SUPERTONE_API_KEYで確認するか、supertone config set api_key your-api-keyを実行してください。キーはDeveloper Consoleで取得できます。
リアルタイム再生にはストリーミングの追加オプション(pip install "supertone-cli[stream]")と**sona_speech_1モデル**が必要です — -m sona_speech_1を渡してください。他のモデルは*「Streaming requires sona_speech_1」*エラーになります。その場合は-o output.wavでファイルに保存してください。
残高がなくなると合成は停止します。supertone usage balanceで確認し、Developer Consoleでチャージしてください。

関連ドキュメント

MCP

Model Context Protocolを通じて、AIエージェントがSupertoneを呼び出せるようにします。

Python SDK

アプリケーションコード向けの同じAPI。