Skip to main content
このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。
Supertoneは、生のREST以外にもText-to-Speech APIを呼び出すいくつかの方法を提供します。作業スタイルに合うものを選んでください: アプリケーションコードにはSDK、ターミナルやスクリプトにはCLI、AIエージェントにはMCPサーバー。いずれも同じREST APIをラップし、OpenAPI仕様と常に同期しています。

Python SDK

pip install supertone — 同期および非同期クライアント、並列自動チャンク分割。

TypeScript SDK

npm add @supertone/supertone — Promiseベース、ESM/CJS、NodeおよびBun対応。

CLI

pip install supertone-cli — ターミナルから合成・ストリーミング・一括処理とボイス管理。

MCP

uvx supertone-mcp — Claude、Cursorなどのエージェント向けの組み合わせ可能なツール。

どれを使えばいい?

やりたいこと使うもの対象
PythonやNodeのコードからSupertoneを呼び出すPython / TypeScript SDKアプリケーション開発者
シェル、スクリプト、CIでオーディオを生成・一括処理するCLIDevOps、コンテンツ/スクリプティング
AIエージェントにボイス検索や音声合成をさせるMCPサーバーClaude / Cursor / エージェント利用者
SDKのない言語を使う、またはワイヤフォーマットを制御するREST APIあらゆるランタイム

各ツールが提供するもの

SDK(Python & TypeScript) — アプリケーションコード向けのイディオマティックなクライアントです。認証処理、型安全なモデル・enum、オーディオチャンクのストリーミング、長文の自動チャンク分割(300文字で分割し透過的に結合)、HTTPステータスコードに対応した型付きエラー、バックオフ付きの設定可能なリトライを提供します。詳細な機能表は各SDKのページにあります。 CLI — ターミナルとスクリプトから使うAPIです。文字列・ファイル・標準入力から合成し、スピーカーへストリーミングし、ディレクトリ全体を一括処理し、ボイスを管理・クローンし、使用量の確認や長さの予測ができます。--format json出力はパイプに適しており、一般的な終了コードでスクリプトから失敗を分岐処理できます。 MCPサーバー — AIエージェント(Claude、Cursorなどの MCP クライアント)がSupertoneを操作できるようにする組み合わせ可能なツールです。エージェントはボイスの検索・試聴、コスト見積もり、ボイスのクローン、音声合成を行い — これらのステップを自ら多段階のワークフローに連結します。

REST APIを直接使う場合

REST APIは、SDKが提供されていない言語やランタイム(Go、Java、PHP、Rust、組み込みシステムなど)、またはワイヤフォーマットを最大限にコントロールしたい場合に使用できます。各エンドポイントはAPIリファレンスに記載されており、そのセクションのサンプルにはcurl、JavaScript、Go、Python、PHP、Javaが含まれています。 REST APIを直接呼び出す場合は、チャンク分割、リトライ、ストリーミングの消費を自前で実装する必要があります。