概要 - Supertone API Documentation

このドキュメントは英語の原文から自動翻訳されています。表現に不自然な箇所がある場合があります。正確な内容は英語の原文もあわせてご確認ください。

Supertoneは、生のREST以外にもText-to-Speech APIを呼び出すいくつかの方法を提供します。作業スタイルに合うものを選んでください: アプリケーションコードにはSDK、ターミナルやスクリプトにはCLI、AIエージェントにはMCPサーバー。いずれも同じREST APIをラップし、OpenAPI仕様と常に同期しています。

Python SDK

pip install supertone — 同期および非同期クライアント、並列自動チャンク分割。

TypeScript SDK

npm add @supertone/supertone — Promiseベース、ESM/CJS、NodeおよびBun対応。

CLI

pip install supertone-cli — ターミナルから合成・ストリーミング・一括処理とボイス管理。

MCP

uvx supertone-mcp — Claude、Cursorなどのエージェント向けの組み合わせ可能なツール。

どれを使えばいい?

やりたいこと	使うもの	対象
PythonやNodeのコードからSupertoneを呼び出す	Python / TypeScript SDK	アプリケーション開発者
シェル、スクリプト、CIでオーディオを生成・一括処理する	CLI	DevOps、コンテンツ/スクリプティング
AIエージェントにボイス検索や音声合成をさせる	MCPサーバー	Claude / Cursor / エージェント利用者
SDKのない言語を使う、またはワイヤフォーマットを制御する	REST API	あらゆるランタイム

各ツールが提供するもの

SDK（Python & TypeScript） — アプリケーションコード向けのイディオマティックなクライアントです。認証処理、型安全なモデル・enum、オーディオチャンクのストリーミング、長文の自動チャンク分割（300文字で分割し透過的に結合）、HTTPステータスコードに対応した型付きエラー、バックオフ付きの設定可能なリトライを提供します。詳細な機能表は各SDKのページにあります。 CLI — ターミナルとスクリプトから使うAPIです。文字列・ファイル・標準入力から合成し、スピーカーへストリーミングし、ディレクトリ全体を一括処理し、ボイスを管理・クローンし、使用量の確認や長さの予測ができます。--format json出力はパイプに適しており、一般的な終了コードでスクリプトから失敗を分岐処理できます。 MCPサーバー — AIエージェント（Claude、Cursorなどの MCP クライアント）がSupertoneを操作できるようにする組み合わせ可能なツールです。エージェントはボイスの検索・試聴、コスト見積もり、ボイスのクローン、音声合成を行い — これらのステップを自ら多段階のワークフローに連結します。

REST APIを直接使う場合

REST APIは、SDKが提供されていない言語やランタイム（Go、Java、PHP、Rust、組み込みシステムなど）、またはワイヤフォーマットを最大限にコントロールしたい場合に使用できます。各エンドポイントはAPIリファレンスに記載されており、そのセクションのサンプルにはcurl、JavaScript、Go、Python、PHP、Javaが含まれています。 REST APIを直接呼び出す場合は、チャンク分割、リトライ、ストリーミングの消費を自前で実装する必要があります。

Python SDK

TypeScript SDK

CLI

MCP

​どれを使えばいい?

​各ツールが提供するもの

​REST APIを直接使う場合

どれを使えばいい?

各ツールが提供するもの

REST APIを直接使う場合