Supertone APIは、感情が生きている音声をテキストベースで合成できるRESTful APIです。Playと連動したボイスライブラリベースで、テキスト入力だけで自然な発話を生成でき、ボイス探索から使用量管理まで様々な機能を提供します。

提供機能

Text-to-Speech

テキストを音声に変換します。ユーザーはボイスIDと共に言語、スタイル、モデル、詳細音声設定(pitch、speedなど)を渡すことができます。

ボイス探索

現在のアカウントで使用できるボイスを全体照会したり、言語、スタイル、名前などを条件として検索できます。

発話長予測

音声を生成する前に、入力したテキストが何秒分のオーディオとして生成されるかを予測できます。 この機能はクレジットを差し引かずに呼び出し可能です。

クレジットと使用量確認

アカウントの残りクレジット残高、APIを通じて使用した音声時間などを確認できるエンドポイントを提供します。

文書構造

正式リリース以降、Supertone APIは単純な呼び出し機能を超えて、Play、コンソール、ボイス生成機能を有機的に連結した拡張可能な音声合成プラットフォームとして運営されます。