Elocuteは、AIを活用したプロフェッショナル向けテキスト・トゥ・スピーチ(TTS)プラットフォームです。ユーザーは、自然言語による音声設計、短い音声サンプルからの音声クローン作成、および事前に調整されたプリセット音声の選択という3つの方法で、高品質な音声を生成できます。本サービスは、ポッドキャスター、動画制作者、eラーニング開発者、アクセシビリティ専門家、およびアプリケーションや動画、教育コンテンツ、支援技術向けに高忠実度かつカスタマイズ可能な音声出力を必要とする企業を対象としています。
また、開発者向けAPIを提供しており、ソフトウェア内にTTS機能をプログラム方式で統合できます。無料プランではクレジットカード登録不要で即時利用可能であり、評価および小規模用途に適しています。課金プランは使用量と機能制限(例:音声設計およびクローン作成回数)に基づいて段階的に拡張されます。
Elocuteは3段階のワークフローで動作します。まず、ユーザーは任意の長さ・内容のテキストを貼り付けまたは入力します。次に、音声を選択します。選択肢は、プリセット音声ライブラリから選ぶ、自然言語で音声特性(例:「落ち着いたイギリス英語の女性、30代半ば、温かみのあるトーン」)を記述して音声設計を開始する、または音声サンプルをアップロードして音声クローンを生成する、のいずれかです。最後に、システムが音声を合成し、ダウンロード可能なWAVファイルを出力します。
音声設計およびクローンは、多様な言語的・副言語的データで訓練された独自のAIモデルによってサーバー側で処理されます。すべての音声生成手法において、一貫した音素処理、イントネーション、感情モデリングが適用されます。すべての出力は均一な音質(48 kHzサンプルレート)で提供され、プロフェッショナルなポストプロダクションツールとの互換性を確保します。
Elocuteは複数の分野で実践的な用途をサポートします。ポッドキャスターはスタジオ設備なしで一貫したナレーションを制作でき、動画制作者は多言語での吹き替えや脚本の迅速な反復制作に活用できます。eラーニング開発者は、大規模なコースナレーションを自動生成し、アプリ開発者は教育・アクセシビリティ・生産性ツールへTTS機能を統合できます。企業はブランドに合致した担当者音声を保存したり、カスタムIVRシステムを構築したりできます。国際的なアクセントおよび感情バリエーションのサポートにより、ローカライゼーションおよび包括的なコンテンツ配信も可能になります。
| プラン | 価格 | 月間クレジット | 音声設計回数 | 音声クローン回数 |
|---|---|---|---|---|
| 無料 | $0 | 10,000 | 3 | 1 |
| Pro | $17 | 100,000 | 7 | 3 |
| Business | $75 | 500,000 | 20 | 10 |