Voisは、完全にローカルで動作するデスクトップ向けテキスト・トゥ・スピーチ(TTS)アプリケーションです。スクリプト作成、音声生成、編集、マスタリング、エクスポートを一元的に行える統合型音声制作スタジオとして設計されています。クラウドサービスへの依存を排除し、高品質かつ表現力豊かな音声をプライバシーを損なうことなく生成できます。主なターゲットユーザーには、ポッドキャスター、オーディオブック著者、YouTubeナレーター、ドキュメンタリー制作者、eラーニング開発者、ゲームデザイナーなど、クリエイティブなコンテンツ制作を行う個人が含まれます。
クラウドベースのTTSプラットフォームとは異なり、Voisはユーザーの端末上で全ての処理を実行します。これにより、文字単位の課金、使用量制限、および機密性の高いスクリプトを第三者サーバーへアップロードする必要がなくなります。パフォーマンスと安全性を重視してRustで開発されており、Apple Silicon搭載Macでは最大6倍のリアルタイム処理速度を実現します。
Voisは、スクリプト作成、キャスティング、生成/編集、マスタリング/エクスポートという4段階の直感的ワークフローを採用しています。ユーザーはまず、アプリ内入力、文書インポート、またはURL指定によるスクリプトの取り込みを行い、複数話者対応の場合は話者タグを付与します。次に、内蔵音声ライブラリまたはクローン済み音声から各話者やセクションに音声を割り当てます。音声生成はローカルで無制限に行われ、生成されたクリップは編集可能なセグメントとしてマルチトラックタイムライン上に配置されます。ここでタイミング調整、トランジション挿入、環境音追加、話者順序管理などが可能です。
最終ステージでは、LUFS正規化、周波数バランス調整、ダイナミックレンジ制御などのマスタリング効果を適用した後、目的プラットフォーム向けにエクスポートします。ACX向けプリセットなどは、業界標準(例:ACXの-18 LUFS要件)に自動的に適合するよう設定されています。プロジェクトファイル、音声アセット、クローン音声はすべてローカルに保存され、サブスクリプション解約後も完全に利用可能です。
Voisは、クラウドTTS API、デジタルオーディオワークステーション(DAW)、マスタリングプラグインなど、従来複数のツールで行っていた工程を単一アプリケーションに統合します。ポッドキャスターは、ゲストの声を再現するなど多話者対応のエピソードを一人で制作できます。オーディオブック著者は、原稿を数時間でプラットフォーム対応のマスタリング済み音声に変換できます。YouTubeクリエイターは、顔出し不要やチュートリアル向けのナレーションを一貫した品質で大量に生成できます。ドキュメンタリー制作者は、多言語ナレーションやキャラクター別音声を活用して地域ごとのローカライズを実現します。ゲーム開発者は、スタイルや言語の整合性を保ちつつNPCの台詞を一括生成できます。教育コンテンツ制作者は、トレーニングモジュールや瞑想ガイド向けにトーンやペーシングを調整したナレーションを提供できます。すべての処理はユーザーの端末上で完結し、使用回数に応じた課金やデータの外部流出リスクはありません。
| プラン | 価格 | 課金周期 | 主な条件 |
|---|---|---|---|
| 無料版 | 無料 | 日次制限 | 1日あたり10回の音声生成 |
| 年間サブスクリプション | 月額9ドル | 年間一括課金(年間108ドル) | 全機能無制限利用;ローンチ特別割引(40%オフ)適用中 |
| 月間サブスクリプション | 月額29ドル | 月次課金 | 全機能無制限利用;長期契約の縛りなし |