VoiceScriptは、書かれたスクリプトを高品質で自然なナレーション音声に変換するテキスト・トゥ・スピーチ(TTS)プラットフォームです。ユーザーが提供した参照音声からカスタム音声をクローンする機能と、内蔵AI音声ライブラリの両方をサポートします。このツールは、ナレーションのタイミング、一貫性、および改訂管理を厳密に制御する必要があるクリエイター向けに設計されています。特に、顔出し不要のYouTube動画、教育用チュートリアル、マーケティング広告、ポッドキャスト、多言語コンテンツ制作に適しています。
対象ユーザーには、独立系コンテンツ制作者、教育デザイナー、マーケティング担当者、ローカライゼーション専門家、およびDaVinci Resolveなどのプロフェッショナル映像編集ソフトウェアで音声を統合する映像編集者が含まれます。VoiceScriptは、各スクリプトセグメントを個別に追跡・再レンダリング可能な単位として扱うことで、効率性、再現性、監査可能性を重視しています。
ワークフローは4つの順次的なステップで構成されます。まず、ユーザーがスクリプトをエディタにペーストすると、VoiceScriptが自動的に頭字語を正規化し、分割準備を行います。次に、システムが句読点、意味的境界、自然な発話の流れを考慮してテキストを音声的に・意味的に整合性のあるセグメントに分割し、各セグメントには変更検出用の固有ハッシュが割り当てられます。第三に、ユーザーは自身の参照音声から学習したカスタム音声またはストック音声を選択し、GPUまたはクラウドインフラを用いてレンダリングを開始します。最後に、ユーザーは各チャンクに対応するタイムスタンプ付きWAVファイルと、メタデータ、ステータスフラグ、リビジョンログを含むプロジェクトシートをエクスポートします。
すべてのレンダリング処理はブラウザ内または安全なクラウドインフラ上で実行されます。音声ファイルは暗号化されたAmazon S3バケットに保存され、オブジェクトバージョニングが有効になっています。各バージョンは7日間保持され、その後自動削除されますが、ユーザーは任意の時点でファイルを即時削除できます。
VoiceScriptは、スクリプトの編集更新が頻繁に行われる状況において、全体を再処理することなく迅速な反復作業を可能にします。これは、チュートリアルの修正、広告のA/Bテスト、多言語適応などに特に有効です。チャンク単位の音声出力モデルにより、DaVinci Resolveなどの映像編集ソフトウェアにおける正確な同期が容易になります。主な用途には、顔出し不要のYouTubeチャンネルの拡張的運用、eラーニング教材の23言語へのローカライゼーション、ブランドに合致したポッドキャストのイントロ/アウトロ生成、ドキュメンテーションのアクセシブルな音声版作成、およびブランド統一されたナレーション用音声ライブラリの構築が含まれます。ハッシュによる確定的識別と細かいプロジェクト追跡機能は、完全な監査証跡を必要とするコンプライアンス要件にも対応します。
| プラン | 月間レンダリング時間 | 同時ジョブ数 | カスタム音声数 | 備考 |
|---|---|---|---|---|
| 無料 | 3分 | 1 | 0 | プレビュー用に透かし入り出力;支払い方法登録不要 |
| スターター | 60分 | 1 | 2 | 超過分は1分あたり課金 |
| クリエイター | 120分 | 1 | 5 | 週次配信やポッドキャスト制作者向け |
| プロ | 300分 | 2 | 10 | 高出力スタジオ向けの保証されたスループットを提供 |
| チーム | 1200分 | 5 | 20 | シート単位の使用量共有、アカウント管理、優先サポート |
すべてのプランには音声クローン、スマートチャンク分割、プロジェクト追跡、および多言語対応が含まれます。