AudioXは、音声、動画、画像の生成を1つのプラットフォームに統合したAI搭載のクリエイティブスタジオです。特別な制作スキルを持たないクリエイターやチームがマルチメディア資産を作成するのに適しています。
このプラットフォームは、テキストまたは静止画からの生成動画、アップスケーリングおよびインペインティングによる高精細画像生成、そしてテキストから音楽生成、音声クローン、効果音、動画から音声生成のワークフローに対応するAI音声エンジンをサポートしています。音声・動画圧縮などの統合ユーティリティにより、公開プロセスを効率化できます。
まずモジュールを選択します。Video Lab(テキストから動画または画像から動画)、Visual Canvas(画像生成、アップスケーリング、インペインティング)、AI Audio Engine(テキストから音楽生成、音声クローン、効果音、動画から音声生成)、Digital Avatars(写真のようにリアルな会話アバター)のいずれかです。プロンプトを入力し、参照メディアをアップロードして、再生時間、スタイル、解像度などのパラメーターを設定します。
AudioXは入力内容に基づいてプレビューを生成します。プロンプトの反復調整、設定の変更、組み込みの圧縮ツールを使用して配信向けのファイルサイズ最適化が可能です。通常、生成時間は短く、迅速な試行が可能です。
処理速度と出力オプションはプランによって異なります。プレミアムユーザーは優先キュー、高解像度エクスポート、バッチ処理を利用できます。権利もプランに応じて異なります(下記参照)。
推定生成時間
| 出力タイプ | 通常時間 |
|---|---|
| 音声 | 30~60秒 |
| 画像 | 15~30秒 |
| 動画 | 2~5分 |
| アバター | 1~3分 |
プランの概要
| 項目 | 無料プラン | プレミアムプラン |
|---|---|---|
| 利用可能範囲 | 基本機能;登録不要 | 高度な機能 |
| 処理 | 標準キュー | 優先キュー |
| 解像度 | 標準 | 高解像度出力 |
| バッチ処理 | 非対応 | 対応 |
| 商用利用権 | 個人用、非商用利用 | 完全な商用利用権 |
AudioXは、テキストから動画生成、画像生成、音声作成、アバター制作を統合することで、複数の個別ツール間を切り替える必要を減らします。これにより、複数形式にまたがるプロジェクトの企画、反復、納品が簡素化されます。
一般的な用途には以下が含まれます:
セキュリティおよびデータ取り扱いについては、HTTPS暗号化およびアップロードファイルと生成ファイルの24時間以内の自動削除で対応しています。コンテンツの利用条件はプランに依存し、完全な商用利用権はプレミアム加入者に提供されます。