Vidu Q3は、テキストプロンプトおよび静止画像を高品質なシネマティック動画に変換するAI駆動型動画生成システムです。清華大学と共同で開発された本製品は、U-ViTアーキテクチャを活用し、物理法則に則った一貫性のある16秒間の高解像度動画(最大1080p)を生成します。アニメーター、マーケター、映画制作者、デジタルイラストレーターなど、専門的な撮影・編集スキルや技術的知識を必要とせずにプロフェッショナルレベルの動画出力を求めているクリエイターを主な対象としています。
Vidu Q3は完全なクラウドベースサービスであり、ローカルGPUハードウェアやソフトウェアのインストールを必要としません。テキストから動画へ(text-to-video)および画像から動画へ(image-to-video)の両方のワークフローをサポートし、統合された音声生成機能と調整可能なモーションパラメータを備えています。課金モデルは一括購入方式で、購入したクレジットは有効期限なく使用可能であり、個人および商用プロジェクトにおける柔軟な利用を可能にします。
Vidu Q3は3段階のワークフローで動作します。まず、ユーザーは詳細なテキストプロンプトを入力するか、高解像度の参照画像をアップロードしてコンセプトを定義します(必要に応じて開始フレームおよび終了フレームの画像も指定可能)。次に、視覚スタイル(リアルまたはアニメ)、モーション強度、解像度(540p/720p/1080p)、再生時間、音声オプション(BGMまたは環境音)などのクリエイティブパラメータを設定します。最後に、独自のU-ViTモデルにより入力が処理され、数秒以内に同期された動画および音声が出力されます。
基盤となるアーキテクチャは、物理的妥当性および時間的連続性に最適化されており、フレーム間でのフリッカー、モーフィング、オブジェクトの不自然な変形などの課題を回避します。モーションは空間的意味論およびプロンプトの意図に基づきアルゴリズム的に適用され、ダイナミックなカメラ移動および自然な被写体挙動を実現します。音声生成は視覚イベントと時間的に同期しており、リズムおよびタイミングの整合性が保たれます。
Vidu Q3は標準化された機能を用いて多様な専門分野に対応します。アニメ制作では、キャラクターの形状を維持しつつ流暢なアクションシーンを生成することで、2D制作パイプラインを加速し、手描きキーフレームへの依存を低減します。マーケティングでは、静止商品写真をソーシャルメディア向けに最適化された短尺動画広告へ変換し、エンゲージメントおよびクリック率を向上させます。映画制作のプリヴィジュアライゼーションでは、監督および撮影監督が複雑なシーン構成、ライティング設定、カメラアングルを製作前段階で迅速にプロトタイピングできます。観光および文化振興分野では、風景写真を地域固有の雰囲気や情緒を伝える動的プロモーション映像へ変換します。
| プラン | 価格 | クレジット数 | 最大再生時間 | 解像度 | スタイル選択 | 商用利用許諾 | サポートレベル |
|---|---|---|---|---|---|---|---|
| Starter | 9.90ドル | 198 | 1~16秒 | 最大1080p | 一般、アニメ | あり | メールサポート |
| Basic | 29.90ドル | 660 | 1~16秒 | 最大1080p | 一般、アニメ | あり | 優先レンダリングキュー、メールサポート |
| Plus | 49.90ドル | 1200 | 1~16秒 | 最大1080p | 一般、アニメ | あり | 専用レンダリングチャネル、高度なプロンプト精度、メールサポート |
| Professional | 99.90ドル | 2500 | 1~16秒 | 最大1080p | 一般、アニメ | あり | 専用レンダリングチャネル、高度なプロンプト精度、メールサポート |