Seedance 2.0 Proは、バイトダンスが開発したAIビデオ生成モデルであり、音声入力、テキストプロンプト、またはソース画像から高精細でマルチショットの映画的なビデオを生成することを目的としています。映画制作者、マーケター、教育者、コンテンツ制作者など、一貫したキャラクター表現、正確な音声・映像同期、および撮影不要のプロダクション品質出力を必要とする専門家向けに設計されています。本モデルは、前世代(v1.5)の音声・映像統合基盤を基に、時間的連続性、アイデンティティ維持、解像度忠実度に重点を置いた大幅なアーキテクチャ改良を実装しています。
汎用ビデオ生成ツールとは異なり、Seedance 2.0 Proは「音声駆動型ビデオ基盤」として機能します。ユーザーがアップロードした音声(ナレーション、ボイスオーバー、音楽など)は、シーン生成の主要な制御信号として作用し、ミリ秒単位の口パク同期やリズムに合わせた視覚モーションを可能にします。また、テキストからビデオ(T2V)および画像からビデオ(I2V)の両方のワークフローをサポートし、アイデアベースまたは参照画像ベースの創作に対応します。
Seedance 2.0 Proは、入力選択、プロンプト調整、生成という3段階のワークフローに従います。ユーザーはまず、テキストからビデオ(T2V)または画像からビデオ(I2V)のいずれかを選択します。T2Vモードでは、シーン構成、照明、カメラモーション、キャラクター表情を指示する記述的プロンプトを使用します。I2Vモードでは、ソース画像を視覚的アンカーとして使用し、任意でタイルフレームを指定してモーション方向を制御できます。プロンプトは、照明、モーション、感情に関する構造化されたガイドラインによって強化され、意図の正確な伝達を支援します。
コア生成プロセスは、音声条件付き拡散アーキテクチャに基づきます。音声がアップロードされた場合、モデルは波形特徴をデコードし、顔の articulation(発話器官の動き)、身体運動、シーンダイナミクスを直接制御します。これは後処理による整合ではなく、内在的な条件付けです。時間的アイデンティティ注意機構は、顔のランドマーク、衣装属性、体型などの特徴をフレーム間およびショット間で参照することで、被写体の一貫性を維持します。レンダリングパイプラインは、潜在拡散処理を効率化し、2K出力を実現しながら計算遅延を低減します。
生成後、ユーザーは出力を確認し、解像度、再生時間、アスペクト比、カメラ挙動などのパラメータを調整して迅速に反復できます。すべての出力はウォーターマークなしでレンダリングされ、商用再配布が許諾されたライセンスのもとで利用可能です。
Seedance 2.0 Proは、複数の専門分野におけるスケーラブルかつ高品質なビデオ制作を可能にします。広告・マーケティング分野では、静的な製品アセットを2K解像度のプロモーションビデオへ変換し、ブランドに一貫したキャラクターと同期されたボイスオーバーを提供します。ソーシャルメディア向けには、TikTokやYouTube向けのアルゴリズム最適化ショートフォームコンテンツを生成し、縦型(9:16)、正方形(1:1)、横型(16:9)など各種アスペクト比に対応したネイティブ音声統合を実現します。
EC分野では、単一画像から製品のライフスタイル展示や動的360°風ビューを生成します。教育分野では、アニメーション解説や歴史的再現、インタラクティブ学習モジュールを制作し、正確な口パク同期による仮想インストラクターの講義を実現します。映画制作者およびアーティストは、プリビジュアライゼーション、シュールな世界観構築、映像的物語のプロトタイピングに活用でき、マルチショットにわたる視覚的連続性を確保します。さらに、ネイティブ音響合成機能により、音声ファイルをアップロードしなくても、テキストプロンプトと視覚アクションから適切な対話、フォーリー、環境音を自動生成可能です。
| プラン | 価格 | クレジット数 | 最大解像度 | 同時処理ジョブ数 | サポートレベル |
|---|---|---|---|---|---|
| スターター | 9.90ドル | 900 | 720p | 1 | メール |
| ベーシック | 29.90ドル | 3300 | 1080p | 1 | 優先メール |
| プラス | 49.90ドル | 5800 | 1080p | 5 | 優先メール |
| プロフェッショナル | 99.90ドル | 12200 | 1080p | 10 | 24時間365日優先 |
全プランには商用利用権、ウォーターマークなしダウンロード、クレジットの有効期限なしという特典が含まれます。