Seedance 2.0は、ByteDanceが開発した次世代AIビデオ生成モデルであり、テキストおよび画像入力から高精細なシネマティックビデオを生成することを目的としています。ネイティブの音声・映像同時生成機能により、ポストプロセスを必要とせずに同期された会話音声、フォーリー音、環境音を出力します。本モデルは、高解像度で一貫性のあるビデオ出力を必要とするプロフェッショナルなクリエイター、マーケター、教育者、開発者を対象としています。
従来バージョンと比較して、Seedance 2.0は解像度(最大2K)、マルチショット連続性、および永続的なキャラクター同一性において大幅な向上を実現しています。これにより、カメラアングルやシーン遷移の変化にかかわらず、顔の特徴、衣装、体型が一貫して維持されます。本モデルはクレジット制のウェブベースサービスとして提供され、Seedance 1.5 Pro APIによるプログラム制御も可能です。
Seedance 2.0は、テキストまたは静止画像を入力として受け付けます。テキストからビデオへの変換では、意味的意図、トーン、描写的詳細(照明、構図、動きの指示など)を解釈し、時間的に整合性のあるビデオシーケンスを生成します。画像からビデオへの変換では、ユーザーが1枚または2枚の参照画像をアップロードし、外見および目標となるポーズまたは動きの軌道を定義します。その後、モデルは被写体の同一性および解剖学的一貫性を保持しつつ、滑らかで物理的に妥当な動きを合成します。
音声は、別途後処理するのではなく、映像と統合された音声・映像共同モデリングによって生成されます。これにより、音素と口の動きが一致し、シーンの文脈に応じた音響特性が反映され、物体との相互作用に基づいた適切なフォーリー要素がレイヤー化されます。出力の再生時間は1回の生成あたり5秒に固定されており、解像度およびアスペクト比はレンダリング前に選択されます。ユーザーはウェブインターフェースを通じて操作し、各生成ごとにクレジットが消費されます。残りクレジット数および購入オプションはリアルタイムで表示されます。
Seedance 2.0は、マーケティング資材、ソーシャルメディア向けコンテンツ、教育用解説動画、ストーリーボードのラフ制作などの迅速なプロトタイピングを可能にします。永続的なキャラクター同一性機能により、アニメーションのプレビジュアライゼーションやバーチャルインフルエンサーの開発など、キャラクター主導型のナラティブ制作が支援されます。ネイティブ音声機能により、音声同期作業が不要となるため、解説動画や多言語ダビングパイプラインなど、音声重視の用途に適しています。デザイナーは、TikTok向けの9:16、シネマティックプレビュー向けの21:9、Instagramフィード向けの1:1など、クロスプラットフォーム配信のための複数アスペクト比対応を活用できます。開発者はSeedance 1.5 Pro APIを用いて、カスタムアプリケーションへのAIビデオ生成機能の組み込みを実現し、既存のインフラとの互換性を維持できます。