Ltx 2.3はLTX-2モデルファミリーの最新版であり、テキストから動画、画像から動画、音声から動画への高精細な生成および同期音声出力を実現するように設計されています。潜在空間の再構築、高品質データで再学習されたVAE、および強化されたテキスト接続部など、アーキテクチャレベルでの改良により、精細度、モーションの一貫性、プロンプトへの忠実度が向上しています。本モデルは、ネイティブ縦型動画対応、4K解像度、およびリアルタイム処理性能を重視したプロダクション向けに最適化されています。
Ltx 2.3は、クリエイター、マーケター、開発者、SaaS創業者、スタジオ、チームなど、信頼性の高いマルチモーダル動画生成を必要とするユーザーを対象としています。公開されているモデル重み、ソースコード、ComfyUI対応などのオープンエコシステムにより、クラウド利用とローカル展開の両方が可能であり、プライバシー、カスタマイズ性、および統合の柔軟性を重視した設計となっています。
Ltx 2.3は、テキスト、画像、音声、動画を組み合わせたマルチモーダル生成エンジンです。ユーザーはまず、参照画像、脚本、音声録音、またはソース動画などの基礎となる資産をアップロードし、その後、自然言語によるプロンプトで創造的意図を記述します。このプロンプトには、モーション、照明、トランジション、雰囲気、および各資産の役割を明示します。モデルは強化されたテキスト接続部によってこれらの指示を解釈します。
生成プロセスでは、最適化された拡散アーキテクチャと音声・映像の同期機構を活用します。出力は最大20秒の高品位動画で、プランに応じて720pからネイティブ4Kまでの解像度に対応します。生成後の編集には、特定セグメントの微調整、クリップの延長、複数動画の統合などが可能であり、フル再生成を必要としません。
Ltx 2.3は、LTXウェブインターフェースを通じたクラウド利用と、ComfyUIを介したローカル展開の両方をサポートしており、オープンなモデル重みとドキュメンテーションにより、開発者によるカスタマイズおよびパイプライン統合が容易です。
Ltx 2.3は、ソーシャルメディア向けコンテンツ、マーケティングキャンペーン、教育用教材、ポッドキャスト連携型ストーリーテリングなど、高品質かつ効率的な動画制作を可能にします。ネイティブ縦型対応により、モバイル向けプラットフォームでの後処理(クロップ)が不要となり、ワークフローの効率が向上します。音声から動画への生成機能は、ポッドキャスターおよびナレーターが手動でのタイミング調整なしに、音声に同期したビジュアルを生成できるようになります。開発者およびスタジオは、API対応(予定)、バルク処理、並列ジョブ実行、ローカル実行オプションなどの機能から恩恵を受けます。
プロンプトへの忠実度およびモーションの一貫性の向上により、生成失敗や反復作業が削減され、日常的なコンテンツ制作およびスタジオレベルの納品に適しています。すべての価格プランには商用利用ライセンスが含まれており、クレジットは有効期限がなく、サブスクリプション不要の柔軟な利用モデルを提供しています。
| プラン | 価格 | クレジット数 | 解像度 | 同時ジョブ数 | 主な機能 |
|---|---|---|---|---|---|
| スターター | $9.90 | 99 | 720p | 1 | HDテキスト/画像から動画、ネイティブ音声、商用利用ライセンス、標準キュー |
| ベーシック | $29.90 | 330 | 1080p | 1 | 高速HD生成、優先キュー、優先メールサポート |
| プラス(最も人気) | $49.90 | 600 | 1080p | 5 | 安定性と品質の向上、高速優先キュー、優先サポート |
| プロフェッショナル | $99.90 | 1250 | 1080p | 10 | 最速キュー、フルエフェクトパック、新機能の早期アクセス、24時間365日優先サポート、バルク処理、APIアクセス(近日公開) |