Fameo AIは、有名人の映像を用いてカスタムスクリプトを正確な口元同期で話す動画を生成する生成AIプラットフォームです。個人ユーザーがSNS向けコンテンツや記念イベント、クリエイティブ表現、軽微な商用用途などに活用できるよう設計されています。このサービスは、音声と映像のデータに基づいて学習されたディープラーニングモデルを活用し、テキスト入力から高精細な音声合成および顔アニメーションを生成します。
本サービスは、ドナルド・トランプ、テイラー・スウィフト、モーガン・フリーマン、イーロン・マスク、ビヨンセなど1000人以上の事前学習済み有名人の音声・映像テンプレートに対応しており、さらに独自画像のアップロードやユーザー自身の音声クローン作成も可能です。有料サブスクリプションでは、透かしなしのHD解像度動画が出力され、1本あたりの生成時間はおよそ30秒です。
Fameo AIは3段階のワークフローで動作します。まずユーザーが有名人のテンプレートを選択するか、独自画像をアップロードします。次に、最大600文字のスクリプトを入力し、選択した人物に合った音声モデルによって合成音声が生成されます。最後に、生成された音声と写実的な顔アニメーションが同期され、各音素に応じて口の動きがフレーム単位で制御され、最終的にHD動画としてレンダリングされます。
高度な機能として、Multi-Talkモードでは、1つの構成内に複数のキャラクターを順不同で配置でき、ドラッグ&ドロップ操作で発話順とタイミングを直感的に調整できます。Mimic Motionは、静止画からポーズ推定および拡散モデルを用いたモーション合成により、ダンスなどの動きを付与する機能です。音声クローンの作成には、ユーザーが提供する短い音声サンプルが必要です。
Fameo AIは、主にSNS向けのパーソナライズされた動画メッセージや人間関係におけるユニークなコミュニケーション手段の作成に使用されます。一般的な用途には、お気に入りの有名人による誕生日祝い、結婚式のアナウンス、モチベーション向上のための激励スピーチ、友人同士のジョークやロースト、およびSNS向けの新奇コンテンツがあります。また、教育者、マーケター、コンテンツクリエイターなどが迅速かつ低コストで動画プロトタイピングを行う際にも活用可能です。
本プラットフォームは使いやすさを重視しており、動画編集のスキルは一切不要です。すべての処理はサーバー側で実行されます。有料プランでは生成動画の所有権がユーザーに帰属し、透かしなしのHDファイルをダウンロードして各種プラットフォームへ共有できます。商用利用は適用されるサブスクリプション契約に基づき認められていますが、なりすましやセンシティブなトピックに関するコンテンツポリシーの制限が適用されます。