NoteVideoLLM は、ミーティングやメディアのスライドを撮影し、音声を文字起こししてリアルタイムで構造化された要約を生成する視覚型AIメモツールです。ブラウザ上で直接動作し、Google Meet、Zoom、YouTube、音声付きの任意のタブで利用できます。システムは自動的にスライドやトピックの変更を検出し、重要な文脈が文字起こしと併せて保存されるよう主要な画像を保持します。
このツールは、通話、講義、動画の信頼性が高く検索可能な記録を必要とするビジネスパーソン、チーム、教育者、研究者向けに設計されています。多言語での文字起こしと翻訳、マインドマップや関係グラフなどのインタラクティブな可視化、ドキュメントツールへのエクスポートに対応しています。25万トークンのコンテキストウィンドウにより、数時間にわたるセッションにも対応可能です。
Chrome拡張機能としてインストール後、NoteVideoLLMは音声付きの任意のタブで起動できます。自動言語検出機能を用いてリアルタイムで文字起こしを行い、30以上の言語に翻訳することも可能です。チャットアシスタントにより、内容についてライブ中でも後からでも質問できます。
システムはコンピュータビジョン(Gemini Visionを含む)を使用してスライド、図表、その他の重要なビジュアルを検出します。重要な瞬間のスクリーンショットを取得し、トピックごとにセッションを自動的に章に分割して、素早く確認できるビジュアルギャラリーを作成します。これにより、画像が関連する要約ポイントと連動した視覚的ナレッジベースが生成されます。
セッション終了時、または任意のタイミングで、構造化された要約の生成、アクションアイテムの抽出、タイムスタンプの確認が可能です。マインドマップや関係グラフなどの可視化はワンクリックで作成できます。出力結果はフォーマット済みのGoogle DocsやNotionページとしてエクスポートでき、Google Driveに保存したりローカルにダウンロードしたりすることも可能です。25万トークンのコンテキストウィンドウとハイブリッドメモリにより、数時間にわたるセッション全体にわたり正確な情報検索が可能です。
| 分野 | 詳細 |
|---|---|
| 対応プラットフォーム | Chrome拡張機能。Google Meet、Zoom、YouTube、音声付きの任意のブラウザタブで動作 |
| 対応言語 | 文字起こし・翻訳:30以上 |
| ビジュアルキャプチャ | スライド/図表の検出、自動スクリーンショット、章別ギャラリー |
| 要約機能 | 主なポイント、アクションアイテム、タイムスタンプ |
| 可視化機能 | マインドマップ、関係グラフ |
| エクスポート先 | Google Docs、Notion、Google Drive、ローカルダウンロード |
| セッション規模 | 25万トークンのコンテキストウィンドウにより、3時間以上のセッションに対応 |