CaptionSnapは、macOS向けのアプリケーションであり、Microsoft Teams、Zoom、Google Meetなどのビデオ会議プラットフォームが生成するリアルタイム字幕をキャプチャして保存することを目的としています。本製品は、画面上に一時的に表示される字幕が消えてしまうという課題に対処し、ユーザーがプライバシーを損なうことなく、永続的で検索可能な構造化された会話記録を取得できるように設計されています。主にリモート会議を頻繁に行う専門職の方々(例:プロジェクトマネージャー、コンサルタント、教育関係者、法務担当者)を対象としています。
従来の音声認識型トランスクリプションサービスとは異なり、CaptionSnapは音声を録音・処理・送信しません。代わりに、対応する会議アプリケーションが既に画面にレンダリングしている字幕テキストを、macOSのアクセシビリティAPIを用いて直接読み取ります。すべての処理はユーザーのMac上でローカルに完結し、データの完全な所有権と最小限のシステムリソース消費を保証します。
CaptionSnapは、アクティブな会議ウィンドウ内に表示される字幕テキストを監視することで機能します。Teams、Zoom、Google Meetいずれかのプラットフォームでライブ字幕が有効化されている場合(ネイティブ機能またはmacOS Live Captions経由)、アプリケーションはその各行のテキスト、タイミング、および関連する発言者名を検出し、キャプチャします。発言者名の識別は、会議アプリケーションから提供されるメタデータに基づき行われるため、発言者分離(speaker diarization)やAI推論を必要としません。
ワークフローには、会議アプリで字幕機能を有効化した後、CaptionSnapを起動するだけの簡単な手順のみが必要です。一度実行されると、アプリケーションは他のアプリケーションで作業中でもバックグラウンドで静かに動作し続けます。キャプチャされた内容は、ユーザー指定のローカルMac上の場所にプレーンテキストのMarkdownファイル(例:transcript.md)として保存されます。任意のポストミーティング要約は、Apple Intelligenceのオンデバイスモデルによって生成され、機密性とパフォーマンスの両立を実現します。
CaptionSnapは、分散チーム向けの会議記録、難聴者向けアクセシビリティ対応、法的・規制上の記録保管、個人的な知識管理など、多様な業務用途をサポートします。正確なタイムスタンプと発言者名を保持しているため、ユーザーは効率的に検索・注釈付与・参照を行えます。ローカルファースト設計により、既存のワークフロー(ObsidianやNotionなどのノートアプリ、バージョン管理システム、文書管理ツールへのインポート)との統合が可能で、ベンダー依存性はありません。PDFおよびDOCX形式でのエクスポート機能により、Markdownを利用しない関係者との共有も容易です。低負荷設計により、古いMacハードウェアや長時間の会議スケジュールにおいても安定したバッテリー持続時間を確保できます。