TranscribeAudioは、Google Chromeブラウザ用の拡張機能であり、アクティブなブラウザタブで再生中の音声をリアルタイムで文字起こしするツールです。Zoom、Google Meet、Microsoft Teams、YouTube、Twitch、Vimeo、ポッドキャストプレーヤーなど、ウェブ上で再生されるあらゆる音声コンテンツから音声を取得し、画面上に移動可能なフローティングウィンドウに文字起こし結果を表示します。アクセシビリティ、生産性、多言語対応を目的として設計されており、拡張機能のインストール以外に追加のハードウェアやソフトウェアは不要です。
本製品は、プロフェッショナル、学生、教育者、言語学習者、および聴覚障害のあるユーザーなど、リアルタイム字幕を必要とする幅広い利用者層を対象としています。処理は主にブラウザ内で実行され、音声データはOpenAIの音声認識モデルを活用して解析されます。現在のところ、Chromeデスクトップ版のみに対応しています。
TranscribeAudioは、ChromeのWeb Audio APIとMediaStream制約を用いて、現在アクティブなブラウザタブの音声ストリームにアクセスします。有効化後、音声入力をリアルタイムで処理し、デバイス側での前処理を経て、関連する音声セグメントをOpenAIの音声認識APIに送信して文字起こしを行います。その結果が、他のブラウザコンテンツの上に重ねて表示されるドラッグ可能な半透明のオーバーレイウィンドウに逐次表示されます。
ユーザーは、拡張機能アイコンをクリックし、対象となるタブを選択することで文字起こしを開始します。本拡張機能は音声を永続的に記録または保存しません。文字起こしはリアルタイムで生成・表示され、クラウド同期およびエクスポート機能は有料プランに加入した場合にのみ利用可能です。フローティングウィンドウには一時停止・再開・クリアなどの基本操作ボタンが備わっており、キーボードショートカットによる迅速な操作もサポートされています。
TranscribeAudioは、難聴者向けのアクセシビリティ向上や、包括的な学習環境の構築を支援するために、ライブまたはオンデマンドの音声・映像コンテンツに対して即時の字幕を提供します。リモートワークでは、会議の議事録作成、アクションアイテムの確認、言語障壁を超えた理解促進に活用されます。教育者は講義の文字起こしを教材作成に使用し、言語学習者は発音・リスニング力の向上のために音声とテキストの同期出力を活用できます。
ビジネス用途では、コンプライアンス文書作成、効率的なメモ取り、セッション後の分析にも貢献します。プラットフォーム固有の統合を必要とせず、多様なウェブサービスと互換性があるため、汎用性が高いのが特徴です。エクスポートおよびクラウド同期機能(有料プランで提供)により、アーカイブ、共有、ドキュメンテーション、字幕作成、知識管理など、より広範なコンテンツワークフローへの統合が可能になります。
| プラン | 価格 | 月間文字起こし上限 | 主な機能 |
|---|---|---|---|
| スターター | 月額4.99ドル | 2時間 | リアルタイムフローティングUI、AI高精度認識、50言語以上対応 |
| プロ | 年額119.88ドル(月額9.99ドル相当) | 無制限 | TXTエクスポート、クラウド同期、優先サポート |
| ライフタイム | 一括299.99ドル | 無制限 | プロ機能すべて、終身アップデート、新機能優先アクセス |
すべてのプランにはChrome拡張機能およびウェブダッシュボードへのアクセスが含まれます。無料版はコア機能をすべて利用可能ですが、エクスポートおよびクラウド同期機能は含まれません。