CastReader 2.0は、ウェブ上のテキストコンテンツを音声に変換するブラウザ拡張機能です。テキスト・トゥ・スピーチ(TTS)技術を用いて動作し、聴覚による学習を重視するユーザー、アクセシビリティ支援を必要とするユーザー、または手元の作業をしながら文字情報を消費したいユーザーを対象としています。本ツールは、アカウント登録やサブスクリプション、設定を一切必要とせず、ブラウザ内でのみ動作します。
主な利用者には、ディスレクシアやADHDのある方、学術資料をレビューする学生および研究者、情報過多に対応するビジネスパーソン、発音練習を行う言語学習者、およびデジタルウェルビーイングや視覚的アクセシビリティを重視する方が含まれます。CastReaderは、Canvasレンダリングやカスタムフォントエンコーディングなど、複雑な描画手法を採用するウェブプラットフォームを含む幅広いオンライン環境で動作します。
CastReader 2.0は、オンデマンドで起動する軽量なブラウザ拡張機能として動作します。Chromeウェブストアからインストール後、ブラウザのコンテキスト内でローカルに実行されます。ユーザーが対応サイト(例:記事、電子書籍、研究論文、AIチャットインターフェース)にアクセスすると、CastReaderアイコンをクリックして再生を開始します。拡張機能はページのDOM構造を解析し、必要に応じてOCRおよびフォントデコードを適用して、Kindle Cloud ReaderやWeReadにおけるCanvas要素から読み取り可能なテキストを抽出します。
コンテンツ抽出には高度なフィルタリングが組み込まれており、広告、ナビゲーションメニュー、フッターなどの非本質的な要素は音声出力から除外されます。抽出されたテキストは論理的な段落単位で分割され、ローカル処理されたAI音声により読み上げられます。再生中は対応する段落がリアルタイムで画面にハイライト表示され、正確な視覚的追跡が可能になります。処理過程でコンテンツが外部サーバーに送信されることはありません。
CastReader 2.0は、聴覚入力と同期した視覚フィードバックを組み合わせたデュアルチャンネル学習を可能にし、読字障害など読み取りに関連する学習課題を持つユーザーにとって有効な支援手段となります。学生および研究者は、arXivやPubMedなどの学術論文を通勤中や集中度が低い状況下でも効率的に吸収できます。ビジネスパーソンは、業界レポート、ニュースレター、長文の分析資料を音声化することで、画面を見続ける負担を軽減し、情報を効果的に把握できます。
言語学習者は、40以上の言語でネイティブに近い発音を聞きながら、ウェブ上の実際のテキストを読み進めることで、リスニング力を向上させることができます。また、ChatGPT、Claude、GeminiなどのAI会話インターフェースとの互換性により、モデルが出力した長文の説明や分析を手動でのコピーや外部ツールを介さずに直接音声で確認できます。さらに、目の疲れを軽減したり、視覚障害のあるユーザー向けのアクセシブルな代替手段を提供したりする目的でも活用されます。