ToriOCRは、日本語、中国語(簡体字)、韓国語の文字を認識するためのmacOSネイティブアプリケーションです。すべての処理がデバイス上で完結し、外部サーバーへデータを送信することはありません。そのため、プライバシー保護、オフライン利用、および低遅延なテキスト抽出を重視するユーザーに適しています。本アプリケーションは、言語学習者、翻訳者、研究者、および東アジア文字を扱う専門家を主な対象としています。
メニュー バーに常駐するユーティリティとして設計されており、macOSのワークフローに自然に統合されます。任意のアプリケーションや画面領域からリアルタイムでテキストをキャプチャ・処理でき、スクリーンショットの手動撮影やクラウドベースのOCRサービスへの依存を不要とします。シンプルさ、アクセシビリティ、および一般的な言語学習ツールとの連携性を重視した設計となっています。
ToriOCRは、システムレベルの画面キャプチャ機能を用いて、画面上の矩形領域を選択します。起動後、東アジア文字に特化したローカルOCRモデルを適用し、選択領域内のテキストを抽出します。認識されたテキストはポップアップウィンドウに即時に表示され、ユーザーは確認・編集・操作できます。
このポップアップから、内蔵TTSによる発音再生、単語単位の辞書検索(漢字の音読み・訓読み、漢字の意味、韓国語の語義など)、およびAnki互換の.apkgファイルへの構造化エクスポート(原文、翻訳、発音、補足メモを含む)が可能です。言語モデルおよびTTS音声は初回使用時にローカルにダウンロードされ、端末上に保存されます。
画面録画およびアクセシビリティのシステム権限は、macOSの「システム設定」で明示的に許可する必要があります。アプリケーションは初期セットアップ時にこの手順をガイドします。
ToriOCRは、字幕、ウェブ記事、PDF、ソフトウェアインターフェースなど、画面上に表示されるテキストを瞬時に翻訳・発音できるため、言語学習における没入型学習を支援します。言語学習者は、統合辞書機能とAnkiエクスポートにより、効率的な語彙習得が可能になります。教育者や研究者は、本物のテキスト資料を迅速に収集・注釈付与するために活用できます。
オフライン優先のアーキテクチャにより、インターネット接続が制限されている環境や、厳格なデータ管理ポリシーが求められる組織でも利用可能です。また、GitHub上で公開されているオープンソースプロジェクトであるため、開発者や言語学者は、再現性・プライバシー保護を確保したテキスト分析ワークフローに活用できます。