Mango Chatは、Windows向けに設計された無料・オープンソースの音声入力アプリケーションです。クラウドサービスや専用ソフトウェアを必要とせず、任意のWindowsアプリケーション内で直接音声からテキストへ変換する機能を提供します。主な対象ユーザーには、専門職者、学生、開発者、およびアクセシビリティ支援を必要とするユーザーが含まれます。これらの方々は、プライバシーを重視した効率的な音声入力機能をWindows環境で利用することを求めています。
軽量なアーキテクチャと最小限のシステムリソース使用量を特徴としており、初期設定後は完全にオフラインで動作します。MITライセンスによるオープンソースであるため、コミュニティによる検証、カスタマイズ、および特殊なワークフローへの統合が可能です。コア機能の利用にはアカウント登録、インターネット接続、またはサブスクリプションは一切不要です。
Mango Chatは、ローカルで実行される音声認識エンジンを用いて、リアルタイムで音声をテキストに変換します。ユーザーは設定可能なホットキーで入力を開始し、マイクに向かって自然に話すと、認識されたテキストが現在のフォアグラウンドアプリケーション内のカーソル位置に挿入されます。基本的なワークフローは以下の通りです:ホットキー押下 → 音声入力 → テキスト表示 → 必要に応じて音声コマンド実行(例:「改行」「一語削除」) → キーボード入力または再び音声入力の継続。
アプリケーションはWindowsのアクセシビリティAPIと連携し、テキスト挿入およびキーストロークの模倣を実現しています。これにより、アプリケーションごとの個別設定を必要とせず、シームレスな跨アプリケーション操作が可能になります。すべての音声処理はデバイス上で完結し、音声データは外部に送信されません。モデルの重みおよび推論ロジックはアプリケーションバイナリに同梱されており、ネットワーク接続の有無にかかわらず一貫したパフォーマンスを保証します。
Mango Chatは、運動機能障害を持つユーザー向けのハンズフリー文書作成などのアクセシビリティ用途に対応します。ライターや研究者、ノートテイカーにとって、キーボード入力への依存を減らし、コンテンツ作成を加速します。開発者は、コードコメントやドキュメントの迅速な記述を目的として、コンテキスト切替なしに活用できます。教育現場では、読字障害(ディスレクシア)や身体的書き取り困難を抱える学生が講義や課題中に利用できます。また、オフライン動作およびクラウド非依存の設計により、法務、医療、行政など、機密情報取扱いが厳格に管理される分野でも適用可能です。