Echosyは、macOS向けのリアルタイム、オンデバイス音声文字起こし・音声入力・要約アプリケーションです。インターネット接続を一切必要とせず、すべての音声処理をMac上で完全にローカルで実行するため、データのプライバシーと所有権が保証されます。研究者、ジャーナリスト、法務関係者、教育者、開発者など、機密性の高いコンテンツを扱う専門職向けに設計されています。Echosyは、ZoomやSpotifyなどのアプリケーションから出力されるシステム音声とマイク音声を同時に記録し、文字起こし、要約、音声入力を行います。
本アプリケーションは99以上の言語に対応した多言語文字起こしをサポートし、Qwen3-ASRおよびMLX最適化Whisperなどの複数のローカル自動音声認識(ASR)モデルを統合しています。ユーザーはライブセッションの文字起こし、システム全体での音声入力、句読点や翻訳によるテキスト補正、設定可能なLLMバックエンドを用いたAI要約生成、録音履歴の管理など、すべてクラウド経由ではなく端末上で行えます。
Echosyは、macOSネイティブアプリケーションとして動作し、AppleのScreenCaptureKitフレームワークを活用して、ZoomやTeams、YouTube、Spotifyなどのアプリケーションから出力されるシステム音声とマイク音声を同時にキャプチャします。キャプチャされた音声ストリームは、Metalアクセラレーション対応の推論エンジンにより、Qwen3-ASRやMLX WhisperなどのローカルASRモデルへ直接送信され、タイムスタンプ付きの文字起こしがリアルタイムで生成されます。ユーザーはハードウェア制約(メモリ容量、チップアーキテクチャ)や言語ニーズに応じて、複数のASRモデルから選択できます。
文字起こし結果はインタラクティブに補正可能です:句読点と文法が自動修正され、セグメント単位で翻訳が適用され、カスタムプロンプトによって出力スタイルが調整されます。要約および分析には、OpenAI、Gemini、Claude、Groq、OpenRouter、または完全ローカルのOllamaなどのユーザ設定LLMエンドポイントに接続し、低遅延で文字起こしテキストのチャンクをストリーミング処理します。生成されたすべての出力(文字起こし、要約、チャット応答)は、手動でエクスポートしない限り、端末内にのみ保存されます。
ファイル文字起こしも同様のローカルワークフローで実行されます:インポートされた音声または動画ファイルはデコードされ、選択されたASRモデルにより処理されます。セッション履歴はメタデータ、元音声参照、全文文字起こし、関連要約をローカルデータベースに保持し、検索、再生、MD/TXT/SRT/VTT/DOCX/PDF形式へのエクスポート(Pro版)を可能にします。
Echosyは、厳格なデータプライバシー要件、低遅延応答性、多様な音声ソースへの柔軟な対応が求められるユースケースに適しています。法務関係者は、クライアントとの相談や証言記録を第三者サービスを介さずに文字起こしできます。研究者および教育者は、インタビューや講義の録音を参加者の機密情報を守りながら文字起こしできます。開発者は、コード解説や内部デモ中に技術用語の認識精度を向上させるためにボキャブラリ・バイアシングを活用できます。
教育者は、同期タイムスタンプ付きの講義ノートや多言語翻訳を生成できます。ジャーナリストは、プレスカンファレンスやポッドキャストインタビューをリアルタイムで文字起こし・要約し、カスタムプロンプトで出力を精製できます。リモートワーカーは、システム全体での音声入力により、メールやドキュメント、メッセージの作成をハンズフリーで行え、マルチタスク時にも有効です。一括ファイル文字起こしは、既存の会議録や講義アーカイブを検索可能なテキストに変換するようなアーカイブ作業を支援します。
オフライン優先設計は、ネットワーク接続が不安定な地域、完全にネットワークから隔離された環境(エアギャップ環境)、または厳しいデータ所在要件を課す組織でも有用です。ハードウェアの柔軟性は、8GB RAMのIntel Macから大規模量子化モデルを実行するApple Silicon Macまで幅広く対応しており、機能を損なわず異種デバイス群への展開が可能です。
| 機能 | 無料版 | Pro版 |
|---|---|---|
| 最大録音時間 | セッションあたり15分 | セッションあたり4時間 |
| 利用可能なASRモデル | Qwen3-ASR 0.6Bのみ | 全モデル(Qwen3-ASR 0.6B/1.7B、MLX Whisper各種、標準Whisper) |
| AI要約生成 | 1日3回 | 無制限 |
| 文字起こし内容に対するAIチャット | 1日3回 | 無制限 |
| リアルタイム翻訳 | 非対応 | 対応 |
| 自動句読点挿入・補正 | 対応 | 対応 |
| カスタムプロンプト | 非対応 | 対応 |
| エクスポート形式 | MD、TXT | MD、TXT、SRT、VTT、DOCX、PDF |
| ファイル文字起こし | 対応 | 対応 |
| セッション履歴 | 無制限 | 無制限 |
| 許諾デバイス数 | 該当なし | 最大3台 |
| ライセンス範囲 | 個人・非商用利用に限定 | 個人・非商用利用に限定 |
ビジネス、チーム、または商用利用には、カスタム展開、優先サポート、専任オンボーディングを含むEnterpriseライセンスが必要です。