SpeakLocale は、Windows 向けのローカルファーストな音声入力および文字起こしアプリケーションです。互換性のある NVIDIA GPU を搭載したデバイス上で Whisper モデルを使用するか、ユーザーが提供する API キーを通じてクラウド文字起こしを利用することで、音声をテキストに変換します。本プラットフォームは、速度、正確性、データのプライバシーを重視するユーザー向けに設計されています。
このアプリケーションは100以上の言語での文字起こしに対応しており、DeepL(BYOK)を通じて33以上の言語へリアルタイム翻訳が可能です。任意のテキストフィールドに直接入力できるため既存のワークフローに統合でき、コーディング、メール、メモ、医療文書作成などのタスク用にカスタマイズ可能なモードを備えています。
SpeakLocale は、任意の Windows アプリケーションで音声入力を可能にします。ユーザーはホットキーを押して自然なスピードで話すだけでよく、ツールがリアルタイムで音声を文字起こしし、アクティブな入力フィールドにテキストを入力します。互換性のある NVIDIA GPU が利用可能な場合、インターネット接続なしで Whisper を使用してローカルで文字起こしが行われます。ローカル処理が利用できない、または望まない場合は、ユーザー自身で API キーを提供してクラウド文字起こし(例:Groq Whisper)を利用でき、実際の使用量に対してのみ、選択したプロバイダーに支払います。
文字起こし後、必要に応じて SpeakLocale はテキストを LLM に送信し、清書、句読点の挿入、言い淀みの除去、分野に特化したフォーマット調整を行います。音声入力モード(コード、メール、メモ、医療)により、タスクに応じた清書およびフォーマットルールが適用されます。また、録音済みコンテンツの後処理として、ファイルおよび動画の文字起こしもサポートしています。
ユーザーが自身の API キーを提供すれば、DeepL 経由で翻訳も利用可能です。これにより、ある言語で話しながら別の言語のテキストを任意のアプリケーションに直接出力できます。DeepL の無料枠(月最大50万文字)で、多くの日常的な翻訳ニーズに対応できます。
| プラン | 価格 | アップデート | ワード制限 | 処理方式 | 翻訳 |
|---|---|---|---|---|---|
| SpeakLocale Basic | 無料 | 継続的 | 週5,000ワード | ローカル(GPU)または BYOK クラウド | DeepL(BYOK) |
| SpeakLocale Pro | $89(一括払い) | 1年間 | 無制限 | ローカル(GPU)または BYOK クラウド | DeepL(BYOK) |
| SpeakLocale Pro Lifetime | $249(一括払い) | 生涯 | 無制限 | ローカル(GPU 必須)または BYOK クラウド | DeepL(BYOK) |
注:BYOK = Bring Your Own Keys(例:Whisper に Groq、整形に OpenAI などの LLM、翻訳に DeepL)。ローカル Whisper 処理には互換性のある NVIDIA GPU が必要です。BYOK を使用すれば、任意のコンピュータでクラウド文字起こしが可能。
月約50,000ワードを音声入力する専門職向け:
| サービス | 1年目 | 2年目以降 | 3年間合計 |
|---|---|---|---|
| SpeakLocale Pro(ローカル) | $89 | $0/年 | $89 |
| SpeakLocale Pro(BYOK Groq) | $89 + 約$3 | 約$3/年 | 約$98 |
| Wispr Flow Pro | $144/年 | $288 | $432 |
| Dragon Professional | $699 | $0 | $699 |
前提条件:提供されたデータに基づく。BYOK コストは Groq Whisper Turbo を使用し $0.04/時間で推定(月約50,000ワード ≈ 約$0.22/月の文字起こし費用)。