
Mac用Whisper Snapperは、macOS上でローカルに、またはユーザーが管理するクラウドAPIを通じて音声および動画を文字起こしするための音声認識アプリケーションです。長時間のインタビュー、会議、ポッドキャスト、ボイスメモなどに対応しており、オプションで話者ラベルやタイムスタンプを付加できるため、文字起こしデータを簡単にナビゲートして参照できます。
このアプリはプライバシーと柔軟性を重視しています。ユーザーは完全にオフライン処理可能なローカルモデル(Parakeet、WhisperKit)をダウンロードできるほか、自身のクラウドAPIキー(OpenAI Whisper、GPT-4o Transcribe、Deepgram Nova-2)を接続することで、自身のワークフローに最適化されたパフォーマンスを得られます。文字起こしデータはアプリ内で編集でき、ドキュメント作成、キャプション生成、共同作業のために一般的な形式でエクスポート可能です。
音声または動画ファイルをアプリにドラッグ&ドロップするか、内蔵のボイスレコーダーで直接録音します。アプリは一般的なメディア形式に対応しており、タイムスタンプ付きで文字起こしの準備を行います。
ローカルエンジンとクラウドエンジンから選択します。ローカルモードでは、ダウンロード済みのモデル(Parakeet、WhisperKit)を使用して、すべての処理を端末上で完結させます。クラウドモードでは、ご自身のAPIキーを使ってOpenAI Whisper、GPT-4o Transcribe、Deepgram Nova-2などのサービスに接続します。処理後、文字起こし結果がタイムスタンプとオプションの話者ラベル付きで表示されます。再生確認、検索、テキストのインライン編集が可能で、その後お好みの形式でエクスポートできます。
| エンジン | モード | 機能 |
|---|---|---|
| OpenAI Whisper(Tiny、Base、Small、Large v3、Large v3 Turbo、Distil Large v3) | ローカルおよびクラウド | 多言語対応音声認識 |
| Parakeet v2(英語)、Parakeet v3(多言語) | ローカル | 音声認識。v3はディアライゼーション対応 |
| Deepgram Nova-2 | クラウド | 音声認識およびディアライゼーション |
| GPT-4o Transcribe | クラウド | ディアライゼーション対応 |
| レベル | 価格 | 備考 |
|---|---|---|
| 無料版 | $0 | アカウント不要 |
| Pro | 9.99米ドル(一括払い) | 生涯ライセンス |
Whisper Snapperは、機密性の高い資料に対してプライベートかつオフラインでの文字起こしをサポートすると同時に、速度や特定のディアライゼーション機能を優先したい場合にクラウドオプションも提供します。タイムスタンプと話者ラベルにより、長時間の録音内容を容易にナビゲートでき、複数の出力形式に対応しているため、執筆、編集、動画制作の各ワークフローへの統合がスムーズです。
主な用途例: