Connect to your OpenClaw instance with push-to-talk behavior
Claw To Talkは、自己ホスト型のOpenClawインスタンスと音声による対話を行うためのモバイルアプリケーションです。プッシュ・トゥ・トーク(押して話す)方式のインターフェースを用いて、ユーザーが音声コマンドを発行し、合成音声による応答を受信できるように設計されています。本アプリは、OpenClaw(ローカルまたはプライベートな音声テキスト変換システム)を運用または実験する開発者、研究者、および技術的なエンドユーザーを対象としています。
本アプリケーションは、簡潔さと相互運用性を重視しており、クラウド依存型の音声処理を回避し、ユーザーが設定したOpenClawバックエンドに音声合成を委ねます。iOSおよびAndroidの両プラットフォームをサポートしており、iOS版はApp Storeで公開済み、Android版はGoogle Play経由のパブリックベータで提供されています。
Claw To Talkは、ユーザーが自宅ネットワークまたはアクセス可能なサーバー上に展開した自己ホスト型OpenClawインスタンスに安全に接続するクライアントアプリケーションとして動作します。起動後、ユーザーはエンドポイントURLおよび必要に応じて認証情報を設定し、通信を確立します。対話はプッシュ・トゥ・トーク方式で行われ、ユーザーがマイクボタンを押し続けている間は音声を録音し、離すとOpenClawへ音声データを送信して処理を開始します。その後、ElevenLabsのAPIを経由して合成音声が生成され、デバイスで再生されます。
本アプリは音声認識(ASR)やテキスト・トゥ・スピーチ(TTS)をローカルで実行せず、代わりに音声入力をOpenClawへ転送してASR処理を行い、得られたテキストをElevenLabsへ送信して音声合成を行います。出力音声はストリーミング形式でデバイスへ返送されます。このアーキテクチャにより、ユーザーはデータフローを完全に制御しつつ、音声レンダリングのみ外部サービスに依存します。
Claw To Talkは、クラウドベースのアシスタントが不適切な環境(例:研究ラボ、オフライン環境、プライバシー要件の厳しい設定)において、ハンズフリーかつ直感的な音声インタラクションを実現します。スマートホーム機器、アクセシビリティ支援ツール、インタラクティブキオスクなどへの音声制御インターフェースのプロトタイピングを支援します。開発者は、OpenClawの設定検証やエンドツーエンド音声パイプラインの動作確認に本アプリを利用します。クロスプラットフォーム対応と最小限の設定要件により、評価、教育、および広範な音声対応アプリケーションへの統合に適しています。