Lemonは、音声による指示を即座に実行可能なデジタルタスクへと変換する音声駆動型AIエージェントです。ユーザーが現在使用中のアプリケーションやブラウザタブを離れることなく、システム全体で動作するように設計されています。主な対象ユーザーは、研究者、ライター、エンジニア、マネージャーなど、業務中に複数のツール、ドキュメント、コミュニケーションチャネル、情報源を同時に扱う必要がある知識労働者です。
従来の音声アシスタントや単体の生産性アプリとは異なり、Lemonはユーザーの現在の作業環境に直接統合されます。自然な日本語または英語の音声コマンドを認識し、メール返信の作成、文書の生成、ローカルおよびオンラインの知識ベース検索、テキストの編集といった操作を自動化します。その設計は、認知的負荷の低減とタスク切り替えに伴う中断の最小化に重点を置いています。
Lemonはバックグラウンドで実行される軽量のデスクトップクライアントとして動作します。fnキーで起動すると、音声入力をキャプチャし、ローカルまたは安全なクラウド上で音声認識を行い、大規模言語モデルを用いて意図を解釈した後、アクティブなアプリケーションのコンテキスト内で操作を実行します。macOSのアクセシビリティAPIを利用して、メールクライアント、ドキュメントエディタ、ウェブインターフェースなどとの連携を実現しており、追加のAPI連携や特別な権限設定は不要です。
ワークフローは直線的かつ決定論的です:音声入力 → 文字起こし → 意図の意味解析 → アクション選択 → 実行 → 出力確認。処理中には視覚的なフィードバックが表示され、すべての生成物は最終送信前に編集可能です。Lemonはデフォルトで音声録音を保存せず、プライバシーポリシーにおいてデータ取扱いについて明確に記載しています。
Lemonは、知識労働者が日常的に頻繁に行う実用的なタスクを支援します。例えば、スプレッドシートを閲覧しながらメール返信を音声で指示したり、通話中の音声メモからミーティング要約を自動生成したり、技術文書の編集を音声で指示して即座に反映させたりできます。また、企業内のWikiやSlack履歴を自然言語で検索・要約することも可能です。音声によるタスクの開始、実行、修正を1つのインタラクションで完結させることにより、反復的な手動入力を削減し、集中した中断のない作業セッションの維持を支援します。