VeriCallは、通話中にリアルタイムで音声クローンおよび合成音声を検出するための安全なピアツーピア(P2P)音声通話アプリケーションです。iOS端末における既存の通信ツールが抱えるセキュリティ上の課題——特にディープフェイクによるなりすまし、クラウドベースのAI分析に伴うプライバシーリスク、および通話中のマイクアクセス制限——に対処するために設計されています。VeriCallは、金融サービス関係者、経営幹部、および音声コミュニケーションにおける本人確認を重視する個人を主な対象としています。具体的な利用例には、金融取引の認証、遠隔地に住む家族との本人確認、および高リスクなビジネス協議が含まれます。
従来のVoIPアプリケーションとは異なり、VeriCallは事前チェックやクラウドAI分析に依存せず、代わりに音声通話パスとAI分析パスを分離したハイブリッドアーキテクチャを採用しています。これにより、通話品質やユーザーのプライバシーを損なうことなく、リアルタイムでのディープフェイク検出と低遅延通話を同時に実現します。
VeriCallは、音声処理を2つの並列かつ独立したデータパスに分割して動作します。メインのRTPパスでは、48kHzの高品質音声をUDP/RTPを用いてピア間で直接送信し、最小限の遅延(<50ms)を実現して自然な会話タイミングを保ちます。同時に、MoQ/QUICを用いた第2のパスから、同一音声の低サンプリングレート版(16kHz)を端末内のAIエンジンへストリーミングします。AIエンジンはONNX RuntimeおよびCoreML最適化モデルを用いて推論を実行します。
AIエンジンは以下の4つの分析を並行して実施します:周波数領域における合成音声特徴の検出のためのスペクトル解析;不自然な韻律遷移の検出のための時系列一貫性評価;ユーザーが登録したローカル声紋との照合;および多様なディープフェイク音声サンプルで訓練されたニューラルネットワーク分類。すべてのAI処理は端末上でローカルに実行され、音声データは一切外部サーバーへ送信されません。通話開始時に即時のデバイス検証が暗号化証明書を用いて実行され、着信前に自動的な発信者確認が可能になります。
VeriCallは、音声クローンを用いたソーシャルエンジニアリング攻撃——例えば不正な資金振込要求、経営幹部や家族のなりすまし、および音声チャネルを介した大規模フィッシングキャンペーン——を防止します。P2P暗号化モデルにより機密性が確保され、メタデータの収集も防止されます。金融機関では顧客本人確認のためのセキュアな手段として導入可能であり、リモートチームでは機密情報を取り扱う会話における発言者確認に活用できます。また、高齢の親族からの緊急通話においても本人確認を迅速に行えるため、家族間の安心通信にも貢献します。すべての音声生体情報は端末内に保持され、AIモデルもローカルで実行されるため、GDPRおよびCCPAなどの厳格なプライバシー規制への準拠が可能であり、クラウドインフラを必要としません。