Svaraは、LinkedIn、WhatsApp、Telegram、Messenger、Instagram、Slack、Discord、Viber、WeChatを含む9つのメッセージングプラットフォームにネイティブな音声ノートを送信するためのREST APIサービスです。従来のファイル添付や共有リンクではなく、Svaraはプラットフォーム固有の波形表示や再生動作を持つ、本物のネイティブメッセージとして音声ノートを配信します。ソフトウェア開発チーム、個人開発者、およびプロダクトビルダーを対象としており、各プラットフォーム固有のSDKや通信プロトコルを自社で管理することなく、信頼性の高い音声メッセージ機能を容易に統合できます。
このサービスは、音声フォーマット変換、認証フロー、セッション管理、配信ルーティングといった複雑な処理を抽象化します。ユーザーは、音声URL、受信者識別子、対象プラットフォームを含む単一のHTTP POSTリクエストを送信するだけで済みます。Svaraは、受信した音声を適切なフォーマットに変換(MP3、M4A、WAVなどに対応)、各プラットフォームのプロトコルに準拠した配信を行い、配信状況を確認可能なレスポンスを返します。非技術者によるソロ開発者によってAIを活用して構築された本サービスは、簡潔さと開発者体験を重視しています。
POST /api/v1/send)で9つの対応プラットフォームへの音声ノート配信が可能delivered_at)などの詳細なレスポンスメタデータを提供voice_idパラメータによる音声のカスタマイズ(例:"sarah-warm")をオプションでサポート統合はSvaraダッシュボードからAPIキーを取得することから始まります。開発者は音声ファイルを自社インフラまたは互換性のあるCDNにアップロードし、その公開可能なaudio_urlをリクエストで指定します。https://svarapi.io/api/v1/sendへの単一のHTTP POSTリクエストには、対象プラットフォーム(例:"linkedin")、受信者識別子(例:LinkedInのURNまたはWhatsAppの電話番号)、音声URLを含めます。オプションでvoice_idを指定可能です。
リクエスト受信後、Svaraは妥当性を検証し、音声ファイルをダウンロード・変換して対象プラットフォームに必要なコーデックに変換します。その後、ダッシュボードで事前に設定されたセッション資格情報を用いてプラットフォームの公式APIに認証し、音声ノートを送信します。同期レスポンスで受信を確認し、配信完了状況は非同期ウェブフックで通知されます。
WhatsAppやLinkedInなどセッション維持が必要なプラットフォームでは、サーバー側で永続的なセッションが管理されます。OAuthやアプリケーショントークンを必要とするプラットフォーム(例:Instagram Graph API、WeChat公式アカウント)については、ダッシュボードで一度設定した資格情報がすべてのリクエストで再利用されます。
Svaraは、非同期かつ人間らしい音声コミュニケーションを大規模に実現するアプリケーションに特に適しています。具体的なユースケースには、カスタマーサポートの自動化(チケット解決後のパーソナライズ音声更新の送信)、営業活動(LinkedInでの音声フォローアップ)、社内チーム通知(SlackやDiscordでの音声アラート)、教育プラットフォームにおける口頭フィードバックの配信などが挙げられます。
1音声ノート単位の課金モデルにより、固定コストが発生せず、需要の変動に柔軟に対応できます。アカウント単位の課金がないため、数千人のユーザーにサービスを提供するマルチテナントアプリケーション(例:CRMツール)でもコストを予測しやすくなります。カスタム統合(各プラットフォームごとに2〜4週間の工数)や汎用メッセージングAPI(ネイティブ音声機能が不足している場合が多い)と比較して、Svaraでは初回プラットフォーム導入が5分以内、全9プラットフォームへの拡張も直線的に実現可能です。
| 機能 | Svara | Unipile | 自社開発 |
|---|---|---|---|
| ネイティブ音声ノート対応 | あり | あり | 制限あり、またはカスタムエンジニアリングが必要 |
| 料金モデル | 1音声ノートあたり | 接続済みアカウント単位 | エンジニアリング時間およびインフラコスト |
| 典型的な導入時間 | 5分未満 | 1〜2日 | 2〜4週間 |
| 音声フォーマット変換 | 自動 | 自動 | 手動実装が必要 |
| 対応プラットフォーム(音声) | 9 | 変動的(音声最適化されていない) | プラットフォーム依存の工数 |
| 専門領域 | 音声専用配信 | テキストおよびメディアを含む全般メッセージング | 一般目的 |
料金プランは、Starter(月額0ドル、500音声ノート)、Growth(月額0ドル、2,000音声ノート)、Scale(月額0ドル、10,000音声ノート)、Enterprise(カスタムボリュームおよびSLA)の4種類です。すべてのプランで音声フォーマット変換、配信ウェブフック、全プラットフォームへのアクセスが含まれます。一時的な需要増加に対応するため、プランに応じた単発購入クレジットパックも利用可能です。クレジットは請求期間終了時に失効し、次期期間へ繰り越しはありません。