TranscriptHQ は、ネイティブの字幕が利用できないか信頼性に欠ける場合に、オンライン動画や音声ファイルから単語レベルで正確な文字起こしと翻訳を抽出するための API およびノーコードツールです。主なプラットフォームまたは直接アップロードされたファイルからのスケーラブルな文字起こしと字幕生成が必要な開発者、コンテンツチーム、および組織向けに設計されています。
このサービスはソースリンクから直接音声を取得し、ノイズ除去と音声活動検出(VAD)を適用、言語を自動検出することで、オプションで単語ごとのタイムスタンプ付きの文字起こしを生成します。出力結果は一般的な字幕形式やテキスト形式でエクスポートでき、編集、公開、インデックス作成などの後続のワークフローに利用できます。
TranscriptHQ は個別の動画だけでなく、チャンネルやプレイリスト全体のバッチ処理もサポートしており、100以上の言語への翻訳機能も提供しています。ノーコードプレイグラウンドにより、コードを書くことなくインラインでキャプションを生成・表示できます。
TranscriptHQ はプラットフォームのURLまたはアップロードされた音声・動画ファイルからコンテンツを取り込みます。システムは音声を直接取得し、背景ノイズを除去して音量を正規化し、音声活動検出(VAD)を使って話されている区間を特定します。言語は自動検出され、それによって文字起こしとオプションの翻訳プロセスが調整されます。
文字起こしにはAIモデルが使用されます(Whisperベースの文字起こしも利用可能)。ユーザーは正確な単語レベルのタイムスタンプを有効にして同期を調整できます。また、サービスは文字起こしを指定した対象言語に翻訳し、字幕ワークフロー用にテキストを同期できます。
結果はAPI経由で返されるか、プレイグラウンドで閲覧可能です。エクスポート形式にはSRT、VTT、JSON、テキストが含まれます。処理中にユーザーが他のページに移動してもジョブは継続され、完了後いつでも結果にアクセスできます。精度は約95%とされており、言語によって変動します。レート制限および同時リクエスト数は選択したプランに依存します。
TranscriptHQ は、字幕が不足しているか抽出が困難なクロスプラットフォーム環境において、文字起こしを合理化します。コンテンツ制作、ローカライゼーション、アーカイブ用パイプラインに統合可能な、一貫性があり構造化された出力を実現します。
主な用途は以下の通りです:
価格概要(月額課金):
| プラン | 分数/月 | 価格 | レート制限 (リクエスト/分) | 同時リクエスト数 | 主な特徴 |
|---|---|---|---|---|---|
| Free | 60 | 無料 | 30 | 1 | API & プレイグラウンド |
| Starter | 500 | $9/月 | 100 | 2 | メールサポート |
| Pro | 2,000 | $29/月 | 300 | 2 | 単語レベルタイムスタンプ |
| Business | 10,000 | $99/月 | 500 | 5 | 全てのPro機能 |
備考:
対応プラットフォームおよび形式: