语音识别处理速度(二):实时语音识别
本文介绍了实时语音识别中的速度指标:尾包延迟。DolphinVoice通过极致的尾包延迟优化,为实时语音识别场景提供最佳的使用体验。

在上一篇文章 中,我们介绍了录音文件转写的速度评价指标——实时率(RTF),在录音时长一开始就确定的场景下,可以使用实时率作为语音识别速度的评价指标。
除了录音文件转写,还有一类常见的语音识别场景是实时语音识别,例如实时语音笔记、实时会议字幕等场景。在实时语音识别场景中,语音信号的输入和识别结果的输出都是持续进行的,用户对于这类场景的实时性要求比较高,因此语音识别结果输出的滞后性往往直接影响用户体验。
为此,针对实时语音识别的性能评估,需引入延迟方面的指标,以及为改善用户体验的感知优化。
尾包延迟(Tail Packet Latency)
尾包延迟是衡量从音频输入结束到转写结果输出总耗时的核心指标。在实时语音识别中,客户端流式发送音频数据包,服务端流式返回语音识别结果。尾包延迟的计算方式为:从发送一段音频的最后一个数据包后开始计时,到收到这个数据包对应的语音识别结果停止计时。尾包延迟反映了实时语音识别场景下的用户直观感受延迟。
尾包延迟示意图
在实时交互场景中,尾包延迟需控制在用户可接受范围内,过长的延迟会导致语音与转写内容不同步,破坏交互连贯性。使用DolphinVoice的实时语音识别服务,尾包延迟最低可达150ms以内。
中间结果和最终结果
在DolphinVoice语音识别中,对于流式接口(一句话识别 WebSocket 接口、实时语音识别),识别结果随着语音的输入实时返回。如“今天天气不错”这句话,在识别过程中可能会产生以下识别结果:
金
今天
今天天气
今天天气不错其中,前三条称为“中间结果”,最后一条称为“最终结果”。通过设置一句话识别或实时语音识别流式接口的 enable_intermediate_result 参数,可以控制是否返回中间结果。如关闭中间结果,将只返回最终结果,从用户角度上将表现为一次性收到一句话的全部识别结果。开启中间结果,有助于降低用户的等待感,提高用户体验。
总结
在实时语音识别场景中,处理速度与延迟控制是决定用户体验的核心要素。通过优化尾包延迟,能够显著提升交互的流畅性与同步性。同时,中间结果的实时反馈机制为用户提供了更自然的使用体验,尤其在需要即时响应的应用场景中(如实时会议记录、语音助手等),这种渐进式输出方式能有效降低用户等待感知。DolphinVoice通过流式接口设计,兼顾了实时性与准确性,为开发者和终端用户提供了高效、可靠的语音识别解决方案。
株式会社DolphinAI已通过SOC 2 Type 1认证和ISMS(ISO/IEC 27001)认证,可在安全环境中提供高精度语音识别服务,平均每日实际场景使用约7,000小时。在呼叫中心行业,DolphinVoice的服务已被Cloopen株式会社的SimpleConnect平台正式集成商用;与株式会社三通电信服务(株式会社三通テレコムサービス)合作开发推出AI通话纪要服务 。
如需咨询语音识别系统的接入或相关问题,请随时联系我们。
立即开始
- 登录DolphinVoice - 开始免费试用
- 查看API文档 - 技术规格与实施指南
- 访问官网 - 服务详情与集成案例
作者简介
朝仓 匡广 / Andy Yan
- 株式会社DolphinAI 首席执行官
- 株式会社Advanced Media(任职8年) 前海外事业部部长
- 语音AI实施经验:12年
- 业绩:30多家企业的语音AI集成支持
- 领域:语音识别、语音合成、呼叫中心AI、AI会议记录、语音对话设备
- 市场:日本、中国大陆、台湾、香港
- 撰文:100篇以上
公开报告
- “AI新势力·产品开放日” by Tokyo Generative AI Development Community(2025年10月25日)
- “TOPAI国际AI前沿·生态系统邀请限定活动” by TOPAI & Inspireland Incubator(2025年7月29日)
- "Global AI Conference & Hackathon" by WaytoAGI(2025年6月7日)
联系方式
Email: mh.asakura@dolphin-ai.jp
LinkedIn: https://www.linkedin.com/in/14a9b882/
关于株式会社DolphinAI
专注于日语等语言的语音识别、语音合成、语音对话技术开发与服务的AI企业。
提供服务:DolphinVoice(语音交互SaaS平台)
主要功能:语音识别(日语、汉语、英语、中英混说、日英混说)、语音合成(日语、汉语、英语)
实际应用:在呼叫中心和AI会议记录行业中,平均每日累计商用时长约7,000小时
■ 安全体系
- 通过 ISMS(ISO/IEC 27001) 认证
- 取得 SOC 2 Type 1 报告
- 了解更多 ️
■ 咨询联系
️ (+81) 03-6161-7298


