北科瑞声语音识别引擎5.0上线进一步提升语音智能感知能力

最新信息

2023-07-14 01:03:00

2023年是人工智能技术爆发式增长的一年，大模型促使各行业深刻变革。去年6月，北科瑞声发布了语音识别引擎4.0，近日，北科瑞声的语音识别引擎从4.0升级到了5.0，语音智能感知能力再一次提升。
　　“我们使用了更多不同场景的语音数据，采用多种策略优化训练过程，采用了最新的Paraformer框架，也引入了大型语言模型（LLM），在与行业融合的应用中进一步提升模型效果及场景适配能力，使得新语音识别引擎的准确性获得极大提升。”该公司相关负责人介绍。
　　据了解，不同的语音采集设备、信道干扰和复杂背景噪声，是语音转写的极大挑战。新一代的识别引擎融合多种算法优化对底层声学特性的建模，同时大模型增加对高层语义和场景的感知，使得复杂环境下语音转写错误显著减少。
　　“中英文随意说，秒级新词学习”是对该引擎最好的概括。据北科瑞声相关负责人介绍，该引擎可以实现中文混合语音识别，无论母语发音还是非母语发音都可处理。最新快速热词导入算法，将语音识别引擎4.0所需几分钟学会成千上万的专业词汇，提升到10秒级别，可以做到每个用户都有自己的专用词库。
　　此外，为了更加安全可靠的智能语音应用，该引擎实现了现有智能语音大模型本地化断网部署，能够实时语音转写、角色分离、智能分段。
　　据悉，行业语音大模型将是智能语音的新前沿，在通用的LLM基础上，结合行业数据和用户数据，将来可实现行业的VoiceGPT。北科瑞声正在研发自己的VoiceGPT，将应用在北科瑞声智能语音云平台和各项产品上，赋能千行百业。
（文章来源：深圳商报）

免责申明： 本站部分内容转载自国内知名媒体，如有侵权请联系客服删除。

北科瑞声语音识别引擎5.0上线 进一步提升语音智能感知能力

最新信息

北科瑞声语音识别引擎5.0上线 进一步提升语音智能感知能力

北科瑞声语音识别引擎5.0上线进一步提升语音智能感知能力

北科瑞声语音识别引擎5.0上线进一步提升语音智能感知能力