北科瑞声语音识别引擎5.0上线 进一步提升语音智能感知能力

最新信息

北科瑞声语音识别引擎5.0上线 进一步提升语音智能感知能力
2023-07-14 01:03:00
2023年是人工智能技术爆发式增长的一年,大模型促使各行业深刻变革。去年6月,北科瑞声发布了语音识别引擎4.0,近日,北科瑞声的语音识别引擎从4.0升级到了5.0,语音智能感知能力再一次提升。
  “我们使用了更多不同场景的语音数据,采用多种策略优化训练过程,采用了最新的Paraformer框架,也引入了大型语言模型(LLM),在与行业融合的应用中进一步提升模型效果及场景适配能力,使得新语音识别引擎的准确性获得极大提升。”该公司相关负责人介绍。
  据了解,不同的语音采集设备、信道干扰和复杂背景噪声,是语音转写的极大挑战。新一代的识别引擎融合多种算法优化对底层声学特性的建模,同时大模型增加对高层语义和场景的感知,使得复杂环境下语音转写错误显著减少。
  “中英文随意说,秒级新词学习”是对该引擎最好的概括。据北科瑞声相关负责人介绍,该引擎可以实现中文混合语音识别,无论母语发音还是非母语发音都可处理。最新快速热词导入算法,将语音识别引擎4.0所需几分钟学会成千上万的专业词汇,提升到10秒级别,可以做到每个用户都有自己的专用词库。
  此外,为了更加安全可靠的智能语音应用,该引擎实现了现有智能语音大模型本地化断网部署,能够实时语音转写、角色分离、智能分段。
  据悉,行业语音大模型将是智能语音的新前沿,在通用的LLM基础上,结合行业数据和用户数据,将来可实现行业的VoiceGPT。北科瑞声正在研发自己的VoiceGPT,将应用在北科瑞声智能语音云平台和各项产品上,赋能千行百业。
(文章来源:深圳商报)
免责申明: 本站部分内容转载自国内知名媒体,如有侵权请联系客服删除。

北科瑞声语音识别引擎5.0上线 进一步提升语音智能感知能力

sitemap.xml sitemap2.xml sitemap3.xml sitemap4.xml