紧接着,搜狗马不停蹄的在今年8月初发布了语音交互引擎“知音”,继续展示其在智能语音技术方面取得的重大突破,不仅在语音识别率方面达到业界领先的97%,而且还能进行快速纠错,更解决了此前一直困扰业界的复杂多轮交互的问题。简单的说,就是不仅要实现“能听会说”,还要求具有“能理解会思考”的能力,这使得智能语音的应用场景被大大延伸。而搜狗还宣布,已经将智能语音技术应用到了包括搜狗搜索、搜狗输入法、搜狗地图等全线产品当中。至此,搜狗的语音技术完成再次进化,在智能语音方面的能力已经到达了国内领先的水平。

而在11月乌镇举行的第三届世界互联网大会上,王小川在分论坛演讲现场更是发布了搜狗人工智能新产品——机器同传,展示了实时机器翻译技术,将演讲嘉宾的中文讲话实时语音识别并同步翻译为英文上屏显示,引起轰动。这也是全球首次基于神经网络的实时机器翻译技术在大型活动上的展示,效果可靠、准确率已接近人类同传翻译结果。

基于大数据和深度学习,搜狗语音实时翻译涵盖了搜狗自主研发的语音识别、机器翻译两项重要技术,代表着这两大技术在实时性和实用性上迈出了较大的一步,并且高效的结合了起来。

未来,智能语音技术该如何演进?

另一方面,前面提到,目前搜狗在语音识别率方面已经达到97%,并能够进行快速纠错和处理复杂的多轮交互对话,而且已经应用到搜狗的全线产品当中。那么,接下来,智能语音技术还会向那些方面演进呢?我认为主要有以下三个突破点:

首先,需要继续提升智能语音的识别率,突破最后的3%。实际上,目前搜狗使用新开发的语音修改功能,通过自然语言交互的形式修改所输入的文字,比“将弓长张改为立早章”等,已经在一定程度上解决了语音识别准确率最后3%的差距,达到了解放用户双手和提高用户输入效率的目的。而搜狗之所以能够在智能语音技术方面率先取得突破,一方面与其多年来的深耕积累密不可分,另一方面也与其搜索引擎公司基因密不可分。按照王小川的话说,搜狗本身就是一家人工智能公司,作为搜索引擎公司之所以能够向用户提供精准的搜索结果,其技术原理就是不断的进行数据积累和机器学习,从而使得其能够准确理解用户输入文字背后的真实意图,从而给出最为精准的答案,而智能语音的原理与此类似,因此与搜狗输入法一样,搜狗有先天优势能让其在智能语音技术方面能够率先获得突破,达到领先行业的高识别率。

其次,复杂多轮交互能力的提升依然是智能语音技术的突破点。

 2/3   首页 上一页 1 2 3 下一页 尾页

文章TAG:人工智能  语音识别  
下一篇