2007年,乔布斯推出第一代全触控iPhone以来,苹果便在黑压压一片键盘按键手机中寻找到了一条全新的人机交互道路。早期的苹果iPhone产品改变了用户对触屏手机的理解,重新定义了触屏手机体验,从此触控手机正式登上历史的舞台。
8年后的今天,智能手机依旧被第一代iPhone所革新的触控操作所深深影响。放诸全球,任何一款智能手机都逃不过直板+触控屏的造型。然而“触控”也将智能手机外型以及人机交互体验带入同质化的怪圈。
物极必反,乔布斯在世当初就已经认识到了“触控”这种人机交互方式的局限性。2010年,iPhone 4搭载Siri横空出世,乔布斯希望以此开启人工语音智能的人机交互革命。然而,当时的Siri只能做到取悦用户,发布仅仅数月后,绝大部分用户对Siri功能失去新鲜感。与iPhone4的革命性意义相比,被寄予厚望的Siri显得如此不堪。此后,智能手机搭载的人工语音智能停滞不前,无论在实用性还是功能性方面都难有突破,彻底沦为炫机的鸡肋功能。
2015年的今天,人工语音智能这种人机交互方式是否还具有现实意义,人工语音智能将引领人机交互及通信行业走向何方?这成为了手机行业正在思考的难题。
人工语音智能困局
目前,大多数人工语音智能对于自然语言识别率已经达到了一个较高的水准,对于常用的手机语音操控短句识别率较高并且拥有极高的响应速度。但是,识别并不等同于理解,对于一些复杂句式的长句,在人看来很正常很容易理解,机器可能就无法理解。重复几次失败后,人们自然会对这种理解能力的东西意兴阑珊了。
除此之外,手机使用的场所十分多变,有可能时常处于声音极其嘈杂的环境下,这就要求较高的智能设备降噪能力。目前大多方案还停留在实验阶段,导致技术层面存在突破瓶颈。另外,现行的语音操作过程甚至还强迫用户手动辅助完成,但语音交互的根本目的在于解放人的双手,人机的语音交流应该是具备相较于“触摸”更远的交互距离。这造成了人工语音智能应用致命性的缺陷。
而罗永浩在锤子Rom发布会则用“使用者的心理障碍”概括了人工语音智能的窘境。“你在前后都挤满人的公共汽车上,掏出手机说——请给老王发一条短信,边上人都用傻叉一样的眼神看着你的时候,你就会明白,语音识别软件公司首先要解决的是心理学问题而不是语音识别技术问题。”
切合语音应用场景
综合以上原因来看,以往人工语音智能都在不恰当的应用场景进行探索,自然会出现不实用的困局。而语音识别应用的场景这是由声音的公开性以及人的保密心理天然限制的。目前,国内语音产品开发厂商以及手机厂商显然都还未意识到这些问题。
文章TAG:模式 交互 颠覆