1.数据关,成风尽垩之技无的放矢。要明确动物语言所表达的具体意义,需要先对动物的叫声和即时脑电波动进行完整的采样比对,再在这些数据的基础上建立数据库。而这两种数据都存在着广泛性和多样性,以犬类为例,不同的犬种声带粗细宽窄各不相同,针对同一情景发出的叫声分贝高低和尖细情况也不同,而刺激犬类发出叫声的场景又是难以穷尽的,单单收集犬类的声音样本就是一个无比巨大的工程了,数据库自然也难以完善。

2.技术关,空手搏斗难制胜。一个AI翻译产品做到翻译精确至少需要攻破几个难题:形式端,拍译要攻克图像识别,同声翻译要攻克语音识别:内容端,攻克文本语言分析、大数据。而AI还没有发展到能够极为精确地处理这些问题的阶段,机器缺乏对视觉场景、听觉场景、自然语言处理的常识判断。

如搜狗搜索在2017年6月的分享会上发布了创新产品搜狗翻译APP,应用了基于生物学习的神经网络机器翻译(NMT)系统,将翻译精确度提升到一个前所未有的高水准,然而在翻译效果的“信达雅”上,仍然只做到了“信”的层面,对语言背后的幽默、情感等丰富含义的解读离人们所期待的水准还有些距离。

3.语义关,语料积累、场景收集和副语言与文化背景成痛痒之地。AI翻译在文本或语言的寓意分析方面还强差人意。与人类语言相比,动物语言都是即时信号,信息内容全部关于当下,或示威,或示警,或示爱……从中看不到用语言来激起对过去的联想的迹象,并且单个个体能发出的声音形式太单一了,蕴含在其中的丰富信息难以明确表达。

宠物翻译的难点不仅在于声音的收集,更在于声音背后具体含义的对应。这种对应是宽范围的,难以精确的,机器缺乏对视觉场景、听觉场景、自然语言处理的常识判断,无法精确理解语音所表达的内涵,甚至在这个方面还比不上人类对动物语言的理解,人可以根据生活经验来理解动物语言,比如看到狗狗冲着陌生人吠叫,人们可以推测它是在防备这个陌生人,而机器可能就没办法很好地理解这个画面,从而做出错误的判断。

又比如,“好”这个字是日常交际的常用字,在百度汉语显示有19种语义,这些语义是结合具体场景来体现的,当偶遇熟人时,“好”的意思是问好;当别人征求意见时,“好”用来表示同意;当人们商讨时,又可以用“好”来表示反问……可见场景对于语义具有至关重要的影响,机器的正确理解场景的这件事上还需要加油,从而提高语义翻译上的高精确性。

4.“历史包袱”难抖掉,AI难以跟上生命体的学习进程。狗的叫声在一定历史时期并不是一成不变的,狗凭借自身的灵性以及主人的后天驯养,具备有学习能力,例如狗类中智商排名第一的边境牧羊犬智力水平已经相当于6—8岁的小孩,经过学习,在放牧时它会用不同的叫声来驱使羊群,控制羊群走向。还有一些宠物狗,甚至会在人类的刻意训练下发出类似“妈妈”的叫声,宠物语言在日新月异的变化,计算机却很难抖掉语言的“历史包袱”,这些也造成了AI宠物翻译的困境。

动物语言和人语之间的代沟是客观存在的,AI所能做的,只能是不断改进自身的功能,用科学手段完善数据库、内容、语料和场景,形式和内容双管齐下,才能将这条横亘在动物语言和人语之间的代沟填平,在坚实的地基上建立起实现人和动物“有效沟通”的“巴别塔”。

智能相对论(微信id:aixdlun):深挖人工智能这口井,评出咸淡,讲出黑白,道出深浅。重点关注领域:AI+医疗、机器人、智能驾驶、AI+硬件、物联网、AI+金融、AI+安全、AR/VR、开发者以及背后的芯片、算法、人机交互等。

 2/2   首页 上一页 1 2 下一页

文章TAG:应用  内容  算法  
下一篇