由于AI时代的数据资源属性,大量的用户数据是企业机构广告投放优化的关键,因而数据开放则意味着巨大的商业价值,巨头们在生态布局下,通过全链式数据通路可获得精准、完整的用户画像,而巨头们在数据的商业化上也更加容易。

对于AI技术的提供者而言,数据价值导向下使得数据搜集是非常必要的,在初期,人们会因为数据被第三方使用而感到不安,从而主张自身的隐私权,实际上,如果数据本身的应用并没有给用户造成困扰,并且为其带来便利的服务,那么此时会有部分用户乐于接受分享数据,因而对于数据价值的商业化应用上,AI技术的提供者应该持有更谨慎的态度。

在笔者看来,AI数据时代中,数据的商业化价值和用户的隐私权利之间需要达到一种动态均衡,即在法律范围的临界点内,数据搜集方与用户之间需要有一种连接机制,以确保在数据产生者的掌控下,有限度的使用数据的商业价值发掘,在隐私保护与AI技术的便利之间达成妥协。而对于当前隐私法、物权法等相关法律并没有对数据归属权益等明确立法的现状下,有限度的使用数据仍然需要依靠企业的意识自觉。

数据算法偏差下的“AI歧视”

在大数据时代,数据有着极底的储存成本,这也意味着在数据驱动的AI时代,一旦有数据生成便很难彻底消除,在数据储存成本的规模递减效应下,彻底删除数据的成本反而更高,因而,数据存在的时间更长,甚至超过创造数据者本身的寿命。而随着储存成本的进一步降低,在不久的将来个人数据可能会实现无限期的储存。

大数据的意义在于不必深究事物“规律性”的同时对于数据分析结论的直接应用,因而大数据常常被用于结果预测,而事实上,基于数据的预测结果也具有时效性,而时效性失效的结果则是基于数据分析的AI交互失真。

也就是说,如果采集的数据本身就具有某种倾向性,则由此训练而来的AI也自然带有这样的倾向性。一项来自于美国的调查研究证明了这一点,在一项基于数据分析的族群预测算法中,算法在预测族群时,通常会把那些身处有歧视历史地区的人预测为黑人,而事实上,并非如此。

又如在一则STEM(科学、技术、工程、数学)领域招聘广告投放中,广告商发现,则这广告很少投放给女性,而事实上广告商则希望这则广告是性别中立的。而在“双曲贴现”效应下数据的时效性问题导致数据“失准”,进一步引发“算法歧视”的问题。

双曲贴现又称为非理性折现,是行为经济学的一个概念,这个现象描述折现率并不是一个不变量,具体是指人们在对未来的收益评估其价值时,倾向于对较近的时期采用更低的折现率,对较远的时期采用更高的折现率。

比如,大多数人可能倾向于选择今天收益60元,而不是一年后拿到100元,因为今天这60元收入可能更有价值,而如果让人们选择一年后拿到60元或者两年后拿到100元,则大多数人会选择两年后拿到100元。即人们会因为收益时间上的差异从而做出不同的决策。

因而,在双曲贴现的情况下,人们短期决策行为所产生的数据将会导致数据本身失准,从而更加容易导致在数据偏差引发的算法偏差后,在应用层面的“算法歧视”。因此,对于数据型AI的使用者而言,在算法的应用层面上也需多一份谨慎和细心。

结尾:

无论是数据AI时代的个人隐私问题还是数据偏差下的“算法歧视”,都是大数据AI发展之路上不可避免的问题,对于人们来说,不论是数据采集端的隐私侵犯,还是AI应用层面的“算法歧视”都是有悖道德甚至法律的边缘试探。而对于如今尚处“幼年”中的AI技术而言,如何正确的引导、影响其发展,在符合人类价道德观念以及道德标准之下创造更大的价值,则是“AI造物主”们值得深思的问题。

科技自媒体刘志刚,订阅号:互联网江湖,微信号:13124791216,转载保留作者版权信息,违者必究。

 3/3   首页 上一页 1 2 3 下一页

文章TAG:算法  隐私  数据  
下一篇