文 | 杨苏颖
来源 | 智能相对论(ID:aixdlun)
在1997年版的电影《洛丽塔》里,洛丽塔趴在花园的草坪上读书,天真的脸庞笼罩在朦胧的水雾下。在她的眼波流转之中,电影流露出情色的味道。情色作品的含蓄和丰富常常使其可以借“性”的描述来传达对社会精神状态的思考。但是情色和色情从来不是一回事,而二者模糊的边界却不断让色情内容的传播有了可乘之机。
鉴黄师是在互联网色情内容暴增的条件下滋生的一个职业。然而长期面对大量色情内容的刺激使这类工作者往往要承受心理、生理的双重压力。那么,在人工智能迅速崛起的时代,AI的加入会不会成为鉴黄师们的“减压阀”呢?
AI来了,“东京热”们还会好吗?
互联网鉴黄主要分为三个阶段,第一阶段叫人肉阶段,主要通过人工识别的方式来发现黄色内容;第二阶段叫算法过滤阶段,以肤色识别算法过滤黄色图片开始成为主流;第三阶段叫深度学习阶段,因为纯肤色式地图片过滤已经难以担当鉴黄的重任,所以机器学习成为了新的主角。针对第三个阶段,智能相对论分析师(aixdlun)杨苏颖梳理了三种不同的智能鉴黄工种,分别囊括了音频、图像和视频三种形式。
首先是鉴定图片和视频的鉴定。鉴别黄色图片的过程主要有两步,第一步是用黄图的特点来定义一个机器可以识别的数学模型。第二步则是用大量满足定义的图片来进行样本数据的收集并将其用于机器训练。在岛国搜寻大量动作片的种子进行海量灌输之后,我们可以得到一个越来越精准的模型,从而让人工智能准确识别出某张图片是否为黄图。这是AI鉴别静态图片的一个简单流程。
那么AI对于动态图像又是怎么进行处理的呢?其实AI要对在线视频和直播这类的动态图像开展鉴黄工作,其原理与鉴别静态图片并没有太大的差别。只要在鉴别视频和直播的时候,人为地多加一个步骤把动态内容解码变成图片帧,剩下的工作就和静态图片处理大同小异了。
另外,如今伪ASMR的涌现要求AI在色情音频上的处理能力也必须跟上。在各种直播房间内,主播们更是可以直接以语言交流的方式与粉丝进行互动。所以,国内的一家名叫极限元的公司采用了一种叫CTC+LSTM组合的深度学习技术来识别色情音频内容。它可以分析语音的信息内容,从而判断出语音当中是否含有色情信息。
在鉴黄领域,AI的三管齐下显示了其要肃清黄色内容的决心,而且它也确确实实地减轻了人工鉴黄的压力。但是在现实当中上有政策,下有对策的戏码总是会不断上演,因此鉴黄的力度越大,色情的边界也就拓展地越快,自然AI鉴黄的难度也会越大。而这好像成为一个绕不开的死循环。
文章TAG:人性 直播 处理