以第二代半监督图深度学习算法LasGNN为例,通过异构图卷积,LasGNN同时刻画了标注信息和图结构信息。标注信息给LasGNN提供了点击、成交等核心抓手指标;图结构信息为LasGNN提供了大量同一数据生态的一致性知识,帮助LasGNN更好地认知用户意图和商品/广告物料之间的关系。林伟特别提到两点:1)通过图卷积, LasGNN能够将用户的搜索序列变成搜索子图,更立体全面地捕捉用户意图;2)图卷积的传播机制有很强的推理泛化能力,可以使LasGNN对新广告更友好。
同时,阿里妈妈搭建了工业级的图训练引擎,支持十亿节点、百亿边图规模的存储、训练,实现了多种图游走、图卷积算法,高效全面地支撑图深度学习更精确、立体、深入地理解用户意图和商品/广告物料。
从效果广告到品牌广告,技术赋能“合约保量”的创新
品牌广告与效果广告有很大的不同,阿里妈妈高级算法专家祝文祥(花名横云)认为,与电商类效果广告所强调的实时竞价不同,品牌广告更强调“合约保量”,广告主提前购买未来一段时间内的流量,在合同中明确广告展示的时间、数量和价格,平台保量完成。
而阿里妈妈品牌广告,通过重新定义消费者和品牌链路关系,帮助品牌识别、运营和管理消费者。
精准保量是其中非常核心的算法,阿里妈妈品牌广告的技术创新主要体现在三方面——
1、最细粒度的广告分配
如今品牌也会看重投放效果,将广告供给节点从普通算法的人群粒度细化到用户粒度,使得能根据用户对品牌的偏好,直接优化后链路的触达效果;
2、复杂约束的算子抽象
在淘宝、优酷等品牌广告业务中,存在大量特定业务需求,比如广告主优先级、资源互斥、复杂的频次控制需求等,我们将其全部抽象为算子,作为最优化问题的约束条件;
3、大规模问题优化求解
通过分布式的参数服务器架构解决大规模二部图分配优化问题,通过梯度下降迭代求解可以在精度和速度之间权衡,通过安排任务优先级形成有向无环图进行多任务并行化批处理,在投放过程中根据保量完成情况进行实时调整。
其中,祝文祥团队也通过自研的XSHALE算法,对上亿用户对应的广告供给节点在上百个投放计划,实现分钟级别的最优化投放概率计算。
构建深度学习平台,XDL成为阿里妈妈重要的动力引擎之一
被人称作 “算法天才”的盖坤(花名靖世)也现身演讲,作为阿里妈妈精准展示技术部的资深总监,他介绍了阿里妈妈自研的新一代工业级分布式深度学习框架——XDL,不仅对当下的营销起着关键的作用,对于阿里妈妈未来几年的布局也至关重要。
深度学习推动了近几年互联网算法的快速发展,而推动深度学习技术产生巨大价值的核心点则是强力的深度学习训练框架。谁拥有了更大的架构与算力,谁就有机会在未来的竞争中掌握先机。业界的顶尖公司,如谷歌、Facebook等纷纷研发并开源了其深度学习框架,但现有的开源框架往往构建在图像、语音等应用基础上,对于广告/搜索/推荐这种互联网领域典型的高维稀疏离散数据,往往比较低效。
阿里妈妈的XDL深度学习框架,是基于阿里巴巴海量规模的业务场景实践,全新设计和研发的新一代分布式深度学习框架。XDL独创了四大关键范式(新数据范式、新模型范式、新能力范式、新架构范式),使其真正具备工业级强度。XDL实现了千级节点并发的近似线性计算加速比,能容纳千亿规模稀疏参数训练、在线流式训练,以及全流程异步流水线最大化硬件饱和率的能力。
目前,XDL已经在阿里妈妈的众多业务场景中被大量应用,创造了百亿规模的收入增益。同时,得益于XDL全新的架构能力,一系列业界首创的模型算法能够在XDL平台上高效训练,包括基于树状结构的任意深度学习全库检索模型、用户行为图像和CTR模型的超大规模端到端异构网络等。更可喜的是,XDL未来可能会逐步开源,赋能整个业界。
随着顶层智能营销算法到底层深度学习平台等一系列布局的逐步深入,阿里妈妈以AI为代表的Ad Tech正让营销变得更简单,它也离全球最高效的一站式数字化营销云平台越来越近。
(沈晔)
文章TAG:名片 阿里 阿里妈妈