知道这点的,知道他当时的强大,不光是精准打标,还可以搜索任何大词都可以找到玩坑产。

在哪个玩大词坑产的时代,效果是杠杠的。

那么向量就是这样简单的吗?

当然不是,其实从分词的那一刻起,词向量召回就已经不精准了。

为什么那么说?

是因为分词破坏了 词与词之间的顺序关系,语义精准度丢失了。

向量召回真正解决的是语义精准度的问题。

解决好语义相识度和精准度问题,核心在于“大数据”

淘宝只所以值钱并不是他有多少商家而是他沉淀下来的消费者和商家的历史数据。

数据化运营的真谛是还原消费者真实的需求过程并深挖消费者“场景”需求。

针对于一个消费者并不是针对某个时间段了解你,而是从全购物链条和行为数据到身份识别加上长时间沉淀平台才真正“认识你,了解你”才会根据有效信息推荐给对的人

这一点不是你模仿一下购物意图,特定一下身份属性符合的人群就可以做到。

更错误的理解:把关键词+购物需求+历史行为+特定身份属性结构 当做能做到语义相关和相识度、精准度的问题就大错特错了。

向量召回 是多维度的取实数值,来解决语义精准度的问题的。

召回机制:召回的是什么?

召回是基于具有相同精准购物意图的访客

召回是基于关键词背后的精准搜索意图

召回是基于用户行为数据分析出的“购物兴趣点”

召回是基于词向量文本相关性和上下文关系

向量是有长度的,向量中的每个元素是数值。

向量召回就是通过将上述基于元素取数值进行向量化表征来构建偏向于高效检索的索引。

背后都是基于精准的语义购物意图。

这就是向量,元素数值:

可以通过实时用户行为轨迹数据获得

可以通过历史用户行为数据获得

可以通过历史点击率数据获得

可以通过历史转化率获得

可以通过深度学习算法结合实时个性化标签数据获得

等等

所取的元素-数值,都有一个相同的特征就是可以进行向量化表征(Embedding成语义向量) 精准反应背后的精准需求意图(表明向量表征)

现在能理解向量了吗?

向量是一个N维向量,数学家已经证明,余弦的这种计算方法对n维向量也成立。

所以向量可以多维生成向量进行余弦相似度解决语义精准度的问题,多向量维度解决语义精准度的问题,并不是像上述举例那样单一向量维度那么简单,背后取的都是个人行为数据和行为轨迹数据的数值,这些本身就不是模仿来的,而是长期沉淀下的数据取值。

所以:解决向量的问题,从根本做起就是“不去破坏、尊重系统、顺势而为”。

从实战出发应该注意什么?

解决向量问题首先解决的就是入池

精准入池的方式无非就两种:

被动入池和主动入池

主动入池就是靠直通车布局好关键词和人群基础结构问题,通过产生的行为数据给商品“入池”。

主动入池:就是坑产倒逼搜索的力量,引蛇出洞、顺势而为;交给系统,系统给的行为数据给商品入池。

入池解决了就是布局向量的问题了。

谈到这向量就是布局影响真实成交的元素,从实战角度解决的就是:

1:关键词布局背后购物意图精准度和聚焦的问题

2:词系布局引导向量

3:直通车测试自定义人群测试好符合产品的基础属性人群结构和身份属性

4:三元组布局,优化分词组合结构,解决语义精准度

5:分层拿流量,单向入池,多向布局,多路召回

向量背后商品的行为数据越干净,价值越大。

模仿关键词(购物需求)+历史行为+特定身份属性结构的行为, 解决语义精准度的问题,数据本身就“假”,通过数据在产生的数据更假。

向量恰恰是一个通过数据再生产数据的过程,这就是根本原因所在,通过“刷”影响向量解决转化率的问题,看产品真实承受力和个人的数据处理能力。

所以优化语义精准度的思路是:只要精准语义权重不要行为数据,如果能悟透这句话就知道自己为什么刷“大词”守不住了。

语义优化还有很多方式比如语义向量词玩法等等,向量召回解决的就是语义相似度的问题,背后的精准度就看如何多维取实数形成多维向量。

现在的搜索基本围绕着语义召回。

从商品需求转化到场景需求,背后就是算法的强大,语义召回的精准。

更何况现在已经有了全面的语义网络和知识画谱语义知识数据库系统。

推荐流量会越来越精准,搜索作为种子会发挥更强大的作用。

作者:七掌柜--鬼哥

 2/2   首页 上一页 1 2 下一页

文章TAG:向量召回  
下一篇