左边一列是用户购买宝贝的参数,第二列是宝贝标题名称
宝贝参数用于提取顾客的固有特征,宝贝标题主要是提取宝贝的特征,具体挖掘下这些数据。
1、属性特征
通过购买的商品类型,判断该顾客的特征概率,主要包括性别、年龄、是否有小孩、消费能力等指标。判断方法可以采用最简单的投票法,例如买过10件女性产品,买过2件男性产品,TA是女性的概率相对较高。(还有更精确的贝叶斯判别,需要建立样本库),这里我们通过比对自建的样本库,对该用户进行属性特征的判别。
女—— 时尚性感——追求潮流——25-30——有孩子——有iPhone——高端消费群体
这大致是该用户的属性特征,或者说,有很大概率是这样的特征。
2、网购商品
分析该用户经常网购的商品类目,80%以上为
服装—— 装饰——鞋——包
按照购买的数量排序。
3、购买动机
对于动机,每个分析方案都有不同的定义,如果你做淘金币,可以分析用户对淘金币商品的偏好程度,例如我们这里,分析得出该用户购买的绝大多数商品标题中,含有“包邮”这个关键词(比例46/201,大约25%)
我们可以认为,该用户对是否包邮比较敏感,包邮可能会使TA购买意向强烈。
4、风格偏好
风格包括款式、面料等等宝贝特征,有效帮助我们总结顾客的需求。例如该用户购买的商品,我们认为,该用户偏好于
韩版—— 欧美风——修身
这类型的风格。
主要是白、黑、蓝,可能该顾客对奢侈品的主流色调有一定喜好。
最后,还有一点比较容易获得的是顾客的身材
鞋码:35-37
衣码:M-L
裤码:26-28
我们可以判断,该用户(女性)身高165左右,体重50kg左右。
以上基本就是顾客画像的技术实现过程。如果顾客数量不多,可以手工完成,大家不妨试下。
谈到优化,目前还没有测试到好的方案,先留个尾巴。
文章TAG:顾客画像 数据挖掘 个性搜索