什么是用户画像?
简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。
举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。
除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。
用户画像的作用
罗振宇在《时间的朋友》演讲里举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然,这是极其错误的用法。
其作用大体不离以下几个方面:
- 精准营销,分析产品潜在用户,针对特定群体进行营销;
- 用户统计,比如中国大学购买书籍人数 TOP10,全国各城市奶爸指数;
- 数据挖掘,构建智能推荐系统。利用关联规则计算喜欢红酒的人通常喜欢什么运动品牌;
- 进行效果评估,完善产品运营,提升服务质量。其实这也相当于市场调研、用户调研;
- 对服务或产品进行私人定制,即个性化的服务某类甚至某位用户(个人认为这是目前的发展趋势,未来的消费主流)。比如,某公司想推出一款面向5-10岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。
- 业务经营分析以及竞争分析,影响企业发展战略。
构建流程
数据收集
数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
- 网络行为数据:活跃人数、页面浏览量、访问时长、激活率、外部触点、社交数据等
- 服务内行为数据:浏览路径、页面停留时间、访问深度、唯一页面浏览次数等
- 用户内容便好数据:浏览/收藏内容、评论内容、互动内容、生活形态偏好、品牌偏好等
- 用户交易数据(交易类服务):贡献率、客单价、连带率、回头率、流失率等当然,收集到的数据不会是100%准确的,都具有不确定性,这就需要在后面的阶段中建模来再判断,比如某用户在性别一栏填的男,但通过其行为偏好可判断其性别为“女”的概率为80%。
还得一提的是,储存用户行为数据时最好同时储存发生该行为的场景,以便更好地进行数据分析。
行为建模
该阶段是处理收集到的数据,注重大概率事件,通过数学算法模型尽可能地排除用户的偶然行为,进行行为建模,抽象出用户的标签。
这时也要用到机器学习预测用户的行为偏好。好比一个 y=kx+b 的算法,X 代表已知信息(即用户标签),Y 是用户偏好,通过不断的精确 k 和 b 来精确 Y。
在这个阶段,需要用到很多模型给用户贴标签。
- 用户汽车模型根据用户对“汽车”话题的关注或购买相关产品的情况来判断用户是否有车、是否准备买车
- 用户忠诚度模型通过判断+聚类算法判断用户的忠诚度
- 身高体型模型根据用户购买服装鞋帽等用品判断
- 文艺青年模型根据用户发言、评论等行为判断用户是否为文艺青年
- 用户价值模型判断用户对于网站的价值,对于提高用户留存率非常有用(电商网站一般使用RFM 实现)还有消费能力、违约概率、流失概率等等诸多模型。
用户画像基本成型
该阶段可以说是第各二阶段的深入,把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征和社交网络等大致地标签化。
为什么说是基本成型?因为用户画像永远也无法100%地描述一个人,只能做到不断地去逼近。因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。
一般采用多级标签、多级分类进行“标签化”,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。
数据可视化分析
在此步骤中,开始利用前面产生的用户画像。一般是分析特定群体,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营等。如图: