定义:用于全面刻画用户的数属性和行为。
结构:一颗多层级、多维度标签树。
1)直采型 - 直接采集的用户标签;比如:年龄、身份证
2)统计型 - 利用用户日志数据,按照一定规则进行简单统计额标签。比如:频次、总次数
3)挖掘型 - 利用用户行为数据或者文本数据,结合业务规则进行算法加工,输出对应的属性或分值。如果有必要,对分值可进行归一化处理。比如:产品偏好、内容兴趣爱好
4)预测型 - 与挖掘型类似,但是偏预测场景。比如:用户流失预测,对高风险用户采取召回策略。
1.2 标签生命周期分类
1)静态标签:无需更新的标签,比如:性别
2)动态标签:动态变化的标签,比如:频次
2、用户画像构建思路 2.1 用户画像目的
1)用于用户信息的统计,建立对产品、对用户的基本认知
2)用于用户定向营销,利用人群圈选投放物料;
3)用户算法、沉淀用户特征。供模型使用;比如搜索推荐、风控、广告
2.2 好标签满足条件
高概括性: 结构体系能很好的包含 一个用户的基本行为和产品交互的相关性,同时对业务重点单独强调,没有遗漏;
强延展性: 结构全面的同时也有一定的抽象概括能力,保证新增标签可以很好地找到对应分类,整个体系不至于过于收敛局限。
2.3 用户画像维度属性分类1)基本属性 - 用户基本社会属性和变更频率低的平台属性;例如:年龄(实际年龄20)、性别
2)平台属性 - 利用用户行为进行计算挖掘,标识用户真实属性的标签;例如:平台年龄(喜欢商品类型30)
3)行为属性 - 记录用户的全部单点行为。例如:登录、浏览等
4)产品属性 - 对用户使用某些产品、产品核心功能或者其他渠道的偏好程度的刻画,属于挖掘型标签;例如:搜索模块偏好、京东偏好
5)兴趣爱好 - 对用户和商品之间的关系进行深度刻画的重要标签;例如:品牌偏好、类目偏好
6)敏感度 - 代表用户对平台活动或者优惠的敏感程度;例如:热点敏感度、折扣敏感度
7)消费属性 - 消费属性会作为一个单独的维度进行重点刻画;消费能力、消费意愿、消费金额、消费频次、最近一次消费时间
8)用户生命周期 - 用于标记用户在使用产品属于什么阶段;例如用户从进入产品到离开,通常会经历新手、成长、成熟、衰退、流失5个典型阶段
9)用户价值 - 体现用户为产品贡献价值高低的标签;例如:新手、成长、流失、高价值用户、VIP等级
3、用户标签制作流程发生什么行为的用户可以打上这个标签;由用户的不同历史行为组合而成,包括哪些用户行为,这些用户行为以什么方式进行组合计算。
2)用户行为获取探究不同用户行为的获取维度,包括怎么获取数据、怎么处理数据
一个完整的用户行为(session)包含5要素:用户、时间、接触点、内容、操作。
1)内容结构化(方式分为分类、tag、关键词)
2)数据质量检查
3)基础数据获取
3)模型设计经过分析,确定了哪些行为之后,就可以进行模型设计
4)标签计算对原始用户数据进行计算,生成标签
5)标签评估对生成的标签进行评估,看准确率、覆盖率等指标是否达到预期
4、用户画像验收效果整体效果验收分为线上验收和离线验两部分。

经常使用方法A/B测试。
2)离线验收算法指标验收、分布验收、交叉验收、抽样评测。
5、做好标签注意事项-MVP
在MVP阶段,需要获取的认知包括:
1)市场认知
需要知道某一标签有没有用户点击,会不会带来后续购买,商业价值如何
2)标签规则认知
将用户行为用规则组合成用户标签。
3)测试算法效果
5.2 标签的MVP流程1)产品经理和业务人员商定符合标签的用户特征。
2)人工设定提取具有上述特征用户的规则。
3)将规则用SQL/其他语言写出来,去数据库获取对应的用户ID, 做成用户包。
4)利用MVP测试的工具,将用户包投到线上,看数据效果。
5)如果效果好,产品经理就会列入产品需求,提给研发人员,进行需求排期;如果效果不好,就继续更换用户特征,进行线上测试。
5.3 标签的MVP工具用户包投放功能。
1)上传用户包:产品经理可以上传自己生成的用户ID
2)用户包管理: 展示用户包列表,可进行投放、暂停、删除等管理操作。