用户画像分析(用户画像分析案例)
大家好!今天让创意岭的小编来大家介绍下关于用户画像分析的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、用户画像分析怎么做
首先,是找到目标用户。以Tik Tok为例。在Tik Tok刚刚开始上线之后,分析我们的用户是谁是非常重要的,比如什么年龄,性别,地域教育等等。这样可以快速帮助产品找到当前的主流用户群体是否是产品的初始定位。如果完全不同,那就是产品的设计出了问题,偏离了方向。
上线一段时间后,我们可以把用户分成不同的活跃程度。比如都玩Tik Tok,有的天天玩有的偶尔玩,有的能刷很久,有的刷完就走了。频率和时长成了此时用户最大的特征差异。那么,不同频率和时长的用户在年龄、性别、地域上有什么区别呢?这些是对特征的进一步认识。
一段时间后,部分用户会保留和流失用户,需要分析保留用户和流失用户在行为特征上是否有特殊差异。
https://iknow-pic.cdn.bcebos.com/f703738da977391294357ff1ea198618367ae20b?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_600%2Ch_800%2Climit_1%2Fquality%2Cq_85%2Fformat%2Cf_auto
二、用户画像数据建模方法_用户画像分析
近些年,互联网进入了“ 大数据 时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚 焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。伴随着对人的了解逐步深入,一个概念悄然而生: 用户画像 (UserProfile),完美地抽象出一 个用户的信息全貌,可以看作企业应用大数据的根基。
一、什么是用户画像?
男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。
这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。
如果用一幅图来展现,即:
二、为什么需要用户画像
用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少?
也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况?
大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。
三、如何构建用户画像
一个标签通常是人为规定的高度精炼的特征标识,如年龄段标签:25~35岁,地域标签:北京,标签呈现出两个重要特征:语义化,人能很方便地理解每 个标签含义。这也使得用户画像模型具备实际意义。能够较好的满足业务需求。如,判断用户偏好。短文本,每个标签通常只表示一种含义,标签本身无需再做过多 文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
人制定标签规则,并能够通过标签快速读出其中的信息,机器方便做标签提取、聚合分析。所以,用户画像,即:用户标签,向我们展示了一种朴素、简洁的方法用于描述用户信息。
3.1 数据源分析
构建用户画像是为了还原用户信息,因此数据来源于:所有用户相关的数据。
对于用户相关数据的分类,引入一种重要的分类思想:封闭性的分类方式。如,世界上分为两种人,一种是学英语的人,一种是不学英语的人;客户分三类, 高价值客户,中价值客户,低价值客户;产品生命周期分为,投入期、成长期、成熟期、衰退期…所有的子分类将构成了类目空间的全部集合。
这样的分类方式,有助于后续不断枚举并迭代补充遗漏的信息维度。不必担心架构上对每一层分类没有考虑完整,造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景,业务需求的不同,也许各有道理,按需划分即可。
本文将用户数据划分为静态信息数据、动态信息数据两大类。
静态信息数据
用户相对稳定的信息,如图所示,主要包括人口属性、商业属性等方面数据。这类信息,自成标签,如果企业有真实信息则无需过多建模预测,更多的是数据清洗工作,因此这方面信息的数据建模不是本篇文章重点。
动态信息数据
用户不断变化的行为信息,如果存在上帝,每一个人的行为都在时刻被上帝那双无形的眼睛监控着,广义上讲,一个用户打开网页,买了一个杯子;与该用户 傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等等一样都是上帝眼中的用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如上图所示:浏览凡 客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞“双十一大促给力”的微博消息。等等均可看作互联网用户行为。
本篇文章以互联网电商用户,为主要分析对象,暂不考虑线下用户行为数据(分析方法雷同,只是数据获取途径,用户识别方式有些差异)。
在互联网上,用户行为,可以看作用户动态信息的唯一数据来源。如何对用户行为数据构建数据模型,分析出用户标签,将是本文着重介绍的内容。
3.2 目标分析
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。如,红酒 0.8、李宁 0.6。
标签,表征了内容,用户对该内容有兴趣、偏好、需求等等。
权重,表征了指数,用户的兴趣、偏好指数,也可能表征用户的需求度,可以简单的理解为可信度,概率。
3.3 数据建模方法
下面内容将详细介绍,如何根据用户行为,构建模型产出标签、权重。一个事件模型包括:时间、地点、人物三个要素。每一次用户行为本质上是一次随机事件,可以详细描述为:什么用户,在什么时间,什么地点,做了什么事。
什么用户 :关键在于对用户的标识,用户标识的目的是为了区分用户、单点定位。
以上列举了互联网主要的用户标识方法,获取方式由易到难。视企业的用户粘性,可以获取的标识信息有所差异。
什么时间 :时间包括两个重要信息,时间戳+时间长度。时间 戳,为了标识用户行为的时间点,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常采用精度到秒的时间戳即 可。因为微秒的时间戳精度并不可靠。浏览器时间精度,准确度最多也只能到毫秒。时间长度,为了标识用户在某一页面的停留时间。
什么地点 :用户接触点,Touch Point。对于每个用户接触点。潜在包含了两层信息:网址 + 内容。网址:每一个url链接(页面/屏幕),即定位了一个互联网页面地址,或者某个产品的特定页面。可以是PC上某电商网站的页面url,也可以是手机 上的微博,微信等应用某个功能页面,某款产品应用的特定画面。如,长城红酒单品页,微信订阅号页面,某游戏的过关页。
内容 :每个url网址(页面/屏幕)中的内容。可以是单品的相关信息:类别、品牌、描述、属性、网站信息等等。如,红酒,长城,干红,对于每个互联网接触点,其中网址决定了权重;内容决定了标签。
注:接触点可以是网址,也可以是某个产品的特定功能界面。如,同样一瓶矿泉水,超市卖1元,火车 上卖3元,景区卖5元。商品的售卖价值,不在于成本,更在于售卖地点。标签均是矿泉水,但接触点的不同体现出了权重差异。这里的权重可以理解为用户对于矿 泉水的需求程度不同。即,愿意支付的价值不同。
标签 权重
矿泉水 1 // 超市
矿泉水 3 // 火车
矿泉水 5 // 景区
类似的,用户在京东商城浏览红酒信息,与在品尚红酒网浏览红酒信息,表现出对红酒喜好度也是有差异的。这里的关注点是不同的网址,存在权重差异,权重模型的构建,需要根据各自的业务需求构建。
所以,网址本身表征了用户的标签偏好权重。网址对应的内容体现了标签信息。
什么事 :用户行为类型,对于电商有如下典型行为:浏览、添加购物车、搜索、评论、购买、点击赞、收藏 等等。
不同的行为类型,对于接触点的内容产生的标签信息,具有不同的权重。如,购买权重计为5,浏览计为1
红酒 1 // 浏览红酒
红酒 5 // 购买红酒
综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + 时间 + 行为类型 + 接触点(网址+内容),某用户因为在什么时间、地点、做了什么事。所以会打上**标签。
用户标签的权重可能随时间的增加而衰减,因此定义时间为衰减因子r,行为类型、网址决定了权重,内容决定了标签,进一步转换为公式:
标签权重=衰减因子×行为权重×网址子权重
如:用户A,昨天在品尚红酒网浏览一瓶价值238元的长城干红葡萄酒信息。
标签:红酒,长城
时间:因为是昨天的行为,假设衰减因子为:r=0.95
行为类型:浏览行为记为权重1
地点:品尚红酒单品页的网址子权重记为 0.9(相比京东红酒单品页的0.7)
假设用户对红酒出于真的喜欢,才会去专业的红酒网选购,而不再综合商城选购。
则用户偏好标签是:红酒,权重是0.95*0.7 * 1=0.665,即,用户A:红酒 0.665、长城 0.665。
上述模型权重值的选取只是举例参考,具体的权重值需要根据业务需求二次建模,这里强调的是如何从整体思考,去构建用户画像模型,进而能够逐步细化模型。
四、总结 :
本文并未涉及具体算法,更多的是阐述了一种分析思想,在计划构建用户画像时,能够给您提供一个系统性、框架性的思维指导。
核心在于对用户接触点的理解,接触点内容直接决定了标签信息。内容地址、行为类型、时间衰减,决定了权重模型是关键,权重值本身的二次建模则是水到渠成的进阶。模型举例偏重电商,但其实,可以根据产品的不同,重新定义接触点。
比如影视产品,我看了一部电影《英雄本色》,可能产生的标签是:周润发 0.6、枪战 0.5、港台 0.3。
最后,接触点本身并不一定有内容,也可以泛化理解为某种阈值,某个行为超过多少次,达到多长时间等。
比如游戏产品,典型接触点可能会是,关键任务,关键指数(分数)等等。如,积分超过1万分,则标记为钻石级用户。钻石用户 1.0。
百分点现已全面应用用户画像技术于推荐引擎中,在对某电商客户,针对活动页新访客的应用中,依靠用户画像产生的个性化效果,对比热销榜,推荐效果有显著提升:推荐栏点击率提升27%, 订单转化率提升34%。
三、Bilibili用户画像分析
本文整理自金渡江的一次公开分享,由于数据保密原因和时长原因,只从一些比较粗的颗粒度来阐述了B站的用户画像,以及不同用户画像群体在同一个社区内的冲突。
niconico的用户年龄组成呈纺锤形,更加稳定健康,bilibili呈金字塔型,整个B站的用户更加年轻化,也是说明B站是一个处于用户发展早期的网站。
2015年bilibili因为“鬼畜”出村,实现了日系文化与中国文化结合起来,将B站文化落地到中国,所以用户量大幅度增长,用户画像也发生了变化。
一般网站的年龄会是相对固定1的,像B站这样年龄一直往下走,说明网站仍然存在一定不确定性。
B站最早的用户是来源PC,大多数是80/90初的,主要是通过电视+DVD接触动漫的,但是广电2003年封禁日本漫画,2004年PC开始降价普及,这部分人开始使用互联网方式接入动漫文化,这部分人动手能力强,为B站创造了很多有价值的新内容。
B站的分区喜好:转向小区,音MAD,vovaloid,番剧延伸;
最爱的动漫:clannad,fate,小圆,lovelive,石头门;
喜欢的声优:钉宫,香菜,水树,u‘s;
国产动画:拒绝。
用户行为与场景:关闭弹幕率高,评论参与度低,网页端的忠实客户,也会使用手机端;
B站20岁以下的用户更多是直接通过网络接触到动漫文化,标志性事件是2008年迅雷开启动漫频道;2012年智能手机在中国的用户是2亿,2013年是4亿,2018年达到8亿,智能手机的普及的是B站用户量腾飞的一个关键原因。
从众心理比较重,
B站分区喜好:鬼畜爱好者;
最爱的动漫:刀剑神域,fate,夏目,约会大作战,lovelive;
喜欢的声优:香菜,钉宫,神谷,u‘s;
对于国产动画:拥抱变化。
用户行为与场景:热衷于发送弹幕,乐于讨论,网页端一般不用。
由于两者用户画像不同,所以从2015年开始在社区里爆发了一个“大势所趋”的冲突,喜欢音MAD的PC世代用户与喜欢鬼畜的手机世代的用户发生了大争论。
女性用户在B站出现了两级分化,一类喜欢动漫,其关键词是:冰上的尤里,一年生,夏目,银魂,狐妖小红狼,新年的声音;另一类则喜欢偶像,与爱奇艺的用户画像更为相近,关键词是张艺兴,杨洋,TFboy,SNH48,张继科,羽生结弦等。
如张艺兴,主要是在《极限挑战》选择了与B站合作,在B站上张艺兴的人气很高,顺便把粉丝也聚拢在B站。
社群象限模型主要讨论的是,对于内容的互动性,对于对于兴趣外内容的包容性;
例如看电视剧的用户,看就安安静静的看,不喜欢互动,甚至关掉弹幕,也不愿意看其他用户群的内容,这就是内向+孤立社群。对于时尚人群,这些人会在社群内频繁互动,但对于其他用户不感兴趣。喜欢鬼畜、番剧的人群,则是外向而又开放的;内向比较开放的,可能是喜欢色色内容的一个群体。
在获取用户填写的数据时,感到安全,感到能够获取到利益。同时可以给一个设定,如半年内不能更改。
在设计调查问卷时,设计一些重复确认的题目,筛选掉无效问卷。
B站是一年一次。
在大规模正式的周期性重分析,日常也可以从社区文化中感受到整站的用户画像变化。
四、用户画像介绍
用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。
通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。
标签的分类方法比较多样,可以按标签的产出方式分,也可以按实际业务分,也可以组合起来分类。
按产出方式来分的话:
1)事实统计类标签 例如近7日活跃时长、近7日活跃次数等等
2)事实规则类标签 例如消费活跃:近30天交易次数>=2
3)模型类标签 例如RFM模型,AARRR模型
4)算法类标签 例如根据用户购买的商品判断其购物性别、对某商品的偏好程度
按实际业务来分的话:
1)用户属性标签
2)用户消费标签
3)用户行为标签
4)风险控制标签
。。。
在互联网、电商领域用户画像常用来作为精准营销、推荐系统的基础性工作,其作用总体包括:
1)精准营销:根据历史用户特征,分析产品的潜在用户和用户的潜在需求,针对特定群体,利用短信、邮件等方式进行营销,提升营销效率和营销效果。
2)用户统计:根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用户数量、分布;分析不同用户画像群体的分布特征。
3)数据挖掘:以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度。
4)服务产品:对产品进行用户画像,对产品进行受众分析,更透彻地理解用户使用产品的心理动机和行为习惯,完善产品运营,提升服务质量。
5)行业报告&用户研究:通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析
6)ABtest:用于创建ABtest实验,和实验效果分析
用户画像必须从实际业务场景出发,解决实际的业务问题,之所以进行用户画像,要么是获取新用户,要么是提升用户体验、或者挽回流失用户等具有明确的业务目标。
数据源的数据是标签构建的最底层,来源于各个业务端的数据,主要有离线和实时两大数据来源,一般的大数据架构会有流批处理的链路分别处理,也有流批一体的架构,数据产品可不重点关注。
数据层开始数据产品会比较关注,数据产品在设计标签时需要关注标签的生产在数据仓库的流转口径,特别是在定义原子标签的时候,需要深入理解业务,了解用户的来源,状态,订单的渠道,线上线下,订单状态等等。
标签层一般的,会按照上面说的实际业务分类进行标签的建设,一般构建原子标签就足够了,在服务层的标签工厂可以个性化的创建新的派生标签。
服务层主要包含两块,一个是画像平台的应用,一个是画像数据的统一API服务,给前台的营销系统、广告系统等提供标签分群数据支持。
以上是用户画像系统的基础概念,下一节我们了解下画像系统的难点之一:如何构建oneid?
以上就是关于用户画像分析相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读:
抖音商家能看用户退款记录吗(抖音商家能看用户退款记录吗安全吗)
sem利用用户对搜索引擎的(sem利用用户对搜索引擎的需求分析)