数据挖掘影响因素选择(数据挖掘相关分析)
大家好!今天让创意岭的小编来大家介绍下关于数据挖掘影响因素选择的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、大数据将对数据挖掘产生什么影响
数据已经成为21世纪最重要的“原材料”之一。对于大数据的关注可以说是贯穿于各行各业当中,企业能否对海量的数据进行行之有效的快速挖掘与分析,决定着一个企业未来的发展趋势。有研究表明,决策依赖数据的公司,其运营状况要比不重视数据的公司出色很多。数据正成为企业的一种资产,用数据驱动企业发展。企业要善于发现数据里的奥秘。而如何利用大数据可视化等分析技术将企业的庞大数据转化为巨大商机,则成为众多商家思考的关键。
大数据可视化技术就是在多样的或大量的数据中快速获取信息的能力,大数据不止是一切用数据说话,它能支持企业进行全面分析、管理、并且更加实时。不一样的数据经过大数据可视化技术的分析之后能够体现出不一样的可预见性的洞察力。即便是同一组数据,不同的企业看到的结果也不同,这取决于数据挖掘与大数据可视化等技术应用的能力。
大数据可视化可以让企业看到他拥有的所有数据,产生快速的洞察力,进而采取最佳行动。并且,数据越挖掘越有价值。尽管大数据带来的很大的价值,事实表明很多企业的处理能力,数据的复杂度,数据的计算方式等,都存在很多问题。比如,数据规模导致传统算法失效,大数据复杂的数据关联性导致高复杂度的计算;事务交易、分析和行动之间长时间延迟;复杂查询以小时计,有时不能得到满意的答案。
如果能够对数据进行有效的深入挖掘,可以更好地进行客户分析。比如,对客户进行细分与流失分析。企业可以识别哪些是重要客户,哪些是有价值的客户或者是新来的客户,哪些客户可能会流失;从客户价值的远度,进行时间序列分析。根据客户的历史消费情况,以及它本身的特征,可以推测出未来的消费趋势;客户价值的深度管理,可实现交叉销售分析、协同过滤推荐,深化客户购买,挖掘客户价值;通过大数据可视化技术,计算客户的社会影响力,进行精准营销,比如对不同影响力的客户给予不同的优惠,并根据其偏好提供个性化的服务。
传统并行的计算朝着分布式方向发展,传统的OldSQL变成了与NewSQL和NoSQL并行的多架构应用。正经历着由“一种架构支持所有应用”转变成“多种架构支持多类应用”的转变,这样的转变才可以及时应对企业遇到的大数据处理问题。
在进行实时分析的时候,可以同时满足实时查看与数据分析的实时动态要求的大数据魔镜,不仅能够进行数据分析的快速反应,而且大数据可视化展现的结果是基于最新的实时数据。企业只需要安排一个管理员来分配不同角色的权限,不同角色的人员,通过权限管理功能,实现数据化管理体系。在这样的一个体系中,运营决策者可以全面监控整个企业的数据情况,IT人员可以从繁琐的数据收集整理中解脱出来,分析师可以升级去做更深层次的挖掘工作,而业务人员也可以利用实时数据精准决策。
大数据魔镜利用大数据处理技术,能够将各类数据进行快速整合,实现对海量数据的加速处理与实时分析,再通过丰富的大数据可视化手段,提供商业分析决策支持所需的数据和信息,灵活快速地响应管理和业务变化,为企业和公共组织搭建一套灵活、完善的辅助决策分析体系,从而在最大程度上挖掘数据的潜在价值,实现用户利益的最大化。
二、如何将数据挖掘技术应用到客户内在需求管理
客户内在需求管理是以客户为中心(而不是以产品为中心)、以企业与外部的业务交流为主导(而不是局限于企业内部的事务)、以企业的前端业务应用为主(而不是以企业的后端业务处理为主)的管理模式。
一、客户内在需求管理需要数据挖掘
当今社会,客户的价值已经越来越多地影响着企业的价值,客户内在需求管理(CRM)正是通过建立长期而系统的客户内在需求来提升单个客户价值的战略,其要旨在于帮助企业通过运用适合的技术以及合理的人力资源洞察客户的行为和他们的价值,以便企业能够迅速有效地对客户的需求进行回应。
客户内在需求管理(CRM)的核心是“了解客户,倾听客户”,客户内在需求管理的目标可以概括为“吸引潜在客户进入,提高现有客户满意度和忠诚度,降低客户流失”,总之一切的最终目的都是为了提高收益。
在企业关注客户内在需求管理的同时,信息技术的飞速发展为客户内在需求管理(CRM)的高效实施提供了技术保证,通过数据挖掘技术对客户内在需求进行深入分析可以满足企业对个体细分市场的客户内在需求管理需求(具体可查看马海祥博客《如何以客户为中心进行数据挖掘与分析》的相关介绍)。
数据挖掘主要是找寻隐藏在数据中的信息,例如发现趋势、特征及相关性的过程,也就是从数据中发掘出信息或知识。
二、数据挖掘技术及常用方法
数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。
它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术,数据挖掘技术是客户内在需求管理的关键技术。
常用的数据挖掘技术包括关联分析、序列分析、分类分析、聚类分析、预测、孤立点分析等。
事实上,解决一个已给的业务问题时,数据挖掘一般混合使用两种及两种以上的技术类别。
1、关联分析
关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生,关联分析的重点在于快速发现那些有实用价值的、关联发生的事件。
2、序列分析
序列分析技术主要用于发现一定时间间隔内接连发生的事件,这些事件构成一个序列,发现的序列应该具有普遍意义,其依据除了统计上的概率之外,还要加上时间的约束。
3、分类分析
分类分析通过分析具有类别的样本的特点,得到决定样本属于各种类别的规则或方法,利用这些规则和方法对未知类别的样本分类时应该具有一定的准确度,其主要方法有基于统计学的贝叶斯方法、神经网络方法、决策树方法以及support vector machines等。
在马海祥看来,利用分类技术,可以根据顾客的消费水平和基本特征对顾客进行分类,找出对商家有较大利益贡献的重要客户的特征,通过对其进行个性化服务,提高他们的忠诚度。
4、聚类分析
聚类分析是根据物以类聚的原理,将本身没有类别的样本聚集成不同的组,并对每一个这样的组进行描述的过程,其主要依据是聚到同一个组中的样本应该彼此相似,而属于不同组的样本应该足够不相似(具体可查看马海祥博客《聚类分析的方法及应用》的相关介绍)。
5、预测
预测与分类类似,但预测是根据样本的已知特征估算某个连续类型的变量的取值的过程,而分类则只是用于判别样本所属的离散类别而己。
马海祥认为预测模型可以使用较为传统的统计回归技术,也可以使用新的分类技术,目前最通用的是决策树归纳技术。
6、孤立点分析
数据库中可能包含一些数据对象,它们与数据的一般行为或模型不一致,这些数据对象称为孤立点,对这些数据的挖掘分析可以用于处理一些罕见事件,比如信用卡欺诈等。
三、数据挖掘技术在客户内在需求管理中的应用
一般来说,在企业管理客户生命周期的各个阶段都会用到数据挖掘技术,数据挖掘能够帮助企业确定客户的特点,从而可以为客户提供有针对性的服务。
企业通过数据挖掘,可以发现使用某一业务的客户的特征,从而可以向那些也同样具有这些特征却没有使用该业务的客户进行有目的的推销,还可以找到流失的客户特征,在那些具体相似特征的客户还未流失之前,采用针对性的措施。
目前,数据挖掘技术在客户内在需求管理关系中的应用有以下几个方面:
1、客户盈利能力
计算客户盈利能力有助于挖掘有价值客户,公司各个部门之间对客户盈利能力可能有不同理解,分析顾客的忠诚度,可以利用数据挖掘来挖掘忠诚度高的客户;可以通过数据挖掘技术可以有效计算客户盈利能力;还可以利用数据挖掘预测未来的客户盈利能力。
在马海祥看来,利用数据挖掘技术来预测客户盈利能力需要的两个因素:
①、记录潜在客户行为特征和发展成为客户行为特征的历史数据。
②、计量客户盈利能力的标准。
使用数据挖掘技术后可以增加客户盈利能力,增加客户盈利能力指客户在获得提升后,增加的盈利能力,如:客户得到某种优惠促销而增加部分开支去销售,则增加部分的开支给公司带来的利润即增加的客户盈利能力。
2、客户的保持和流失
企业的增长和发展壮大需要不断获得新的客户并维持老的客户,不论企业希望得到的是哪类客户,数据挖掘都能帮助识别出这些潜在的客户群,并提高市场活动的回应率,做到有的放矢。
现在各个行业的竞争都越来越激烈,企业获得新客户的成本正在不断上升,因此建立客户流失预测模型,得出即将流失的客户,对他们采取有效措施进行挽留,从而有效减少客户流失就显得越来越重要,数据挖掘可以帮助发现打算离开的客户,以使企业采取适当的措施挽留这些客户。
3、客户获得
在没有利用数据挖掘技术时,客户获取的传统方法就是选出一些感兴趣的人口调查其属性,获取这些人口的特征即可,但随着数据量的增大,传统的方法具有不可实现性。
利用数据挖掘在扩展客户市场活动时,利用数据挖掘技术挖掘出潜在的客户名单,在客户名单上列出可能对某些产品感兴趣的客户信息,便可更方便的获取更多的客户。
4、客户细分
客户市场细分指的是将客户划分成互不相交的类别,客户作为企业宝贵的资源,每一次与客户接触既是了解客户的过程,也是客户体验企业的机会。
因此,真正关心客户,为每位客户提供与客户内在需求一致的、个性化的服务,才能让客户体会到企业的价值。
近年来,一对一营销正在被众多的企业所青睐,一对一营销是指了解每一个客户,并同其建立起持久的关系。
数据挖掘可以把大量的客户分成不同的类,在每一个类里的客户具有相似的属性,而不同类里的客户的属性也不同,像聚类分析这样的数据挖掘技术,可以辅助企业进行客户细分(具体可查看马海祥博客《收集客户关系管理数据的策略和需求分析》的相关介绍)。
例如,化装品企业的客户分为:少儿、青年、中年和老年或者按性别分为男、女,通过数据挖掘可以了解其不同客户的爱好,通过提供有针对性的产品和服务,来提高不同类客户对企业和产品的满意度。
5、交叉营销
交叉营销是指在向现有客户提供新的产品和服务的营销过程,如那些购买了婴儿尿布的客户会对你的其他婴儿产品感兴趣。
交叉营销的升级形式为:升级营销,指向客户提供与他们已购买的服务相关的新服务。
数据挖掘技术在交叉营销中的应用首先表现为,分析现有客户的购买行为数据,进行交叉营销分析,具体数据挖掘过程包含三个独立步骤,即对个体行为进行建模;用预测模型对数据进行评分;对得分矩阵进行最优化处理。
然后进行建模阶段,利用上述建模的方法。
接下来就是评分阶段,对所建立的模型进行评定。
最后一个阶段就是优化阶段,通常有四种方法:质朴的方法、平均效益方法、个人效益方法、有约束条件的优化方法。
6、客户欺诈风险分析
在客户内在需求管理中,客户的信用分析和诈骗识别是非常重要的,因为一旦发生信用风险和欺诈行为,企业将面临管理活动的失败、市场份额的丧失和营销活动的失败,导致企业失去市场、顾客、竞争力和信誉。
根据马海祥博客收集的统计资料表明,企业间的欺诈行为是非常普遍的,而且一旦发生,给企业带来的损失是巨大的,如何准确、及时、有效地预测到企业可能发生的欺诈风险是非常有意义的,数据挖掘技术能够很好地解决此问题。
可以利用数据挖掘中的意外规则的挖掘方法、神经网络方法和聚类方法,对客户数据仓库中的数据进行分析和处理,分析欺诈为什么会发生?哪些因素容易导致欺诈?欺诈风险主要来自于何处?如何预测到可能发生的欺诈?采取何种措施可以减少欺诈的发生?以便分析和评价欺诈风险的严重性和发生的可能性,准确、及时地对各种欺诈风险进行监视、评价、预警和管理,进而采取有效的回避和监督措施,在欺诈风险发生之前对其进行预警和控制。
7、市场策略分析
利用数据挖掘技术可以对市场进行如下几种分析:预测客户生命期的价值;预测客户潜在价值;预测客户潜在生命期价值。
根据数据挖掘得出的结果,进行市场策略分析,充分发挥客户的现有价值和他的潜在价值。
对现有价值和潜在价值进行策略分析时,当客户的现有价值与潜在价值一样,则维持的最低费用,当客户的潜在价值高于现有价值,则发挥其潜在价值的最低费用。
在此,马海祥还要提醒大家一点:如果利用数据挖掘不能增加的客户现有价值或潜在的价值,则应停止推销等活动,否则,就要加大或继续。
8、客户忠诚度
客户忠诚被认为是企业取得盛器利润增长的途径,客户内在需求管理需要培养和选择忠诚客户,使之与公司保持长期关系,但不是所有客户都愿意与公司保持联系,一些客户的购买决策只受价格、方便等因素的影响。
不论公司如何以诚相对,提供高的顾客让渡价值,客户一旦发现其他公司有更低价格的商品,便马上离开转向该公司,也有一些顾客更关心商品的质量、价值、服务、节约时间等,当他用本公司的产品感到满意以后,就会成为公司的忠诚顾客。
通过对许多客户资料进行分析表明,公司80%的利润来自20%的客户。
因此,忠诚客户对公司所带来的利润是巨大的,数据挖掘技术,可以通过对数据库中的大量数据进行分析,以确定消费者的购买习惯、购买数星和购买频率,分析客户对某个产品的忠诚程度、持久性、变动情况等,以确定忠诚客户,并为他们提供“一对一”的个性化服务,增强客户的忠诚度,最大限度地挖掘客户对企业的终生价值,为企业创造更大的利润。
数据挖掘中的差异性分析可用于发现客户的欺诈行为,分析客户的诚信度,从而获得诚信较好的客户。
转载
三、如何做好数据分析?
数据分析有:分类分析,矩阵分析,漏斗分析,相关分析,逻辑树分析,趋势分析,行为轨迹分析,等等。 我用HR的工作来举例,说明上面这些分析要怎么做,才能得出洞见。
01) 分类分析
比如分成不同部门、不同岗位层级、不同年龄段,来分析人才流失率。比如发现某个部门流失率特别高,那么就可以去分析。
02) 矩阵分析
比如公司有价值观和能力的考核,那么可以把考核结果做出矩阵图,能力强价值匹配的员工、能力强价值不匹配的员工、能力弱价值匹配的员工、能力弱价值不匹配的员工各占多少比例,从而发现公司的人才健康度。
03) 漏斗分析
比如记录招聘数据,投递简历、通过初筛、通过一面、通过二面、通过终面、接下Offer、成功入职、通过试用期,这就是一个完整的招聘漏斗,从数据中,可以看到哪个环节还可以优化。
04) 相关分析
比如公司各个分店的人才流失率差异较大,那么可以把各个分店的员工流失率,跟分店的一些特性(地理位置、薪酬水平、福利水平、员工年龄、管理人员年龄等)要素进行相关性分析,找到最能够挽留员工的关键因素。
05) 逻辑树分析
比如近期发现员工的满意度有所降低,那么就进行拆解,满意度跟薪酬、福利、职业发展、工作氛围有关,然后薪酬分为基本薪资和奖金,这样层层拆解,找出满意度各个影响因素里面的变化因素,从而得出洞见。
06) 趋势分析
比如人才流失率过去12个月的变化趋势。
07)行为轨迹分析
比如跟踪一个销售人员的行为轨迹,从入职、到开始产生业绩、到业绩快速增长、到疲惫期、到逐渐稳定。
通过面向企业业务场景提供一站式大数据分析解决方案,能够为企业在增收益、降成本、提效率、控成本等四个角度带来价值贡献。
1、增收益
最直观的应用,即利用数据分析实现数字化精准营销。通过深度分析用户购买行为、消费习惯等,刻画用户画像,将数据分析结果转化为可操作执行的客户管理策略,以最佳的方式触及更多的客户,以实现销售收入的增长。
下图为推广收支测算分析,为广告投放提供决策依据。
下图为渠道销量分析,为渠道支持提供数据支撑。
2、降成本
例如通过数据分析实现对财务和人力的管理,从而控制各项成本、费用的支出,实现降低成本的作用。
下图为生产成本分析,了解成本构成情况。
下图为期间费用预实对比分析,把控费用情况。
3、提效率
每个企业都会出具相关报表,利用数据分析工具,如数钥分析云,不懂技术的业务人员也能够通过简单的拖拉拽实现敏捷自助分析,无需业务人员提需求、IT人员做报表,大大提高报表的及时性,提高了报表的使用效率。
通过数据分析工具,能够在PC端展示,也支持移动看板,随时随地透视经营,提高决策效率。
4、控风险
预算是否超支?债务是否逾期?是否缺货了、断货了?客户的回款率怎么样?设备的运行是否正常?哪种产品是否需要加速生产以实现产销平衡?...其实,几乎每个企业都会遇到各种各样的风险问题。通过数据分析,能够帮助企业进行实时监测,对偏离了预算的部分、对偏离了正常范围的数值能够进行主动预警,降低企业风险。
下图为税负率指标,当综合税负率过高,可以实现提示和预警。
下图为重要指标预警,重点监控项目的毛利率。
四、数据挖掘应用 如何做好关联分析
数据挖掘应用:如何做好关联分析
说起关联分析,也许是太过于专业了,但你应该听说过啤酒与尿布的典型案例,啤酒与尿布就是关联分析的典型,让无数的人都对该规则津津乐道,但这个都已经成为过去了,现在数据增长及产品增长飞速,会出现越来越多啤酒与尿布的规则指导市场运营。
关联分析具体能用来做什么呢?
可以一句话来概括:最大限度地从你口袋里面掏出更多的钱买我的产品。
1.通过关联规则,推出相应的促销礼包或优惠组合套装,快速帮助提高销售额。如前面所说的:飘柔洗发水+玉兰油沐浴露、海飞丝洗发水+舒肤佳沐浴露等促销礼包;还比如全家里面推出的牛奶+面包、豆奶+面包的早餐组合。
2.零售超市或商场,可以通过产品关联程度大小,指导产品合理摆放,方便顾客最购买更多其所需要的产品。最常见的就是超市里面购买肉和购买蔬菜水果等货架会摆放得很近,目前就是很多人会同时购买肉与蔬菜,产品的合理摆放也是提高销售的一个关键。
3.进行相关产品推荐或者挑选相应的关联产品进行精准营销。最常见的是你在亚马逊或京东购买产品的时候,旁边会出现购买该商品的人,有百分之多少还会购买如下的产品,快速帮助顾客找到其共同爱好的产品。物以类聚,人以群分。例如,穷人一般和穷人在一起,富人也喜欢和富人在一起。还有数据挖掘的人喜欢和数据挖掘的人打交道,都离不开这些鸟道理。
4.寻找更多潜在的目标客户。例如:100人里面,购买A的有60人,购买B的有40人,同时购买A和B的有30人,说明A里面有一半的顾客会购买B,反推而言。如果推出类似B的产品,除了向产品B的用户推荐(因为新产品与B的功能效果比较类似)之外,还可以向A的客户进行推荐,这样就能最大限度地寻找更多的目标客户。
如何做好关联分析呢?
1.必须进行大量的产品梳理工作,区分不同等级的层次关系,并且给相应的产品打上合适的标签。产品梳理是一项纯手工的并且需要耗费大量的人力及时间才能完成的。一般的企业,其产品不会很多,就比如P&G的产品或者其SKU数(库存量),也不过是几千个,但产品梳理的标准是很重要的。产品标准过于粗放,对于后期的关联分析意义不大;产品标准过于细化,如涉及到SKU的层面的话,关联分析出的规则也不一定很理想。所以选定好一个比较合理的产品梳理规范,对于关联分析的结果精准程度很重要。
如果对于大零售超市或商场,其SKU数一般都是几十万甚至上百万,产品梳理工作是一项很痛苦的工作,但如果要从数据角度进行产品运营,建议可以开展相应的产品梳理咨询项目,通过半年多的产品梳理,形成标准化的产品梳理流程及产品目录。过去的半年里,在对某商场的产品梳理时候,发现目前的产品体系还是漏洞百出,很多还是很不规范的。做好关联分析或数据运营,请从产品梳理工作开始。
2.建议选取SAS EM模块里面的关联分析模块。合适的工具是做好关联分析的关键。SPSS Clementine里面的关联分析模块,其实其对数据格式要求很严格,还是SAS的EM模块比较好用,纯图形化操作。
3.请深刻理解关联分析中的三度:置信度、支持度、提升度,同时不能忽略产品规模。如果规则的提升度很高,但其相关的置信度很小,说明其市场规模很小。市场经营必须同时考虑市场规模大小及精准程度大小的两个维度。如果该规则真的很精准,但其受众客户就只有几百个,对于销售额而言,一点都没有影响。而另外一条规则虽然提升度不是很高,但其受众客户涉及了几万人,对该部分客户进行营销,能够有效地扩大规模,大幅提高销售额。所以后期的营销规则选取也必须要切合实际的商业应用。
关联分析有哪些后遗症?
1.注意购买产品赠送礼品的人为因素影响规则。有些挖掘师或分析师在做出关联分析后,看到了几条提升度及置信度都很高的规则,就兴奋不已地告诉客户:我觉得产品A和产品B有很大的关联性,从数字上看,捆绑销售肯定能够取得很好的销售效果。当拿到这样的结果的时候,客户很镇定地说:“你不知道我们在某月的时候,大量开展了购买产品A即可免费赠送产品B的活动么?”杯具,坑爹。对于这个时候的挖掘师是很悲催的。在筛选关联规则的时候,必须对该企业过去一年开展的活动有了解,还必须对不同时间段的主推产品进行提前沟通,确保关联规则不受人为因素影响。
2.注意产品之间的位置摆放是否有很大的影响。在零售大商场中,产品摆放的位置对产品关联销售会产生很大的影响的,因为关联分析就是为了更方便地让顾客找到其需要的产品,购买更多其需要的产品。人流比较大的两个相隔货架之间的产品关联性比较大,在很多项目中会发现不少的这样规则。但其结果表明了货架关联性比较大,摆放在一起就肯定比较合理的。但在进行关联分析的时候,客户更希望能从其他不相隔的货架之间找出更好的关联销售机会,这决定了后期的关联规则挑选难题。
3.注意关联推荐的规则合理性及流失成本的大小。后期的关联推荐应用于主要是三个方面:1、重购:继续购买原来的产品;2、升级:购买更高档次的产品;3、交叉销售:购买相关的产品。如果该规则的客户本来是买了50块钱的产品的,发现关联规则里面出现了推荐其购买30块的同类型产品,这等于给客户降档推荐了,会让销售额大幅减少,销售机会白白浪费并且造成了损失,所以在进行关联推荐的时候,那些涉及到了降档的规则一定要剔除。
关联分析是一个很有用的数据挖掘模型,能够帮助企业做很多很有用的产品组合推荐、优惠促销组合,同时也能指导货架摆放是否合理,还能够找到更多的潜在客户,的确真正的把数据挖掘落到实处。
以上就是关于数据挖掘影响因素选择相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读:
海外数据调研答题赚钱是真的吗(海外数据调研答题赚钱是真的吗知乎)