数据分析思路(数据分析思路怎么写)
大家好!今天让创意岭的小编来大家介绍下关于数据分析思路的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。
开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等
只需要输入关键词,就能返回你想要的内容,越精准,写出的就越详细,有微信小程序端、在线网页版、PC客户端
创意岭作为行业内优秀的企业,服务客户遍布全球各地,如需了解SEO相关业务请拨打电话175-8598-2043,或添加微信:1454722008
本文目录:
一、数据分析的五大思维方式
数据分析的五大思维方式
发现很多朋友不会处理数据,这个过程叫做数据清洗,中间可能涉及到编程,分析人员是应该学点编程的,后面抽时间给大家介绍一下,今天不讲这个。
今天要讲数据分析的五大思维方式。
首先,我们要知道,什么叫数据分析。其实从数据到信息的这个过程,就是数据分析。数据本身并没有什么价值,有价值的是我们从数据中提取出来的信息。
然而,我们还要搞清楚数据分析的目的是什么?
目的是解决我们现实中的某个问题或者满足现实中的某个需求。
那么,在这个从数据到信息的过程中,肯定是有一些固定的思路,或者称之为思维方式。下面零一给你一一介绍。(本文用到的指标和维度是同一个意思)
第一大思维【对照】
【对照】俗称对比,单独看一个数据是不会有感觉的,必需跟另一个数据做对比才会有感觉。比如下面的图a和图b。
图a毫无感觉
图b经过跟昨天的成交量对比,就会发现,今天跟昨天实则差了一大截。
这是最基本的思路,也是最重要的思路。在现实中的应用非常广,比如选款测款丶监控店铺数据等,这些过程就是在做【对照】,分析人员拿到数据后,如果数据是独立的,无法进行对比的话,就无法判断,等于无法从数据中读取有用的信息。
第二大思维【拆分】
分析这个词从字面上来理解,就是拆分和解析。因此可见,拆分在数据分析中的重要性。在派代上面也随处可见“拆分”一词,很多作者都会用这样的口吻:经过拆分后,我们就清晰了……。不过,我相信有很多朋友并没有弄清楚,拆分是怎么用的。
我们回到第一个思维【对比】上面来,当某个维度可以对比的时候,我们选择对比。再对比后发现问题需要找出原因的时候?或者根本就没有得对比。这个时候,【拆分】就闪亮登场了。
大家看下面一个场景。
运营小美,经过对比店铺的数据,发现今天的销售额只有昨天的50%,这个时候,我们再怎么对比销售额这个维度,已经没有意义了。这时需要对销售额这个维度做分解,拆分指标。
销售额=成交用户数*客单价,成交用户数又等于访客数*转化率。
详见图c和图d
图c是一个指标公式的拆解
图b是对流量的组成成分做的简单分解(还可以分很细很全)
拆分后的结果,相对于拆分前会清晰许多,便于分析,找细节。可见,拆分是分析人员必备的思维之一。
第三大思维【降维】
是否有面对一大堆维度的数据却促手无策的经历?当数据维度太多的时候,我们不可能每个维度都拿来分析,有一些有关联的指标,是可以从中筛选出代表的维度即可。如下表
这么多的维度,其实不必每个都分析。我们知道成交用户数/访客数=转化率,当存在这种维度,是可以通过其他两个维度通过计算转化出来的时候,我们就可以【降维】.
成交用户数丶访客数和转化率,只要三选二即可。另外,成交用户数*客单价=销售额,这三个也可以三择二。
另外,我们一般只关心对我们有用的数据,当有某些维度的数据跟我们的分析无关时,我们就可以筛选掉,达到【降维】的目的。
第四大思维【增维】
增维和降维是对应的,有降必有增。当我们当前的维度不能很好地解释我们的问题时,我们就需要对数据做一个运算,增加多一个指标。请看下图。
我们发现一个搜索指数和一个宝贝数,这两个指标一个代表需求,一个代表竞争,有很多人把搜索指数/宝贝数=倍数,用倍数来代表一个词的竞争度(仅供参考)。这种做法,就是在增维。增加的维度有一种叫法称之为【辅助列】。
【增维】和【降维】是必需对数据的意义有充分的了解后,为了方便我们进行分析,有目的的对数据进行转换运算。
第五大思维【假说】
当我们拿不准未来的时候,或者说是迷茫的时候。我们可以应用【假说】,假说是统计学的专业名词吧,俗称假设。当我们不知道结果,或者有几种选择的时候,那么我们就召唤【假说】,我们先假设有了结果,然后运用逆向思维。
从结果到原因,要有怎么样的因,才能产生这种结果。这有点寻根的味道。那么,我们可以知道,现在满足了多少因,还需要多少因。如果是多选的情况下,我们就可以通过这种方法来找到最佳路径(决策)
当然,【假说】的威力不仅仅如此。【假说】可是一匹天马(行空),除了结果可以假设,过程也是可以被假设的。
我们回到数据分析的目的,我们就会知道只有明确了问题和需求,我们才能选择分析的方法。
顺带给大家讲讲三大数据类型。这个属于偷换概念,其实就是时间序列的细分,不是真正意义上的数据类型,但这个却是在处理店铺数据时经常会碰到的事情。数据放在坐标轴上面分【过去】丶【现在】和【未来】
第一大数据类型【过去】
【过去】的数据指历史数据,已经发生过的数据。
作用:用于总结丶对照和提炼知识
如:历史店铺运营数据,退款数据,订单数据
第二大数据类型【现在】
【现在】的概念比较模糊,当天,当月,今年这些都可以是现在的数据,看我们的时间单位而定。如果我们是以天作为单位,那么,今天的数据,就是现在的数据。现在的数据和过去的数据做比较,才可以知道现在自己是在哪个位置,单有现在的数据,是没什么用处的。
作用:用于了解现况,发现问题
如:当天的店铺数据
第三大数据类型【未来】
【未来】的数据指未发生的数据,通过预测得到。比如我们做得规划,预算等,这些就是在时间点上还没有到,但是却已经有了数据。这个数据是作为参考的数据,预测没有100%,总是有点儿出入的。
作用:用于预测
如:店铺规划,销售计划
三种数据是单向流动的,未来终究会变成现在,直到变成过去。
他人我不知道,但我自己非常喜欢把数据往坐标轴上面放,按时间段一划分,每个数据的作用就非常清晰。
以上是小编为大家分享的关于数据分析的五大思维方式的相关内容,更多信息可以关注环球青藤分享更多干货
二、数据分析中常用分析思路-对比分析解析(二)
对比是识别事物的基本方法对比——横向、纵向及多维度对比比值比率背后的逻辑指标的逻辑与管理指标对标的层次和维度标杆管理与榜样的力量。
最常见的对比是大小的对比、数量的对比,例如销售额的对比、人数的对比、时间长短的对比。使用不同的对比指标会得到不同的结论。
我们把对比标准的选择叫作对比的视角,对比视角不同,就会得出不同的结论。例如将小强和小明对比,从身高的角度对比,就有了高矮的判断,我们还可以从学习成绩、年龄等其他的视角进行对比。在对比人的时候,我们可能会有更加综合的维度,例如在对比客户的时候,我们会综合考虑各种因素;在对比各种变化的原因时,我们也有各种模型。对比随时随地都在发生,我们所要做的就是找到合适的对比视角,针对同样的问题,发现不同的洞察。
对第一层级的变量做了对比之后,我们还可以形成综合的变量。将第一层级的变量(直接描述事物的变量,如长度、数量、额度、宽度、高度等)加工之后得到的变量,称作二级变量。在进行二级变量对比的时候,常用的有增速、效率、效益等指标。
增速是指在一定时间范围内数量变化的比率。两家公司、两个产品、两个市场、两个客户、两个渠道,都可以对比增速。而对比的时间周期可以按照月份、季度或者年度来设定。2015年,美国的国内生产总值为17.4万亿美元,中国的国内生产总值为10.4万亿美元,美国全年经济的增速是2.4%,中国全年经济的增速是6.9%。这就是速度的比较,如下图所示。我们很自然地会问,如果按照这个增速发展下去,中国国内生产总值赶超美国大概要等到哪一年?2027年!
效率是投入与产出之间的比值,是资源利用能力的评价指标。效率对比就是看谁能够利用更少的投入产出更多的价值。对比两家企业的效率,可以看出哪家企业更有发展潜力,更有竞争力。
常用的衡量人力资源效率的指标是人均产值(一定时期内平均每个人产出的价值)、元当产值(公司每发出一元工资所带来的产值),如下图所示。前者是把人数作为投入要素来评价的,而后者是把人员工资作为投入要素来评价的。如果一家公司的销售额和利润实现了快速且稳定的增长,但是在公司成长的过程中,物质要素的效率在提高,而劳动力要素的效率却在下降,即人均产值在下降,那就意味着随着公司的发展,新招聘的人员的平均水平在下降,而工资却在不断增长,每一元工资投入的产出在大幅度下降。
一些表面繁荣的公司,背后却蕴藏着巨大的人力资源危机,公司的人力资源整体水平在下降,这样的公司是很难持续发展的,特别是到了市场竞争越来越激烈时期,人力能力跟不上公司的发展。如果公司在发展的过程中看不到这个问题,将来就会成为非常关键的问题——公司在快速发展时,所有的问题都不是问题,但到了公司发展受阻时,一个小问题都会成为天大的问题。很多公司在危难时期面临的问题都是在顺境中衍生的。所以,对一些效率指标的跟踪非常重要。
对于相对比较复杂的事物,某一个维度的分析往往只代表一个侧面,不能代表事物的全貌。而如果对比的维度太多,我们往往就不能得到一个明确的答复。
例如小明比小强高10厘米,但小强比小明帅;有的客户购买力不强,但他能够带动朋友来购买公司的产品和服务。这就需要综合考虑各个因素,也给数据分析工作带来了新的挑战——我们需要找到一个更加简单的方法来评价事物。
所谓的指标,就是各种评价标准经过加权综合之后得到的具有一定意义的评价体系。例如消费者物价指数就是衡量物价变化的指标。蔬菜价格在上涨,但大米的价格在下降,肉、禽、蛋、奶的价格也在下降,我们就不能说整体的物价在上涨。那么如何评价物价的波动呢?可以用衡量物价的综合指标——CPI(ConsumerPriceIndex,消费者物价指数)或工业价格指数PPI(ProducerPriceIndex,生产者物价指数)等指标来衡量物价的波动。
消费者物价指数(CPI)是综合了大多数人的消费习惯,按照消费产品的比例加权计算消费者综合的消费价格波动,不同时期的CPI组成也不同,不同国家也会根据消费者不同的消费习惯组合成不同的消费者物价指数。因为中国地域广阔,消费者的消费习惯差异很大,所以CPI带给大家的感觉也会不同。CPI的本质是用来衡量消费者所拥有的现金在特定时期生活消费购买力变化的指标。PPI则是指工业生产者综合购买力的指标。
在企业管理中也会采用一些综合的评价指标来进行对比。例如,最为典型的就是KPI(KeyPerformanceIndicator,关键业绩指标),它是根据公司对某个岗位的要求,以及在各个维度上要求的重要程度的不同,设定不同的权重,从而形成的一个综合评分指标。不同岗位在不同公司的KPI设定肯定会不同。为了能够更好地让业绩指标为公司战略服务,曾经有知名的咨询公司提出一个通过综合考虑4个方面要素而组合出来的KPI指标,叫作BSC(BalanceScoreCard,平衡记分卡),其考虑到每个岗位的财务指标、客户指标、成长指标和流程指标。不同公司中不同岗位的BSC肯定不同,但基本涵盖的是4大类指标的综合加权平均值。
数据分析师有一个关键的职能就是要设计“指标”来对比。设计指标与应用指标有着天壤之别,很多人在应用别人的指标的时候还会出错,如果要真正设计指标,则需要对事物之间的逻辑关系有着深刻的理解。
例如,笔者服务过一家经营婴幼儿食品的公司,其产品包括配方奶粉、米粉、水果泥和婴幼儿安全营养补充零食。他们的业务与一个市场中人口的出生率、这个市场的整体购买力、消费者对婴幼儿食用包装食品的观念有直接的关系,还与政府对这个市场中的食品安全管控力度有关系。分析了这么多关系之后,他们希望能够构建一个指标反映一个市场对公司的吸引力,从而能够让公司根据这个市场吸引力指标来投资。
而市场的吸引力还与市场中的竞争强度有关系,如果在这个市场中竞争者众多,前几名的竞争者实力雄厚,后台资本实力强大,那么这个市场的吸引力就小;如果这个市场几乎是空白市场,那么这个市场的吸引力就大。
考虑到以上因素,我们需要建立一个综合指标来评价这个市场的吸引力,最好能够直接得到一个分数进行直观判断,例如80分的市场比75分的市场有5分的吸引力差异,60分的市场是30分的市场的吸引力的两倍。那么如何设计这个指标呢?我们需要各种数据的加权计算。
在不考虑市场规模的情况下,我们可以先构建一个指标指数模型:
Y=aX1+bX2+cX3+dX4+eX5+fX6+…
其中:
Y:市场吸引力指标值。X1:婴儿出生率(或者每年婴儿出生的数量)。X2:市场购买力平价指标。X3:消费者对婴幼儿包装食品的态度。X4:企业信誉对消费者购买婴幼儿产品的影响。X5:政府对婴幼儿食品的管控力度。
a,b,c,d,e,f…是系数,代表影响的程度。
我们可以构建一个加法模型。加法模型代表各个要素之间并没有相互的影响,各个要素独立地对市场吸引力产生影响。
当然我们也可以构建成乘法模型:
Y=aX1×X2×X3×X4×X5×X6×…
此乘法模型假设各个要素之间是相互影响的。例如如果消费者的信心不足,则购买力会因此被大幅度缩小。
我们可以追踪各种历史数据,将不同阶段的数据放到一起,形成多个数据组合方程式,通过近似求解的方法实现对模型的构建。最终得到一个计算市场吸引力指标的数学模型:
Y市场吸引力=f(X1,X2,X3,X4,X5,X6,…)这个数学模型可以用来指导公司未来的市场投资实践,也可以在公司不断拓展市场的过程中不断地验证这个数学模型,不断完善各种假设、指数、系数、计算方法,最终形成适合公司自我发展过程中的扩张模型。
这是本书第一次提到数学模型的构建,这些内容需要读者具有数学基础。如果以上的内容让你感到很难理解,那么完全可以跳过这部分内容;如果你是从事数据分析专业的人士,那么这部分内容对你来说应该不太难;如果你不是从事数据分析专业的人士,那么只需要了解这些内容就足够了,不需要深究,更不需要自己去构筑完成一个数学模型;如果你是公司的高层管理者,那么阅读这部分内容可以让你更好地了解一个数据模型产生的过程,从而能够理解数据分析师每日的工作内容。
下面就以CPI来进行示范说明。CPI本质上是一个构筑数学模型后形成的综合数据指标。
假设一个居民每个月要吃掉5斤猪肉、3斤鸡肉、2斤牛肉、1斤羊肉、0.5斤鸭肉,0.5斤鹅肉、5斤白面、5斤青瓜……经过大量的统计调研,我们得到全国人民的饮食结构是如上的构成要素。
我们调研所有的菜市场(其实是抽样代表)中所有这些产品的价格,得到本月该居民的消费支出,假定为1000元;下个月他同样购买这些产品来满足自己的日常生活需要,但是各个产品的价格发生了变化,用当月新的产品价格重新计算了他的消费支出情况,得到的结果是1050元,那么将该月的消费支出与上个月的消费支出进行对比,消费者价格上涨了(1050-1000)/1000=5%。如果把上个月的CPI认定为100元,则本月的CPI为105元,CPI上涨5%。这就是对CPI即消费价格指数的形象描述。当然,实际的CPI计算会比这个要复杂,因为我们监控的产品品种比我列举的要多,获取产品价格的渠道和监测点也要多得多。
指数在整个经济领域中有着重要的地位,有的指数直接代表了经济的风向标,甚至左右着经济的发展。代表一个经济体、一个经济实体或者公司的指标有信誉评级指标,价格指标有CPI和PPI,短期经济发展兴衰指标有PMI(采购经理人指数)……
我们对数据进行对比分析的时候,除简单地直接对比数据外,还需要构建一些可以重复使用或者在某个部门、某个业务领域、某个情景下进行评测的指标。这些指标背后可以是多个数据的综合分析结果,也可以是某个业务指标的合集。数据分析师要根据业务需求做出各种指标的模型,并形成长期的观测数据集,从而验证这种指标的合理性,只有通过长时期实践检验的指标才可以成为公司持续使用的对比指标。一个综合指标企业使用越久,就越完善,并且可以体现出公司管理的特色。
当企业的管理指标逐步丰富之后,你会发觉企业的管理文化和管理体系都在发生着潜移默化的改变。之前管理者的职责是根据生产经营状况做出决策并确保决策的执行,在执行的过程中形成事前、事中和事后的反馈,并不断调整决策的执行过程。
当数据承担起更多的这种分析和决策的过程时,管理者的职责逐渐从“思考型”向“指挥型”过渡,并且对管理者的聪明程度、经验能力的要求反而变弱了。同样能力的管理者所能够管理的人员数量在逐步发生变化,管理幅度在增加,一些复杂的管理工作逐步由数据和数据指标在发挥作用,一些分析和判断性的工作由智能的系统来完成,企业组织逐步转向扁平化、社群化。
全文摘自《企业经营数据分析-思路、方法、应用与工具》赵兴峰著
上期内容:
数据分析中常用分析思路-对比分析解析(一)、
①对比是识别事物的基本方法
②对比——横向、纵向及多维度对比
下期内容预告:
数据分析中常用分析思路-对比分析解析(三)
①对标的层次和维度
②标杆管理与榜样的力量
三、现在有一批数据要进行分析,可以从哪些方面进行?
可以从如下三个方面:现状分析、原因分析、预测分析。
1.明确分析目的与思路:一切以解决业务问题为中心,依据分析目标明确思路,打开分析视角,使数据分析框架体系化。
2.数据收集与预处理:数据来源有Excel/CSV/SQL数据库/NoSQL数据库/Hive数据仓库/外部数据,从数据来源收集数据后需要做清洗工作,包括缺失值、错误值、重复值、异常值等都要处理好,当然还有转换、拆分、合并等等工作也可能要做,这样才能满足后续数据分析的要求。
3.数据分析与挖掘:使用各种数据分析方法与分析工具(如Excel/SQL/SPSS/SAS/Tableau/PowerBI/Python)进行分析挖掘。
4.数据可视化并生成报告:使用专业化图表,也可以结合表格,最后以报告方式输出数据分析成果。
四、数据分析怎么做?
什么是数据分析呢,浅层面讲就是通过数据,查找其中蕴含的能够反映现实状况的规律。
专业一点讲:数据分析就是适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总、理解和消化,以求最大化的开发数据的功能,发挥数据的作用。
那么,我们做数据 分析的目的是什么呢?
事实上,数据分析就是为了提取有用的信息和形成结论而对数据加以详细的研究和概括总结的过程。
数据分析可以分为:描述性数据分析、探索性数据分析、验证性数据分析
工作中我们运用数据分析的作用有哪些?
1、现状分析:就是企业运营状况的分析,主要是各项指标的监控以及日报、周报、月报等
2、原因分析:需求分析,多数是针对运营中出现的问题进行剖析,找出出现问题的因素以便于解决问题
3、预测分析:针对以后的运营情况做出分析报告,对公司以后的发展趋势做出有效的预测,对公司的发展目标和策略制定做出有力的支撑。
最重要的一点:
我们如何做数据分析呢,换一句话说就是如何进行数据分析,是怎样的流程?
我们来看数据分析的六部曲
1、明确分析目的和思路:
这一定很重要,你想通过数据分析得到什么,你想通过数据分析告诉别人什么,这是你做数据分析的首要问题,分析不能是漫无目的的,一定要明确思路,有目的性、有计划性的去做数据分析。找好角度、指标、以及分析逻辑尤为重要。
2、数据收集,这里不做过多的说明,一般情况下,数据来源都会可靠有效。我们要做的只是把我们需求的数据get即可。
3、数据处理:
主要包括数据清洗、数据转化、数据提取、数据计算等方法,数据分析的前提是要保证数据质量,如果数据质量无法保证,分析出来的结果也没法得到有效的利用,甚至会对决策者造成误导的行为。
4、数据分析:
首先要明确数据处理和数据分析的区别:数据处理只是数据分析的基础,我们做数据处理就是为了保证数据形式合适,保证数据的一致性和有效性。
5、数据展现:
数据展现就是把数据分析的结果,用可视化的图标形式展现出来,用一种简单易懂的方式表达出你分析的观点
6、撰写报告:
数据分析报告其实就是对整个数据分析过程的一个总结与呈现,通过报告把数据分析的起因、过程、结果及建议完整的呈现出来,供决策者参考。
以上就是关于数据分析思路相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。
推荐阅读: