学者谷

位置:首页 > 校园范文 > 其他

数据分析六部曲

其他1.97W

明确分析的内容和目的、数据收集、数据处理、数据分析、数据展现、报告撰写等6个步骤。

数据分析六部曲

明确数据分析的目的和内容是确保数据分析过程有效的进行的先决条件,以便明确数据分析方向,保证不迷失方向。

数据收集是按照确定的数据分析内容,收集相关数据的过程,它为数据分析提供了素材和依据。这里所说的数据包括第一手数据与第二手数据,第一手数据是指可以直接获取的数据,第二手数据是指经过加工整理后得到的数据。一般数据来源主要有数据库、互联网、公开出版物、市场调查等形式。

数据处理:

是指对收集过来的数据进行加工处理,形成适合分析的样式,它是数据分析必不可少的步骤。数据处理基本是从大量的、杂乱无章、难以理解的数据中推导出对解决问题有价值、有意义的数据。(数据处理主要包括数据清洗、数据转化、数据提取、数据计算等方法。)

数据分析:

主要是指通过统计分析或者数据挖掘技术对处理过的数据分析,从中发现数据的内部关系和规律,为解决问题提供参考。

数据分析与数据处理的区别:数据处理是数据分析的基础。通过数据处理,将收集到的原始数据转换为可以分析的数据形式,并保证数据的一致性和有效性。如果数据本身存在问题,那么即使采用最新进的数据分析方法,得到的结果也是错误的。

数据分析与数据挖掘的关系:数据挖掘就是一种高级的书分析方法,数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩瀚如烟的数据中找出所需要的数据,以满足用户的需求。数据挖掘主要侧重于解决四类数据分析问题:分类、聚集、关联、预测。

数据展现:

数据是通过表格和图形的方式呈现出来的,我们常说用图标说话就是这个意思。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等。也可以对这些图进行加工,展现出来我们所需要的图。一般情况下用图说明问题的就不用表格,用表格说明问题的就不文字。

报告撰写:

数据分析报告其实就是对整个数据分析过程的'一个总结与呈现。通过报告,把数据分析的起因,过程,结果及建议完整的呈现出来,以供决策者参考。数据分析报告一定要有建议和解决方案,作为决策者,需要的不仅仅是找出问题,最重要的是建议和解决方案,以便他们在决策时候做参考。所以数据分析师不仅仅需要掌握数据分析的方法,而且还需要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议和解决方案。

数据分析常用的指标和术语:

平均数:一般指的是算数平均数。算数平均数是非常重要的基础性指标。平均数是综合指标,它的特点是将总体内各单位的数量差异抽象化,代表总体的一边水平,掩盖总体内各单位的差异。

绝对数与相对数

绝对数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标。也就是数据分析中的常用指标,如:GDP,总人口等。

相对数是指由俩个有联系的指标对比计算而得到的数值,它是反映客观现象之间数量连续程度的综合指标。计算相对数的基本公式:相对数=比较数值(比数)/基础数值(基数)

说明:分母就是用作对比标准的指数数值,简称基数。分钟是用做与基数对比的指数数值,简称比数。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。

百分比与百分点:百分比是相对数的一种,它表示一个数是另一个数的百分之几,也称百分率或者百分数。百分比通常采用百分号来表示。由于百分比的分母都是100,也就是以1%作为度量单位,由于比较便捷,被广泛应用。百分点是指不同的时期以百分数的形式表示的相对指标的变动幅度。

频数与频率:频数是指一组数据中个别数据重复出现的次数。频率是指每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一边用百分数表示。

比例与比率:比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比率是指不用类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体各部分之间的关系。

倍数与番数:倍数与番数同样属于相对数。倍数是一个数吃了另一个数所得的商,倍数一般是表示数量增长或上升幅度而不适用于表示数量的减少或者下降。番数是指原来数量的2的N次方倍。

同比和环比:同比是指与历史同期进行比较得到的值,该指标主要是反映的是事物发展的相对情况。环比是指与前一个统计期进行比较得到的值,该指标主要是反映的是事物逐渐发展的情况。


标签:数据分析 六部