凌云时刻 · 技术
导读:这是一篇关于如何用excel做数据分析的案例。目的是帮助大家,在遇到小型数据样本时,快速利用excel做分析。所以本篇文章的重点是分析思路+数据处理+可视化的实现,因为数据来源于网络,所以不做深入解析。
需求说明
分析某电商企业销售趋势,找到影响销售增长的因素。同时分析不同市场产品销售状况,找到不同市场的销售差异。挖掘不同产品的销售状况,找到不同产品的销售差异。对用户群体进行分析,对企业用户的画像和价值进行挖掘。从上述分析中得出结论,并根据分析结果,提出自己对此企业未来发展的一些想法和建议。
数据说明
本项目数据为某电商平台全年每日订单详情数据和用户信息数据,包括两个数据表,销售订单表和用户信息表。
其中销售订单表为每个订单的情况明细,一个订单对应一次销售。这两个表的表结构分别为:
销售订单表结构:
用户信息表结构:
分析思路
本项目主要分为三个维度,分别是用户画像,针对用户群体进行分析,找出平台的主力军特点有哪些;商品维度上,找出商品在不同市场的销售差异等;用户价值维度上,主要根据用户的消费行为,挖掘出其内在的规律。分析的详细思路,如下:
数据处理(Excel)

最终数据状态:"多一分则肥,少一分则瘦",那么常用的清洗方法主要有以下三种。
重复数据处理
函数法 COUNTIF()
重复标记 =COUNTIF(A:A,A2)
第二次重复标记 =COUNTIF(A$2:A2,A2)
两种结果对比如下 :
高级筛选法 选中将要处理的数据区域,点击菜单栏里【数据】——【排序和筛选】里选择【高级】,会弹出高级筛选。如下操作:
条件格式 选中将要处理的数据区域,点击菜单栏里【开始】——【条件格式】里选择【突出显示单元格规则】——【重复值】。如下操作:
数据透视表 数据透视表一样能计算数据重复的频次。而且比COUNTIF更加简单易用,只需要拖动。首先,选中第一行标题数据左侧,按Shift+Ctrl+End/下箭头,选中全部数据后——【插入】——【数据透视表】,如下:
我们上面已经学会了各种重复值的处理,那么在实际业务中,通常会删除重复值。选中全部数据——点击——菜单栏里【数据】——【删除重复项】,如下:
缺失数据处理
一般可以接受的缺失值的标准是在10%以下。通常的处理方式如下:
平均值填充;
统计模型计算出来的值;
将缺失值的记录删除掉;
保留,只在做相应的分析中做必要的排除
批量填充 如何把下面的表格的合并单元格拆分开,转化成规范的数据。
选择要转换的区域——【开始】——【合并后居中】——即取消单元格合并——继续选中要转换的区域——按Ctrl+G——弹出【定位】——【定位条件】,选择空值——确定——继续在A3单元格中输入"=",按上箭头,再按Ctrl+Enter,自动填充完成。
注:批量去除公式:选中数据,粘贴为数值,这样会提升excel的整体运行效率。下面,我们需要利用批量填充,处理销售订单表中的产品名称字段,批量删除掉数值,只保留产品名。新建一列空白列,先输入几个正确的产品名称,按Ctrl+E,快速智能填充。
查找和替换 快捷键分别是:Ctrl+F;Ctrl+H
空格数据处理
直接替换空格 Ctrl + H
特殊空格,要用trim()

字段合并
CONCATENATE()
&
DATE()
字段匹配
能够实现的是表里没有的数据,但是其他表有的,通过对应的共同关键字(数据类型必须相同)进行匹配。现在,我们将用户表和订单表进行合并,使得订单表的字段更加丰富,为接下来分析(消费的主力军特征)做准备。想要实现的结果,如下:
实现方式 VLOOKUP,语法如下:
VLOOKUP(要查找的值,查找的范围,属于查找范围的第几列(序列号),模糊/精确查找) 通过上面的语法,我们能够成功的获取到性别这一列数据,但是还有几个字段,如果通过复制粘贴的形式,修改序列号的话,效率太慢了。我们有更高效的方式。如下:
如上,序列号的位置通过COLUMN函数定位列,记得对行加绝对引用$。这样的话,直接向右,向下拖拽,就会自动补全字段内容。

字段拆分
分列 现在我们已经成功合并成了一个大表,接下来,要对付款时间进行分列,拆分成年,月形式,方便后面作可视化。首先选中【单价】列右键——【插入】——同样的方式插入三个空白列——复制一列【付款时间列】,再分别命名列名为年、月——选中【付款时间】列——【数据】——【分列】——【下一步】——【其他】输入"/"——【完成】
函数(截取字符串):LEFT();RIGHT();MID()
随机抽样
RAND():返回0~1之间的小数; 如果想返回 60~70 之间的,=INT(RAND()*10+60)
RANDBETWEEN():返回介于指定数字之间的随机数,=RANDBETWEEN(60,70)

简单计算
函数计算
日期计算 求年龄函数实现方式:=DATEDIF(D2,TODAY(),"Y")
数据分组 项目的需求是根据年龄对用户打标签(小于21岁,标记为"00后";大于21岁并且小于31,标记为"90后";大于31岁并且小于41,标记为"80后";大于41岁并且小于51,标记为"70后"),有下面两种实现方式。
方式一:
IF() IF(W221,W231,W2
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?


微信扫码登录