目录
1. 航班数据格式
- 1. 航班数据格式
- 2. 开启数据库文件上传功能
- 3. 上传CSV文件
- 4. 创建图表
- 5. Dashboard操作
- 6. Pivot表
- 7. 折线图(多线)
- 8. 给Dashboard添加markdown描述
- 9. 给dashboard添加过滤器
- 10. 发布Dashboard
- 11. 给charts图表和Dashboard添加注释
- 12 高级分析
- 12.1 创建基础图表
- 12.2 滚动求均值
- 12.3 时间比较
- 12.4 数据重采样
- 13 最终的Dashboard图片
主要字段信息如下:
- 部门:用Orange、Yellow、Purple代替
- 票价
- 舱的类型
- 单程或往返
- 航班日期
- 航班起始地和目的地
- 航班飞行距离
下载方式: 从github下载地址进行下载,用浏览器直接打开文件了,可以使用linux的wget命令进行下载,再上传到本地
2. 开启数据库文件上传功能
此时会在mysql中创建表tutorial_flights, 且superset的table数据集中也会有tutorial_flights数据集
点击和拖拽图表的右下角,可以修改图表的大小,最后点击保存
- 其中ABC表示字符串,#表示数字,时钟符号表示时间
鼠标放到 markdown选项上,然后按住鼠标左键进行拖拽,移动到合适位置,松开鼠标即可
- 从上面的两张图可以看出,在Dashboard的过滤器中应用过滤后,Dashbaord的其它图表都会应用此过滤条件
可以点击编辑按钮,然后拖拽图表,进行位置的调整,最后保存即可
- 可以查看charts图表和Dashboard都已经有注释了
- 滚动求平均值,本示例滚动周期为7天
- 10月7号的值为10月1号-10月7号的平均值,10月8号的值为10月2号-10月8号的平均值
- 因为基础图表的时间范围时10月1号到10月31号,所以10月1号到10月6号没有滚动平均值
- 例如10月10号的值 = 10月10号的值 - 10月3号的值
- 10月10号实线的值:表示10月10号的真实值
- 10月10号虚线的值:表示10月3号的真实值
- 采样周期为7天,取此周期的中位数
- 每7天有一个数据点
- 例如10月15号的值 = 10月9号到10月15号,这7天的中位数值
- 所以图表只有10月1号、10月8号、10月15号、10月22号、10月29号,共5个值