您当前的位置: 首页 >  ar

段智华

暂无认证

  • 0浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

《Spark商业案例与性能调优实战100课》第14课:商业案例之纯粹通过DataSet进行电商交互式分析系统中特定时段购买金额Top10 和访问次数增长Top10

段智华 发布时间:2017-01-22 20:54:44 ,浏览量:0

《Spark商业案例与性能调优实战100课》第14课:商业案例之纯粹通过DataSet进行电商交互式分析系统中特定时段购买金额Top10

和访问次数增长Top10

  结合生产实际,json格式换成parquet格式,数据有问题,改回json val userInfo=spark.read.format("parquet").parquet("parquet file's path ...") val userAccessLog=spark.read.format("parquet").parquet("parquet file's path ...") val userInfo=spark.read.format("json").json("json file's path ...") val userAccessLog=spark.read.format("json").json("json file's path ...") val userInfo=spark.read.json("json file's path ...") val userAccessLog=spark.read.json("json file's path ...") //检查数据 usersInfo.select("time").show() usersInfo.show() //检查schema userInfo.printSchema() userAccessLog.printSchema()

关注
打赏
1659361485
查看更多评论
立即登录/注册

微信扫码登录

0.0532s