您当前的位置: 首页 >  大数据

哆啦A梦_i

暂无认证

  • 2浏览

    0关注

    629博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

【2019全国职业技能大赛大数据技术】任务三:13-数据清洗与分析(25分_题目+答案<图片+分值>)

哆啦A梦_i 发布时间:2021-04-05 17:50:54 ,浏览量:2

【问题】

10、 近年来,随着我国旅游业的蓬勃发展,城市旅游业已成为重要的支柱产业和新的经济增长点,对于城市经济发展,塑造城市形象,优化产业结构发挥着巨大作用。一个城市旅游业的发展不仅需要具备独特的自然风光或者人文资源,还应具备一定旅游接待能力,保持良好的游客口碑。请根据原数据集在指定维度综合分析并获得城市的受欢迎程度排名,并写入指定的数据库或数据文件,截图并保存结果。详细描述: 1) 请以上述 3&4(题目数字编号)任务的输出结果作为输入数据源,编写 Spark 程序从城市的酒店总订单、用户评分及评论数角度综合分析并获得城市的受欢迎程度排名,取最受游客欢迎的 5 个城市形成新表table3_5,(权重分配说明:归一化城市酒店总订单 0.6,归一化用户评分0.2, 归一化评论数 0.2。)输出至 HDFS 文件系统中/hotelsparkhive4。具体任务要求: 1) 运行代码,从城市的酒店总订单、用户评分及评论数量角度综合分析并获得城市的受欢迎程度排名,统计最受游客欢迎的 5 个城市,将统计结果在控制台打印,将打印输出结果截图并保存(截图需包含打印语句输出结果的上下各 5 行运行日志); 2) 在 hoteldata 数据库中创建表 table3_5,并将统计的结果数据导入表中; 3) 查看 table3_5 中数据,将查询结果截图并保存。

【答案】

1)参考答案截图:红框区域结果一致得 1 分;

3) 参考答案截图:红框区域结果一致得 1 分;

 

 

关注
打赏
1556978864
查看更多评论
立即登录/注册

微信扫码登录

0.0380s