您当前的位置: 首页 >  大数据

哆啦A梦_i

暂无认证

  • 0浏览

    0关注

    629博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

【2019全国职业技能大赛大数据技术】任务二:3-数据采集(20分_题目)

哆啦A梦_i 发布时间:2021-03-30 19:15:57 ,浏览量:0

虚拟机 MySQL 数据库账号/ 密码 :root/Password123$ 具体任务要求:1、 使用 chrome 浏览器,查找网站异步请求的数据,在计算机桌面“GZ-032 竞赛文档”文件夹“XXX-02.docx(XXX 代表赛位号、02 代表任务二)”文件中创建并编写完成下表:

内容网页源码对应字段酒店评分 酒店名称 酒店星级 用户点评数 

(示例表)

内容网页源码对应字段北京Province中国Country

2、 完善 hotelscrawl.py 中内容,将函数内容截图并保存。 1) 将完整的 start_requests 函数内容截图并保存; 2) 将完整的 get_city 函数内容截图并保存; 3) 将完整的 get_page 函数内容截图并保存; 4) 将完整的 get_hotel_id 函数内容截图并保存; 5) 将完整的 parse 函数内容截图并保存。3、 根据爬取字段,在 MySQL 中创建 crawl 数据库,在该数据库中创建 hotels 表,并查看表结构,将查看结果(含字段总行数)截图并保存。4、 完善 pipelines.py 中内容,将函数内容截图并保存。 1) 将完整的 process_item 函数内容截图并保存。5、 爬虫程序运行结束后查看MySQL数据库,按seq倒序排序,返回前4行数据,将命令与查看结果截图并保存。

答案已更新请查收任务二:3-数据采集(20分_答案)

关注
打赏
1556978864
查看更多评论
立即登录/注册

微信扫码登录

0.0364s