1、 使用 chrome 浏览器,查找网站异步请求的数据,在计算机桌面“GZ-032 竞赛文档”文件夹“XXX-02.docx(XXX 代表赛位号、02 代表任务二)”文件中创建并编写完成下表:(2 分) 参考答案见下表:网页源码对应字段每个字段一致得 0.5 分;
内容 网页源码对应字段 酒店评分 grade 酒店名称 hotel_name 酒店星级 star_level 用户点评数 num_comment
2、 完善 hotelscrawl.py 中内容,将函数内容截图并保存
1) 将完整的 start_requests 函数内容截图并保存;(2 分)
参考答案截图:每个红框区域 一致得1 分; (两个红框共 1 分 )
2) 将完整的 get_city 函数内容截图并保存;(5 分)
参考答案截图:每个红框区域 一致得 1分; (五个红框共 5 分 )
3) 将完整的 get_page 函数内容截图并保存;(1 分)
参考答案截图:每个红框区域 一致得 1 分;
4) 将完整的 get_hotel_id 函数内容截图并保存;(4 分)
参考答案截图:每个红框区域 一致得 1 分; (四个红框共 4 分 )
5) 将完整的 parse 函数内容截图并保存;(2 分)
参考答案截图:红框区域 每行代码 一致得 0.5 分; (四行代码共 2 分 )
3、 根据爬取字段,在 MySQL 中创建 crawl 数据库,根据爬虫字段,在该数据库中创建hotels 表,并查看表结构,将查看结果(含字段总行数)截图并保存;(1 分)
参考答案截图:红框区域 结果一致得 得 1 分;
4、 完善 pipelines.py 中内容,将函数内容截图并保存;
1) 将完整的 process_item 函数内容截图并保存;(1 分)
参考答案截图:红框区域 结果一致得 得 1 分;
5、 爬虫程序运行结束后查看 MySQL 数据库,按 seq 倒序排序,返回前 4 行数据,将命令与查看结果截图并保存。(2 分)
参考答案截图: 每个 红框区域 结果一致得1分;(两个红框共 2 分 )
