关于爬取京东手机图片:之前一直使用python2加xpath来完成这个任务。本篇介绍如何使用python3加正则表达式来完成。使用的书籍《精通Python网络爬虫》中的案例代码不太适用了,在这里稍作改进。
首先来观察网站,进入京东首页,点击“手机/运营商/数码”中的手机,再点击“热门分类”中的“全部手机”。
(1)观察网址:点击下面的页数观察网址变化,可以得到有规律的网址“https://list.jd.com/list.html?cat=9987,653,655&page=1”。
(2)点击右键选择检查(我用的google浏览器),观察手机部分的源代码,构造第一个正则表达式:part1=’
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?