前言
嗨喽,大家好呀!这里是魔王呐~
- Python 3.8 解释器
- Pycharm 编辑器
- import re
- import requests >>> pip install requests
- win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
- 在pycharm中点击Terminal(终端) 输入安装命令
- 发送请求 模拟浏览器 对于url地址发送请求, 获取服务器返回响应数据 伪装 headers 请求头
- 获取数据
- 解析数据 提取我们想要的内容
- 保存数据
import requests # 用来发送请求模块
import re # 提取数据工具
for page in range(6, 11):
url = f'http://www.netbian.com/index_{page}.htm' # 发送请求
# headers 字典数据类型,
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36',
}
response = requests.get(url=url, headers=headers)
response.encoding = 'gbk' # 获取网页内容,返回出现乱码
print(response.text) # 获取网页源代码
# 获取壁纸名字以及壁纸详情页url地址 从什么地方找什么样数据内容, 从response.text 里面找
# (.*?) 就是我们想要数据
html_info = re.findall(' ', response.text)
print(html_info)
for link, title in html_info:
# http://www.netbian.com/desk/27062.htm
link_url = 'http://www.netbian.com' + link # 字符串拼接
response_1 = requests.get(url=link_url, headers=headers)
response_1.encoding = 'gbk'
# print(response_1.text)
img_url = re.findall('
关注
打赏
最近更新
- 深拷贝和浅拷贝的区别(重点)
- 【Vue】走进Vue框架世界
- 【云服务器】项目部署—搭建网站—vue电商后台管理系统
- 【React介绍】 一文带你深入React
- 【React】React组件实例的三大属性之state,props,refs(你学废了吗)
- 【脚手架VueCLI】从零开始,创建一个VUE项目
- 【React】深入理解React组件生命周期----图文详解(含代码)
- 【React】DOM的Diffing算法是什么?以及DOM中key的作用----经典面试题
- 【React】1_使用React脚手架创建项目步骤--------详解(含项目结构说明)
- 【React】2_如何使用react脚手架写一个简单的页面?