前言
嗨喽~大家好呀,这里是魔王呐 !
壁纸,有多种的类别和各种不同的风格,如:
风景、美女、唯美、动漫、花卉、节日等适合您的高清桌面壁纸
今天我们就来采集一下叭~
环境使用:-
Python 3.8 解释器
-
Pycharm 编辑器
-
win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests) 回车
-
在pycharm中点击Terminal(终端) 输入安装命令
1. 发送请求
模拟浏览器 对于url地址发送请求, 获取服务器返回响应数据
伪装 headers 请求头
2. 获取数据
3. 解析数据
提取我们想要的内容
4. 保存数据
代码
import requests # 用来发送请求模块
import re # 提取数据工具
response = requests.get(url=url, headers=headers)
response.encoding = 'gbk' # 获取网页内容,返回出现乱码
print(response.text) # 获取网页源代码
# 获取壁纸名字以及壁纸详情页url地址 从什么地方找什么样数据内容, 从response.text 里面找
# (.*?) 就是我们想要数据
html_info = re.findall(' ', response.text)
print(html_info)
response_1 = requests.get(url=link_url, headers=headers)
response_1.encoding = 'gbk'
# print(response_1.text)
img_url = re.findall('
关注
打赏