Python制作某火爆游戏资料查询助手

搬砖python中~ 发布时间：2022-03-23 22:05:31 ，浏览量：3

1、我们是不是要去获取这些数据《和平精英》武器配件 (爬虫部分) 首先：对于武器一个详情页url地址发送请求, 获取每个武器的url地址其次：对于每个武器的url地址发送请求然后获取每个武器的一些基本信息

2、爬虫代码实现思路

发送请求

url 唯一资源定位请求头 headers 字典形式请求体注意点： headers参数问题请求方式：get请求 / post请求 2. 获取数据

遇到到反爬怎么办，遇到加密怎么办：字体加密、JS加密、动态数据网页参数变化怎么找,在哪找 response.text：获取网页的文本数据、字符串 json() ：json字典数据怎么取值? 根据键值对取值 content 状态码

解析数据

方式很多种：

正则表达式 re bs4 xpath parsel (css选择器/xpath)

保存数据 (只要打印输入就可以了)

保存文本保存json 保存数据库：非关系型数据库关系型数据库开始敲代码需要爬取的数据：武器、配件、物资、载具

在这里插入图片描述

在发送请求之前是不是需要加一个请求头请求头: 把python代码伪装成浏览器对服务器发送一个请求然后服务器就会给我们返回一个response数据 user-agent :浏览器信息

import requests # 第三方模块
 
headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
}
response = requests.get(url=html_url, headers=headers)

先爬取解析武器的数据，优缺点、武器的伤害都全部爬取下来在这里插入图片描述

def get_arms_info():
    url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url=url)
    selector = parsel.Selector(response.text)
    # css选择器 就根据标签属性提取相关内容
    href = selector.css('#section-container .clear li a::attr(href)').getall()
    titles = selector.css('#section-container .clear li a::attr(title)').getall()
    # 通常我们要获取一个列表里面 每个元素 是不是要通过遍历 for循环
    zip_data = zip(href, titles)
    lis = []
    for index in zip_data:
        dit = {
            '物品名称': index[1],
            '详情页': index[0]
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print(pd_data)
    arms_num = input('请输入你要查询的武器序号: ')
    if int(arms_num)

关注

打赏

1688896170

查看更多评论

Python制作某火爆游戏资料查询助手

[ 申请 ]友情链接：