您当前的位置: 首页 >  游戏

搬砖python中~

暂无认证

  • 0浏览

    0关注

    95博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Python制作某火爆游戏资料查询助手

搬砖python中~ 发布时间:2022-03-23 22:05:31 ,浏览量:0

1、我们是不是要去获取这些数据《和平精英》武器配件 (爬虫部分) 首先:对于 武器一个详情页url地址发送请求, 获取 每个武器的url地址 其次:对于 每个武器的url地址发送请求 然后获取每个武器的一些基本信息

2、爬虫代码实现思路

  1. 发送请求

url 唯一资源定位 请求头 headers 字典形式 请求体 注意点: headers参数问题 请求方式:get请求 / post请求 2. 获取数据

遇到到反爬怎么办,遇到加密怎么办: 字体加密、JS加密、动态数据网页参数变化怎么找,在哪找 response.text:获取网页的文本数据、字符串 json() :json字典数据怎么取值? 根据键值对取值 content 状态码

  1. 解析数据

方式很多种:

正则表达式 re bs4 xpath parsel (css选择器/xpath)

  1. 保存数据 (只要打印输入就可以了)

保存文本 保存json 保存数据库: 非关系型数据库 关系型数据库 开始敲代码 需要爬取的数据:武器、配件、物资、载具

在这里插入图片描述 在这里插入图片描述

在发送请求之前是不是需要加一个请求头 请求头: 把python代码伪装成浏览器对服务器发送一个请求 然后服务器就会给我们返回一个response数据 user-agent :浏览器信息

import requests # 第三方模块
 
headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
}
response = requests.get(url=html_url, headers=headers)

先爬取解析武器的数据,优缺点、武器的伤害都全部爬取下来 在这里插入图片描述

def get_arms_info():
    url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url=url)
    selector = parsel.Selector(response.text)
    # css选择器 就根据标签属性提取相关内容
    href = selector.css('#section-container .clear li a::attr(href)').getall()
    titles = selector.css('#section-container .clear li a::attr(title)').getall()
    # 通常我们要获取一个列表里面 每个元素 是不是要通过遍历 for循环
    zip_data = zip(href, titles)
    lis = []
    for index in zip_data:
        dit = {
            '物品名称': index[1],
            '详情页': index[0]
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print(pd_data)
    arms_num = input('请输入你要查询的武器序号: ')
    if int(arms_num)             
关注
打赏
1662460581
查看更多评论
0.0493s