您当前的位置: 首页 >  Python

搬砖python中~

暂无认证

  • 4浏览

    0关注

    95博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

python带你采集评论数据,看看这个内容为啥吸引他(她)

搬砖python中~ 发布时间:2022-07-04 16:40:33 ,浏览量:4

前言

大家早好、午好、晚好吖~

目录(可点击自己想看的地方💗)
  • 前言
      • 本篇代码提供者: 青灯教育-自游老师
  • 环境使用:
  • 代码
  • 尾语

本篇代码提供者: 青灯教育-自游老师 环境使用:
  • Python 3.8
  • Pycharm
代码

网址删了一部分,我把删了的东西放评论区,大家自行添加一下哦~

# 导入模块
import pprint
import re
import requests
import csv
import pandas as pd


# f = open('评论.csv', mode='a', encoding='utf-8', newline='')
# csv_writer = csv.DictWriter(f, fieldnames=[
#     '用户',
#     '地区',
#     '评论',
#     '日期',
# ])
# csv_writer.writeheader()


url = 'https://m..cn/comments/hotflow?id=4784937075214225&mid=4784937075214225&max_id_type=0'
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

lis = []
for index in response.json()['data']['data']:
    content = ''.join(re.findall('[\u4e00-\u9fa5]+', index['text']))
    dit = {
        '用户': index['user']['screen_name'],
        '地区': index['source'].replace('来自', ''),
        '评论': content,
        '日期': index['created_at']
    }
    lis.append(dit)
    # csv_writer.writerow(dit)
    print(dit)
源码、解答、教程、资料有需要可以口裙:832157862
pd_data = pd.DataFrame(lis)
pd_data.to_excel('评论.xlsx')
尾语

好了,我的这篇文章写到这里就结束啦!

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

关注
打赏
1662460581
查看更多评论
立即登录/注册

微信扫码登录

0.0828s