您当前的位置: 首页 >  爬虫

黑马蓝汐

暂无认证

  • 3浏览

    0关注

    89博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

爬虫中数据提取概述

黑马蓝汐 发布时间:2021-11-19 22:38:54 ,浏览量:3

每日分享:

我们曾经如此渴望命运的波澜,到最后才发现,人生最曼妙的风景竟是内心淡定与从容。我们曾经如此期盼外界的认可,到最后才知道,世界是自己的,与他人毫无关系。

一、响应内容的分类
  • 结构化
    • json数据(高频出现)
      • json模块
      • re模块
      • jsonpath模块
    • xml数据(低频出现)
      • re模块
      • lxml模块
  • 非结构化
    • html
      • re模块
      • lxml模块
二、xml以及html的区别 数据格式描述设计目标XML可扩展标记语言被设计为传输和存储数据,其焦点是数据的内容HTML超文本标记语言显示数据以及如何更好的显示数据
  • html
    • 超文本标记语言
    • 为了更好地显示数据,侧重点是为了显示
  • xml
    • 可扩展标记语言
    • 为了传输和存储数据,侧重点是在于数据内容本身
三、常用数据解析方法

关注
打赏
1643043582
查看更多评论
立即登录/注册

微信扫码登录

0.0348s