您当前的位置: 首页 >  Python

搬砖python中~

暂无认证

  • 0浏览

    0关注

    95博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

Python爬虫基础讲解之什么是XPath及其语法介绍

搬砖python中~ 发布时间:2022-03-06 15:15:00 ,浏览量:0

什么是XPath

XPath (XML Path Language)是一门在 HTML\XML文档中查找信息的语言,可用来在HTML\XML文档中对元素和属性进行遍历。

html和xml的区别

在这里插入图片描述

xml的树结构


  Everyday Italian
  Giada De Laurentiis
  2005
  30.00


  Harry Potter
  J K. Rowling
  2005
  29.99


  Learning XML
  Erik T. Ray
  2003
  39.95

上面的xml内容可以表示为下面的树结构 在这里插入图片描述

xpath的节点关系

知识点:

  • 认识xpath中的节点
  • 了解xpath中节点之间的关系
  • 每个html的标签我们都称之为节点。(根节点、子节点、同级节点)

在这里插入图片描述

学习更多知识或解答疑问、源码、教程请点击 xpath语法

XPath使用路径表达式来选取XML文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

下面列出了最有用的表达式: 在这里插入图片描述

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果: 在这里插入图片描述

选取未知节点

在这里插入图片描述 在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果: 在这里插入图片描述

案例:

在这里插入图片描述

import parsel # str --> Selector对象具有xpath方法
提取到的数据返回一个列表
 
html_str = """
    
          
                
                    第一个
                
                            
关注
打赏
1662460581
查看更多评论
0.0398s