爬虫之xpath语法-基础节点选择语法
- XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。
- 这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。
- 使用chrome插件选择标签时候,选中时,选中的标签会添加属性class="xh-highlight"
接下来我们通过itcast的页面来练习上述语法:http://www.itcast.cn/
- 选择所有的h2下的文本
//h2/text()
- 获取所有的a标签的href
//a/@href
- 获取html下的head下的title的文本
/html/head/title/text()
- 获取html下的head下的link标签的href
/html/head/link/@href
【
xpath:节点选择语法
html
/html/head/title
/html//title
//title
//title/../..//title 斜杠隔开的是节点
//title/text() 从开闭标签之间取文本内容
//link/@href 从选中的节点标签中获取指定属性的值
】