您当前的位置: 首页 >  爬虫

31 爬虫 - XML介绍

杨林伟 发布时间:2019-08-29 17:37:52 ,浏览量:0

什么是XML
  • XML 指可扩展标记语言(EXtensible Markup Language)
  • XML 是一种标记语言,很类似 HTML
  • XML 的设计宗旨是传输数据,而非显示数据
  • XML 的标签需要我们自行定义。
  • XML 被设计为具有自我描述性。
  • XML 是 W3C 的推荐标准

W3School官方文档:http://www.w3school.com.cn/xml/index.asp

XML 和 HTML 的区别

在这里插入图片描述 XML文档示例:



 

   
    Everyday Italian  
    Giada De Laurentiis  
    2005  
    30.00 
    

   
    Harry Potter  
    J K. Rowling  
    2005  
    29.99 
    

   
    XQuery Kick Start  
    James McGovern  
    Per Bothner  
    Kurt Cagle  
    James Linn  
    Vaidyanathan Nagarajan  
    2003  
    49.99 
   

   
    Learning XML  
    Erik T. Ray  
    2003  
    39.95 
   


HTML DOM 模型示例:

HTML DOM 定义了访问和操作 HTML 文档的标准方法,以树结构方式表达 HTML 文档。 在这里插入图片描述

XML的节点关系 1. 父(Parent)

每个元素以及属性都有一个父。

下面是一个简单的XML例子中,book 元素是 title、author、year 以及 price 元素的父:




  Harry Potter
  J K. Rowling
  2005
  29.99

2. 子(Children)

元素节点可有零个、一个或多个子。

在下面的例子中,title、author、year 以及 price 元素都是 book 元素的子:




  Harry Potter
  J K. Rowling
  2005
  29.99

3. 同胞(Sibling)

拥有相同的父的节点

在下面的例子中,title、author、year 以及 price 元素都是同胞:




  Harry Potter
  J K. Rowling
  2005
  29.99

4.先辈(Ancestor)

某节点的父、父的父,等等。

在下面的例子中,title 元素的先辈是 book 元素和 bookstore 元素:






  Harry Potter
  J K. Rowling
  2005
  29.99



5. 后代(Descendant)

某个节点的子,子的子,等等。

在下面的例子中,bookstore 的后代是 book、title、author、year 以及 price 元素:






  Harry Potter
  J K. Rowling
  2005
  29.99



关注
打赏
1688896170
查看更多评论

杨林伟

暂无认证

  • 0浏览

    0关注

    3183博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录

0.0716s