为什么学习xpath
一句话:使用正则提取数据,较为麻烦。所以才有了接下来学习XPath
的原因。
什么是xpath
XPath (XML Path Language)
即XML路径语言
,在最初时它主要在xml
文档中查找需要的信息,而现在它也适用于HTML
文档的搜索。
W3School官方文档:http://www.w3school.com.cn/xpath/index.asp
XPath
可以很轻松的选择出想要的数据,提供了非常简单明了的路径选择表达式,几乎想要任何定位功能,XPath
都可以很轻松的实现。
xpath
节点
每个标签我们都称之为节点
,其中最顶层的节点称为根节点
。
辅助工具
Chrome
浏览器插件:XPath Helper
Firefox
浏览器插件:XPath Finder
注意: 这些工具是用来学习XPath
语法的,当熟练掌握XPath
的语法后就可以直接在代码中编写XPath
而不一定非要用此工具。