最近想使用python做爬虫,使用xpath做爬取工具。
在这里记录一下xpath的常用表达式和函数工具等等。
//:获取所有节点
[1]:获取多个节点的第一个
[last()]:获取多个节点的最后一个
[last()-1]:获取多个节点的倒数第二个
[postion()<3]:获取前两个
[@name="pgres"]:获取属性name为pgres的节点
[price>30]:获取price节点值大于30的节点
[contains(@class, "pgres")]:class属性包含pgres值的节点
[not(contains(@class, "pgres"))]:排除属性包含pgres值的节点
另外推荐Chrome上的插件 xpath helper,可以查看xpath表达式是否正确。