火车头浏览器xpath常用技巧

时间:2019-12-10   访问量:128

  xpath常用技巧

  starts-with 选取id值以ma开头的div节点。例: //div[starts-with(@id,”ma”)]

  contains 选取id值包含ma的div节点。 例://div[contains(@id,”ma”)]

  文字:div[contains(.,'网络')]

  and 选取id值包含ma和in的div节点。 例://div[contains(@id,”ma”) and contains(@id,”in”)]

  text() 选取节点文本包含ma的div节点。 例://div[text()='ma']

  not 排除某个节点。例://tbody/tr[not(@class)],//tbody/tr[not(@class or @id)]

  /bookstore/book[1] 选取属于 bookstore 子元素的第一个 book 元素。

  /bookstore/book[last()] 选取属于 bookstore 子元素的最后一个 book 元素。

  /bookstore/book[last()-1] 选取属于 bookstore 子元素的倒数第二个 book 元素。

  /bookstore/book[position()<3] 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。

  /bookstore/book[price>35.00] 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。

  xpath经典案例

  百度竞价广告定位://div[div//span[contains(.,'csldhg')]][@cmatchid]


【地址】:http://www.inseo.cn/seo/26.html转载请注明出处


相关文章
常用HTTP抓包工具Fidd···

  说起抓包,很多人以为就是用个工具,简简单单地抓一下就可以了。昨天在面试一个安卓逆向,直接告诉我“···

Fiddler快捷键的使用总···

  用火车头浏览器进行采集的时候,经常要用到抓包工具fiddler,而掌握fiddler的快捷方式,···

火车浏览器脚本正则匹···

  火车浏览器脚本适用:  一、正则替换所有标点符号:  1、\p{P}+  二、替换换行:  2、···



Copyright © 2018-2020 大树SEO All Rights Reserved.