网站首页 > 技术文章 正文
XPath基本概念
XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。HTML也属于XML文档,在web自动化测试中常使用xpath进行页面元素的定位,要学好XPath需要先理解XPath节点和轴。
XPath节点
在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点),下图中未标识出命名空间、处理指令节点
XPath轴
XPath 使用路径表达式在 XML 文档中进行导航,html文档会被解析为一颗树。
下图中self表示为参照节点,parent表示为self的父节点,following-sibling表示为self之后的兄弟节点,同理其他的都是以self为参照来表示的。
XPath编写原则
在自动化测试中,web页面自动化的稳定性一直被人诟病,我认为除了功能需求的频繁变更之外,很大一部分原因是页面元素的XPath定位写得不够好导致页面元素有一点点变更就无法定位,从而导致用例失败,我接触到的自动化测试人员中很少遇到对XPath非常熟悉的。XPath编写重要原则就是要通过尽量不变化或少变化的元素去定位,使写出的XPath能够在页面需求变动较小的情况下也能顺利定位,达到这样的要求不仅需要对XPath足够熟悉而且还要结合项目的实际情况灵活处理。
接下来,我针对XPath常用的一些情景进行讲解,以定位https://www.w3school.com.cn/xpath/index.asp该网站的页面元素为例进行介绍。
相对路径、绝对路径
绝对路径:/html/body//h1
--- 从html根节点开始查找,最终定位到所需的h1元素
相对路径://h1
使用属性定位
//ul/li/a[@title="XPath 教程"]
-- @title=表示定位title等于匹配值的元素,注意这里共匹配到了3个元素,后面会讲到如何处理这种情况
定位兄弟节点
//ul/li/a[text()="XPath 语法"]/../following-sibling::li[2]
-- 通过导航菜单"XPath 语法"找到其下面的兄弟元素的第二个节点,即"XPath 运算符",使用following-sibling,如何找之前的兄弟元素则使用preceding-sibling,其他的轴如祖先节点、子孙节点定位也使用同样的方式
注:其中/..表示返回其父节点,等同于//ul/li/a[text()="XPath 语法"]/parent::li/following-sibling::li[2]
使用索引下标定位
//ul[@id="menu"]/li[4]
-- 导航菜单中的li元素为相邻的兄弟元素,通过下标[4]选中第四个元素
还有一种情况,XPath定位到的元素并不是相邻的兄弟元素,此时可以使用(xpath)[index]的方式定位所需的元素
(//ul/li/a[@title="XPath 教程"])[1]
使用函数
XPath定义100多个内建函数,参见链接https://www.w3school.com.cn/xpath/xpath_functions.asp
contains函数
//strong[contains(text(),"XPath 用于在 XML 文档中通过")]
-- 定位strong元素中的文本内容包含匹配内容的元素,其中text()表示取strong元素文本内容
-- contains函数中的第一个参数不仅可以是text(),也可以是属性,如contains(@name, "匹配值")
//p[contains(.,"XPath 用于在 XML 文档中通过")]
-- 其中contains参数中的.表示p内所有所有元素匹配条件即可
starts-with函数
//strong[starts-with(text(),"XPath 是一门在 XML 文档中查找信息的语言")]
-- 匹配strong元素文本内容以匹配内容开始的元素
text函数
//ul/li/a[text()="XPath 简介"]
-- 匹配a元素文本等于匹配内容的元素
and、or、not
复杂的xpath需要使用多个条件进行定位,可以使用and、or进行多条件组合,使用not匹配不满足条件的元素
//table/tbody/tr/td[starts-with(text(),"fn") and not(contains(text(),"error"))]
-- 匹配表格td元素中以"fn"开头但是不包含"error"的td元素
normalize-space函数:首尾去除空格
//ul/li/a[normalize-space(text())="职业规划"]
-- 有些页面元素的文本内容首尾是有空格的,这种情况可以使用normalize-space去除首尾的空格
猜你喜欢
- 2024-11-14 Playwright自动化测试工具之元素定位实战
- 2024-11-14 利器 | AppCrawler 自动遍历测试实践(二):定制化配置
- 2024-11-14 java组件HuTool相关工具类的使用二
- 2024-11-14 手把手教你爬取热门小说《诡秘之主》
- 2024-11-14 Python爬虫之xpath用法全解析(py xpath)
- 2024-11-14 怎么用xpath写drissionpage?或者用相对位置?
- 2024-11-14 通过python+Xpath实现抓取某网站推荐的歌曲
- 2024-11-14 Python自动化工具(python写自动化工具)
- 2024-11-14 手把手教你如何用Python爬取网站文本信息
- 2024-11-14 史上最全 Appium 自动化测试从基础到框架实战精华学习笔记(一)
- 最近发表
- 标签列表
-
- cmd/c (57)
- c++中::是什么意思 (57)
- sqlset (59)
- ps可以打开pdf格式吗 (58)
- phprequire_once (61)
- localstorage.removeitem (74)
- routermode (59)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- log.warn (60)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- resttemplateokhttp (59)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- reader.onload (61)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- java是值传递还是引用传递 (58)
- 无效的列索引 (74)