网站首页 > 技术文章正文

web自动化测试——xpath常用案例（web自动化测试平台）

nanyue 2024-11-14 16:48:11 技术文章 26 ℃

XPath基本概念

XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。HTML也属于XML文档，在web自动化测试中常使用xpath进行页面元素的定位，要学好XPath需要先理解XPath节点和轴。

XPath节点

在 XPath 中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点），下图中未标识出命名空间、处理指令节点

XPath轴

XPath 使用路径表达式在 XML 文档中进行导航，html文档会被解析为一颗树。

下图中self表示为参照节点，parent表示为self的父节点，following-sibling表示为self之后的兄弟节点，同理其他的都是以self为参照来表示的。

XPath编写原则

在自动化测试中，web页面自动化的稳定性一直被人诟病，我认为除了功能需求的频繁变更之外，很大一部分原因是页面元素的XPath定位写得不够好导致页面元素有一点点变更就无法定位，从而导致用例失败，我接触到的自动化测试人员中很少遇到对XPath非常熟悉的。XPath编写重要原则就是要通过尽量不变化或少变化的元素去定位，使写出的XPath能够在页面需求变动较小的情况下也能顺利定位，达到这样的要求不仅需要对XPath足够熟悉而且还要结合项目的实际情况灵活处理。

接下来，我针对XPath常用的一些情景进行讲解，以定位https://www.w3school.com.cn/xpath/index.asp该网站的页面元素为例进行介绍。

相对路径、绝对路径

绝对路径：/html/body//h1
--- 从html根节点开始查找，最终定位到所需的h1元素

相对路径：//h1

使用属性定位

//ul/li/a[@title="XPath 教程"]
-- @title=表示定位title等于匹配值的元素，注意这里共匹配到了3个元素，后面会讲到如何处理这种情况

定位兄弟节点

//ul/li/a[text()="XPath 语法"]/../following-sibling::li[2]
-- 通过导航菜单"XPath 语法"找到其下面的兄弟元素的第二个节点，即"XPath 运算符"，使用following-sibling，如何找之前的兄弟元素则使用preceding-sibling，其他的轴如祖先节点、子孙节点定位也使用同样的方式
注：其中/..表示返回其父节点，等同于//ul/li/a[text()="XPath 语法"]/parent::li/following-sibling::li[2]

使用索引下标定位

//ul[@id="menu"]/li[4]
-- 导航菜单中的li元素为相邻的兄弟元素，通过下标[4]选中第四个元素

还有一种情况，XPath定位到的元素并不是相邻的兄弟元素，此时可以使用(xpath)[index]的方式定位所需的元素

(//ul/li/a[@title="XPath 教程"])[1]

使用函数

XPath定义100多个内建函数，参见链接https://www.w3school.com.cn/xpath/xpath_functions.asp

contains函数

//strong[contains(text(),"XPath 用于在 XML 文档中通过")]
-- 定位strong元素中的文本内容包含匹配内容的元素，其中text()表示取strong元素文本内容
-- contains函数中的第一个参数不仅可以是text()，也可以是属性，如contains(@name, "匹配值")

//p[contains(.,"XPath 用于在 XML 文档中通过")]
-- 其中contains参数中的.表示p内所有所有元素匹配条件即可

starts-with函数

//strong[starts-with(text(),"XPath 是一门在 XML 文档中查找信息的语言")]
-- 匹配strong元素文本内容以匹配内容开始的元素

text函数

//ul/li/a[text()="XPath 简介"]
-- 匹配a元素文本等于匹配内容的元素

and、or、not

复杂的xpath需要使用多个条件进行定位，可以使用and、or进行多条件组合，使用not匹配不满足条件的元素

//table/tbody/tr/td[starts-with(text(),"fn") and not(contains(text(),"error"))]
-- 匹配表格td元素中以"fn"开头但是不包含"error"的td元素

normalize-space函数：首尾去除空格

//ul/li/a[normalize-space(text())="职业规划"]
-- 有些页面元素的文本内容首尾是有空格的，这种情况可以使用normalize-space去除首尾的空格

上一篇：手把手教你如何用Python爬取网站文本信息
下一篇： Python自动化工具（python写自动化工具）

网站首页 > 技术文章 正文