文档详情

按键精灵中分析网页元素特征字符串

kms****20
实名认证
店铺
DOC
28.50KB
约7页
文档ID:41458667
按键精灵中分析网页元素特征字符串_第1页
1/7

按键精灵中分析网页元素特征字符串按键精灵中分析网页元素特征字符串网页元素特征字符串1.什么是网页元素特征字符串要了解什么是网页元素特征字符串(以下简称特征串)首先得了解什么是网页,什么是 HTML从维基百科上可查询到网页定义如下:网页是一个文件,他存放在世界某个角落的的某一台计算机中,而这台计算机必须是与互联网相连的网页经由网址( URL )来识别与存取,当我们在浏览器输入网址后,经过一段复杂而又快速的程序,网页文件会被传送到你的计算机,然后再通过浏览器解释网页的内容,再展示到你的眼前是万维网中的一“页” ,通常是 HTML格式(文件扩展名为.html 或.htm) 网页通常用图像档来提供图画网页要透过网页浏览器来阅读网页通常有以下元素:文字资料,图像档案,Applet(在页面内执行的副程式)超链结等网页通常都是 HTML 格式的文件,经浏览器解释之后生成的页面,我们要分析网页,首先得了解 HTML 语言再查维基百科,HTML 定义如下:超文本置标语言(英文:HyperText Markup Language,简称为HTML)是为「网页创建和其它可在网页浏览器中看到的信息」设计的一种置标语言。

HTML 被用来结构化信息——例如标题、段落和列表等等,也可用来在一定程度上描述文档的外观和语义由蒂姆·伯纳斯-李给出原始定义,由 IETF 用简化的 SGML(标准通用置标语言)语法进行进一步发展的 HTML,后来成为国际标准,由万维网联盟(W3C)维护HTML 语言是一种标记语言,由成对的 … 包含起来的元素组成,各种不同的元素具备不同的标记名称,有不同的属性例如说一个链接的 HTML 代码如下:按键精灵网站它的标签名称为是 A,具备属性 href,该属性值为 不同的网页元素具备不同的标签名称,同时也具备不同的属性名称与值HTML 语言的所有标记请参考相关教程我们需要面对的主要是表单在讲解特征串之前,先简介一下表单,在网页中有一种表单标记,在这些标记之间可以添加 等表单元素,这些元素可以为用户提供输入、选择等功能,而表单中的内容也可以被提交到服务器完成交互 元素类型比较丰富,根据其 type 不同,具备的功能也不同,type=”text”为单行的文本输入框,type=“password”为密码输入框,type=“radio”为单选框,type=“checkbox”为复选框,type=“button”为普通的按钮,type=“reset”为表单复位按钮,type=“submit”为提交表单按钮;标记为用户提供下拉选择框,标记为用户提供多行文本输入。

网页元素特征字符串是一个用来描述网页元素标签特征的字符串,用于定位指定元素2.网页元素特征字符串格式特征串格式如下:属性 1:值 14)点击按钮时,有 ID 直接使用 ID 匹配,如果没有 ID,也可以通过文字匹配,例如点击百度搜索按钮:tag:input&value:百度一下;如果按钮的文字的带有空格,而且空格在两端时,匹配经常失效,此时可以用通配符来匹配:例如 google 首页上的“手气不错”按钮,它的两端都有一个空格,而且使用的编码的 HTML 符号 来表示的,直接使用 value 无法获得准确的匹配,此时就需要使用通配符:tag:input&value*:手气不错5)点击链接时,大部分情况下都需要使用 txt 属性,因为链接没有其他属性可以用来匹配,例如点击网页上的“下一页”链接,tag:a&txt:下一页,有的网页上会用下面的格式:“[下一页]” ,此时可以使用通配符:tag:a&txt*:下一页6)Frame 页面元素,有些网页中会采用 Frame 或者 Iframe,在这些Frame 子页面中,不能直接控制,需要指定 frame 才能进行控制,这里采用 frame 的索引来进行定位。

可以使用网页分析器来查看具体的 frame 页面的 index然后再在特征字符串上加上 frame,例如点击按键精灵首页上的知识库链接,就需要采用以下格式:frame:0&tag:a&txt:知识库4.特殊情况处理在某些网页中,可能会使用一些特殊的标记,例如这个类型的 input,只能使用 index 来定位,例如 tag:input&type:image&index:0有的表单中使用了提交这样的按钮来提交表单,可以使用tag:Button&txt:提交。

下载提示
相似文档
正为您匹配相似的精品文档