vba处理网页基础二

上传人:xh****66 文档编号:57097129 上传时间:2018-10-18 格式:DOC 页数:30 大小:1.02MB
返回 下载 相关 举报
vba处理网页基础二_第1页
第1页 / 共30页
vba处理网页基础二_第2页
第2页 / 共30页
vba处理网页基础二_第3页
第3页 / 共30页
vba处理网页基础二_第4页
第4页 / 共30页
vba处理网页基础二_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《vba处理网页基础二》由会员分享,可在线阅读,更多相关《vba处理网页基础二(30页珍藏版)》请在金锄头文库上搜索。

1、VBAVBA 的的 WEBWEB 应用系列教程应用系列教程HTMLHTML 文档篇文档篇上节课,我们说了 HTTP 通讯,HTTP 通讯一般情况返回的是啥呢?是页面的源代码。例如,我们访问百度,返回了, “”一大堆东西。就是,我们在页面点击右键, “查看页面源文件” ,如图:我们的浏览器,正是把这堆源代码,翻译成我们可视的生动地页面的。就像 VBA 一样,这堆代码是什么语言呢,就是通常所说的,超文本标记语言超文本标记语言。为啥叫标记语言标记语言,因为它只能用于展示,展示我们所看到的网页页面。不是编程语言哦。为啥叫超文本超文本呢,大家仔细看,这堆源代码有什么特征呢,就是有很多这样的文本,一般而言

2、,我们把叫做标签标签,细心的同学可以发现,标签都是成对出现的,例如“百度一下,你就知道 ” 。第一个叫做开始标签,第二个多带了个/叫结束标签。标签之间就是网页的文本,例如这个例子,就是我们网页标题的文本“百度一下,你就知道” 。所以,标签的作用就是,给文本打上标记,告诉浏览器,怎么显示这个文本。例如本例,要求浏览器把“百度一下,你就知道”显示成网页的标题。HTMLHTML 文档文档= =文本文本+ +标签标签,所以就超文本啦。总之,HTML 就是用来描述网页的语言,像上面所说的这样的标签,是有一整套的,呵呵。我们的教程,并不是为了教大家,怎么去做网页,设计网页,因此,大家仅仅需要,大致的了解一

3、些 HTML 系列的文本标记语言的基础即可,知道常用的几个标签,有什么用即可。一、网页数据提取常见的一、网页数据提取常见的 HTMLHTML 标签标签/ /元素元素上面说了,标签是用来描述网页的。浏览器读取 HTML 文档,识别标签,并按标签要求以网页进行显示文本。大部分标签都是成队出现的。起始标签和结束标签之间的所有文本,都叫做元素元素。也就是这个格式就是:元素的内容元素的内容 标签是可以拥有属性属性的,因此起始标签,有时候格式如下:属性提供了元素的一些附加信息啦,后面我们讲具体标签,大家就会见到属性怎么用。另外,注意,元素是可以拥有元素的,即某个元素的内容有时候是一个子元素。元素这东西,比

4、较抽象,我们可以把它且当作一个对象来理解,例如工作簿对象,每个工作簿的名称都不一样(属性) ,每个工作簿里面都有工作表(子元素) ,每个表都有名称(属性) ,里面填写的内容也不一样(元素的内容) 。下面讲讲常见的和我们网页数据提取要常见的元素/标签。(一) 整体框架结构:每个网页文档,都是有个大致的框架,框架如下:网页标题网页文档主体把上面这段文本保存在 TXT 文件里面,然后另存.html 格式,就可以得到最基础的页面。从上面的框架代码,我们可以看出,一般的页面,都有 htmlhtml 元素元素,其一般内含两个元素,一个是 headhead 元素元素,一个是 bodybody 元素元素。He

5、ad 元素仅仅说明文档的相关消息,并不展示文档实体,body 元素才是真正展示文档主体的,所有要在页面展示的元素,都要在 body 內进行书写。后面的元素的测试,都是以替换掉 body 元素内的文本“网页文档主体”进行书写,后续不再复述这个框架。(二)段落特别是提取小说,新闻等页面的消息,文本都是一段一段的,这样的页面,一般是通过标签实现的。这个没啥好说的,自己动手试看看就知道。所以,当运用 ie/webbrowser 方式提取这类网页的时候,历遍段落 p 元素即可。(三)超链接超链接是我们最常见的页面元素,基本的门户网站都有他,点了以后,可以跳转到另一个页面。一般语法格式:_blank/_s

6、elf”显示的超链接文本显示的超链接文本Target 属性,表示的是,当我们点击超链接,是在原页面进行跳转(_self)还是新建页面进行跳转(_blank) 。测试做个 ET 的超链接吧。(四)图像图像标签用法和超链接类似,语法:alt 属性代表的是,当图片无法加载的时候,替换显示的文本。我们做个加载 ET 的 LOGO 的页面玩玩。(http:/ 。(五)表格表格是我们网页最常见的,也是我们网页数据提取,最需要打交道的,其实它非常简单,框架如下,每行用,每个单元格用:第一行第一个单元格第一行第二个单元格第二行第一个单元格第二行第二个单元格(六)列表很多时候,数据也经常以列表形式存在的,列表有

7、三种:无序、有序和自定义。分别框架如下:1、无序列表函数VBA2、有序列表图书VBA函数视频基操图表数透3、自定义列表第一节课网络通讯第二节课HTML(七)表单和表单控件除了表格,表单也是我们在网页数据提取,页面操控最常见到的元素。例如我们注册用户,例如我们的微博登陆,例如我们的百度搜索,其实都是表单。我们先来看一个例子:请在文本框输入要搜索的关键字,后按提交,将提交百度进行搜索例如在文本框输入“苹果”后,按提交按钮:这个表单模拟的是百度搜索,在文本框输入关键字后,按提交,将跳转至百度的搜索结果的界面。呵呵,奇妙吧。如何实现的呢?细心的同学会发现吧,表单 form 这个元素,有“method”

8、和“action”两个属性,actionaction 属性属性指定的就是,提交表单后,向这个属性指定 URL 发送 http请求(呵呵,涉及到第一节课的知识啦) ,methodmethod 这个属性设定的就是,要按照 get 或者 post 等方式发送 http 请求。复习下第一节课吧,采用 get 的方式呢,参数将在 URL 后面加个?号,然后发送,采用 post 的方式呢,将在消息主体里面投递查询参数。那发送 http 请求的参数从哪里来的?就是从表单元素内含的各种下属元素,提取其 name 属性的值,作为参数名,然后提取该元素的 value 属性作为参数值(value 属性的值有时候是由

9、我们输入的,例如本例,虽然我们指定了默认的value 属性的值为 exceltip,但是我们可以手动输入,把它修改成“苹果” ) 。然后浏览器就用参数名=参数值和&进行连接(还是上节课的知识)串起来。就如本例,提交后,观察 URL 为:http:/ 就是第一个 input 元素的属性值,苹果就是我们输入的,赋予第一个 input 元素的value 属性的值。下面,我们讲讲表单主要的内含子元素吧。1、输入标签()其语法是:/其类型由 type 属性定义,常见的有:text(文本框) 、Radio(单选按钮) 、Checkboxes(复选框) 、submit(提交按钮) 、hidden(隐藏) 、

10、reset(重置)和 password(密码框)等。其中注意,其中单选框和复选框的是否选中,由checked 属性指定,如果值是”checked”则选定。不多说了,看例子吧。 (文本框和提交按钮就不做了,上面都举例了。密码框同,类似的)表格设计文档处理幻灯片vip普通会员注意,当表单提交的时候,发送 http 请求时,单选框和复选框,仅发送checked 属性为”checked”的元素。一样是把标记了 checked 的元素的 name属性值和 value 属性值串起来。2、下拉列表其语法: 如果存在 multiple=“multiple“的属性设定,则允许菜单多选,否则单选。Size 是设置

11、可见的菜单条目数。其下级元素,option 代表的是其每个菜单项目,语法为:selected=“selected“显示文字显示文字一样,value 属性接着的就是发往服务器的值,当提交的时候,就是将select 的 name 属性值与用户选择的某项 option 元素的 value 属性值连接,进行发送。Option 元素的 selected 属性设置的是默认选中的菜单项。示例如下:单选选择列表图书视频动画图解多重选择列表,按住 shift 或 ctrl 键进行多重选择excelwordppt(八)框架 标签和 标签1、frameset 和 frameFrame 是独立框架,就好像我们的分屏浏

12、览一样,一个屏幕,浏览多个画面一样。语法如下:首先框架必须放置在框架结构标签里面() ,其 rows/columns 属性的值规定了框架每行或每列占据屏幕的面积。另外,frameset 和 body 不能同时使用,除非有 noframes,很简单,因为 frame 其实就描绘文档了,所以,一般不需要再有 body 进行描绘。另外,框架元素一般放置于 head 元素內。Frame 元素的 src 属性就是设定了其框架内显示页面的 URL。示例如下:框架测试文档2、iframeIframe 的框架,就类似画中画的效果,在原页面插入一个页面。语法如下:width=xxSrc 设定框架内要显示的文档的

13、 url,scrolling 设置是否显示滚动条。Height 和 widty 设置的就是它的高度和宽度。案例如下:第一个框架第二个框架Html 就大概讲这一些吧,呵呵,毕竟我们不是要做网页,大家大致了解下就是,还可以参考 去学习。一般能做到,看得懂网页的框架结构即可。二、二、HTMLHTML 文档对象模型(文档对象模型(HTMLHTML DOMDOM)认识了网页文档上面的各种元素,我们怎么访问他们呢,是通过什么机制实现的呢?HTML 文档,向程序们,提供了访问其元素的端口,这就是 HTMLHTML DOMDOM,其定义了一套标准的针对 HTML 文档的对象访问或操作的机制。现在 DOM 有

14、多个版本,本文还是以最基础的 DOM 1(98 年颁布)这个版本。1、VBA 访问 IE 网页文档的程序模板讲访问前,我们先简要讲讲,如何用 VBA 调用 IE,直接给个模板吧,详细的 IE 对象的属性和方法等,我们后面的课会再讲:Sub test()Dim ie, dmtSet ie = CreateObject(“InternetExplorer.Application“) 创建一个 IE 对象With ie.Visible = True 显示它.navigate “http:/“ 加载某个页面Do Until .ReadyState = 4 等待页面加载完毕DoEventsLoopSet

15、 dmt = .document 将 IE 浏览器加载的页面文档,赋予 dmt变量开始操纵页面,或者提取数据啦End WithEnd Sub通过上面这个模板,我们就可以创建一个 IE 对象,并将其页面文档对象赋予 dmt 变量,这样,我们通过 dmt 变量,就可对页面元素,进行后续的访问以及操作。2、HTML DOM 对象和我们 EXCEL 的对象集合的层次结构类似(WORKBOOKS-WORKSHEETS-CELLS等) ,HTML DOM 为网页文档也组织了一个对象集合的分层次模型。另外,从上一节标签和元素的学习,大家也可以大致的得知,元素是可以拥有元素的,所以,这个分层的模型完全是合理的

16、。HTML DOM 的对象模型类似如下图:但是,VBA 直接支持调用的对象有限,如下:对象对象描述描述DocumentDocument代表整个 HTML 文档,可被用来访问页面中的所有元素AnchorsAnchors代表 元素集合BodyBody代表 元素FormsForms代表 元素集合FramesFrames代表 元素或 元素集合ImagesImages代表 元素集合LinksLinks代表 元素集合OptionsOptions代表 元素集合(select 元素里面可以直接使用)CellsCells代表 元素集合(table 元素里面可以直接使用)RowsRows代表 元素集合(table 元素里面可以直接使用)AllAll对象集合,提供对文档中所有 HTML 元素的访问。VBA 支持直接调用对象的元素,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号