第5章-网络信息资源收集技术参考

上传人:二*** 文档编号:270065784 上传时间:2022-03-24 格式:PPT 页数:43 大小:236.50KB
返回 下载 相关 举报
第5章-网络信息资源收集技术参考_第1页
第1页 / 共43页
第5章-网络信息资源收集技术参考_第2页
第2页 / 共43页
第5章-网络信息资源收集技术参考_第3页
第3页 / 共43页
第5章-网络信息资源收集技术参考_第4页
第4页 / 共43页
第5章-网络信息资源收集技术参考_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第5章-网络信息资源收集技术参考》由会员分享,可在线阅读,更多相关《第5章-网络信息资源收集技术参考(43页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章网络信息资源收集技术网络信息资源收集技术 知识要点 网络信息资源的特点 互联网信息资源的主要类型 搜索引擎的主要种类 搜索引擎的工作原理 常用的搜索引擎能力要点 具有灵活利用不同类型的搜索引擎搜集网络信息的能力 具有合理利用搜索引擎查找特定站点的能力 具有利用搜索引擎、期刊门户网站搜索学术文档的能力 2021/3/1115.1 5.1 网络信息收集与分析网络信息收集与分析 5.1.1 什么是网络信息1 1网络信息网络信息传统的商务信息起源很早,货币的出现取代了易货贸易,交易活动变得更容易了。然而,贸易的基本原理并没有变化,社会的某一成员创造有价值的物品,这种物品是其他成员所需要的。

2、所以,商务或商务活动就是至少有两方参与的有价物品或服务协商交换的过程,它包括买、卖各方为完成交易所进行的各种活动。在信息社会,这一过程逐渐缩短。2021/3/1125.1 5.1 网络信息收集与分析网络信息收集与分析2 2网络信息资源定义网络信息资源定义网络信息资源(Network Information Resources)是指以数字化的形式存储于网络节点中、借助于网络进行传播和利用的信息产品和信息系统的集合体。网络信息资源是信息资源的一个下位概念,是与传统文献信息资源相并列的。2021/3/1135.1 5.1 网络信息收集与分析网络信息收集与分析3 3网络信息特点网络信息特点网络信息资源

3、是一种数字化资源,与非网络信息资源相比有其独特的特点,了解网络信息资源的特点有助于人们对其进行搜索、开发和利用。(1)数量庞大、增长迅速(2)内容丰富、覆盖面广(3)信息质量参差不齐,有序与无序并存(4)信息共享程度高、使用成本低(5)信息形式多样性2021/3/1145.1 5.1 网络信息收集与分析网络信息收集与分析5.1.2 网络信息获取方法1网上浏览网上浏览是获取信息最简单的方法。通过网上浏览可以熟悉网站的特点、内容和风格,对于了解各网站的栏目设置情况、商品情况是有益的。但是从网络经济学的角度来讲,这种漫无边际的浏览造成时间和经济的浪费。2收藏和保存页面信息对于在浏览过程中发现和获得的

4、重要信息,可以把它收集并保存起来。收集和保存页面信息的方法很多。2021/3/1155.1 5.1 网络信息收集与分析网络信息收集与分析3定向浏览定向浏览是网上浏览的深层次发展形式,它不仅具有明确的目的性,而且具有捕捉信息的敏感性,通常有以下6个目的。 寻找商气旺的目标发布网站; 获取网上商品的上网情况和定价信息; 寻找手中货品的现实商机; 分析产品的网上流向; 判断该网站的商业价值; 为待进行的商务谈判做准备。2021/3/1165.1 5.1 网络信息收集与分析网络信息收集与分析4订制信息订制信息是一种主动获取所需信息的方法。许多商业网站提高了这种订制信息的服务,只要登录这些网站,在该网站

5、的订制信息的登记栏内留下电子邮件地址,就完成了订制信息的操作。例如,利用邮件列表订制信息是网站的一种个性化服务。2021/3/1175.1 5.1 网络信息收集与分析网络信息收集与分析5利用网上搜索引擎通过搜索引擎对网络信息资源进行查找是获取网络信息资源的主要方式。搜索引擎是用来对网络信息资源管理和检索的一系列软件,实际上也是一些网页。查找信息资源时,在其中的搜索框中输入查找的关键词、短语,或者是其他相关的信息,再通过超链接,逐一访问相关网站,就可以查找到所需要的信息资源2021/3/1185.1 5.1 网络信息收集与分析网络信息收集与分析6利用权威机构的网站如果用户熟悉网络资源的特点和分布

6、状况,了解常用信息资源的发布方式,可以通过国内外重要的科研机构、信息发布机构、学会的网址,及时而准确地获得这些权威机构发布的信息。7利用网络专业信息资源导航库专业信息导航库比搜索引擎更具专指性。例如,中国高等教育文献保障系统(CALIS)本着共知、共建、共享的原则,以全国高等院校为依托,建立起CALIS工程中心重点学科导航库和CALIS文理中心重点学科导航库,积累了国内外政府部门、高等院校、科研机构、学术团体的各专业网站地址,覆盖的学科全面,学术价值高,信息可靠性强,通过有效链接可以直接进入各学科专业网,既可节省查询时间,又可提高查询的准确性。2021/3/1195.1 5.1 网络信息收集与

7、分析网络信息收集与分析8利用各高校图书馆的网络资源高校图书馆是网络信息资源的主要发布阵地,尤其是针对学术信息资源。图书馆根据读者需求,编制网络资源导航系统,建立学科导航库,建立中外文网络数据库链接,筛选网上信息,剔除重复和无用的网络资源,引导读者最大限度地利用有效的信息资源,将读者从繁杂、无序的信息海洋中解脱出来,有效地遏制信息泛滥给读者造成的影响。2021/3/11105.1 5.1 网络信息收集与分析网络信息收集与分析5.1.3 网络信息整理与分析1网络信息资源分类资源的分类是按照一定的标准将与研究课题有关的信息资源分成不同的组或类,将相同或相近的资源合为一类,将相异的资源区别开来,然后再

8、按分类标准将总体资源加以划分,构成系列。人们习惯将收集的信息资源按照信息资源的性质、内容或特征进行分类。2021/3/11115.1 5.1 网络信息收集与分析网络信息收集与分析2网络信息资源汇编汇编就是按照研究的目的和要求,对分类后的资源进行汇总和编辑,使之成为能反映研究对象客观情况的系统、完整、集中、简明的材料。3网络信息资源分析方法用于信息分析的方法有逻辑学法、数学法和超逻辑想象法三大类,其中,逻辑学法是最常用的方法。逻辑学法具有定性分析、推论严密、直接性强的特点。2021/3/11125.2 5.2 搜索引擎技术搜索引擎技术 5.2.1 搜索引擎分类1 1搜索引擎的定义搜索引擎的定义搜

9、索引擎是为网络用户提供信息查询服务的计算机系统,也可以说是一类提供信息“检索”服务的网站,它根据一定的策略、运用特定的方法搜集互联网上的信息,并对信息进行组织和处理,将处理后的信息通过计算机网络显示给用户。它包括信息搜集、信息整理和用户查询三部分。2021/3/11135.2 5.2 搜索引擎技术搜索引擎技术2 2搜索引擎的分类搜索引擎的分类(1)全文搜索引擎全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度。它们都是从网站提取信息建立网页数据库的。从搜索结果来源的角度

10、,全文搜索引擎又可细分为两种:一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如Google、Baidu引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。2021/3/11145.2 5.2 搜索引擎技术搜索引擎技术(2)目录式搜索引擎目录索引完全依赖于手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。

11、而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。尤其像Yahoo!这样的超级索引,登录更是困难。(由于登录Yahoo!的难度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介绍登录Yahoo!的技巧)2021/3/11155.2 5.2 搜索引擎技术搜索引擎技术(3)元搜索引擎元搜索引擎又称集搜索引擎,是指在统一的用户查询界面与信息反馈的形式下,共享多个搜索引擎的资源库为用户提供信息服务的系统。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。2021/3/11165.2 5.2 搜索引擎技术搜索引

12、擎技术5.2.2 搜索引擎工作原理(1)从互联网上收集网页信息(抓取)搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,根据一定规则扫描存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站。为保证采集的资料最新,它还会回访已抓取过的网页。(2)建立网页索引数据库(索引)由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其他网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链接中每一个关键词的相关度(或重要性),然后

13、用这些相关信息建立网页索引数据库。2021/3/11175.2 5.2 搜索引擎技术搜索引擎技术(3)在索引数据库中搜索排序(排序)当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。(4)组织返回搜索结果(结果返回)由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。2021/3/11185.2 5.2 搜索引擎技术搜索引擎技术5.2.3 几种常用搜索引擎介绍1 1百度搜索引擎百度搜索引擎(1)百度公司背景简介百度(Nasdaq:B

14、IDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单、可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的青玉案元夕词句“众里寻他千百度”,象征着百度对中文信息检索技术的执着追求。2021/3/11195.2 5.2 搜索引擎技术搜索引擎技术(2)百度搜索引擎技术 基于字词结合的信息处理方式。 支持主流的中文编码标准。 智能相关度算法。 检索结果能标示丰富的网页属性。 百度搜索支持二次检索。 相关检索词智能推荐技术。 运用多线程技术2021/3/11205.2 5.2 搜索引擎技术搜索引擎技术 可以提供一周、两周、四周等多种服务方式

15、。 检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。 2021/3/11215.2 5.2 搜索引擎技术搜索引擎技术2 2搜狗搜索搜狗搜索(1)搜狗公司背景简介搜狗是搜狐公司的旗下子公司,于2004年8月3日成立,目的是为增强搜狐网的搜索功能,主经搜狐公司的搜索业务。在搜索业务的同时,搜狗还推出了搜狗输入法、搜狗高速浏览器。2021/3/11225.2 5.2 搜索引擎技术搜索引擎技术(2)搜狗公司战略目标搜狗在产品上追求技术创新,紧跟时代步伐,强调战略布局。经过长期摸索和反复尝试,目前形成了以搜索引擎、输入法和浏览器为主,以通话管理、

16、地图、智能硬件等产品为辅的产品布局。搜狗搜索战略调整为以年轻群体为主要目标人群。2021/3/11235.3 5.3 搜索引擎营销搜索引擎营销 5.3.1 搜索引擎营销概述1搜索引擎营销思想搜索引擎营销的基本思想是让用户发现信息,并通过单击链接进入网站/网页进一步了解所需要的信息。在介绍搜索引擎策略时,一般认为,搜索引擎优化设计的主要目标有两个层次:被搜索引擎收录和在搜索结果中排名靠前,多数网络营销人员和专业服务商对搜索引擎的目标设定也基本如此。2搜索引擎营销服务模式搜索引擎营销服务模式如图5-5所示。2021/3/11245.3 5.3 搜索引擎营销搜索引擎营销2021/3/11255.3 5.3 搜索引擎营销搜索引擎营销(1)SEOSEO(Search Engine Optimization),译为搜索引擎优化。主要目的是增加特定关键字的曝光率以增加网站的能见度,进而增加销售的机会。分为站外SEO和站内SEO两种。通过了解各类搜索引擎如何抓取互联网页面、如何进行索引,以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号