生物信息学 第二章 生物信息学中的计算机技术

上传人:子 文档编号:54400249 上传时间:2018-09-12 格式:PPT 页数:9 大小:148KB
返回 下载 相关 举报
生物信息学 第二章 生物信息学中的计算机技术_第1页
第1页 / 共9页
生物信息学 第二章 生物信息学中的计算机技术_第2页
第2页 / 共9页
生物信息学 第二章 生物信息学中的计算机技术_第3页
第3页 / 共9页
生物信息学 第二章 生物信息学中的计算机技术_第4页
第4页 / 共9页
生物信息学 第二章 生物信息学中的计算机技术_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《生物信息学 第二章 生物信息学中的计算机技术》由会员分享,可在线阅读,更多相关《生物信息学 第二章 生物信息学中的计算机技术(9页珍藏版)》请在金锄头文库上搜索。

1、,),(,第二章,生物信息学中的计算机技术,2. 1 本章简介本章介绍因特网(Internet)和万维网(World Wide Web,简称 WWW),介绍世界各国 生物信息中心和服务机构。因特网的诞生,国际生物信息中心的建立,大大推动了生物信息 学革命。基于因特网的浏览器的出现,为生物信息资源的开发和应用提供了有效途径。本章 将简单介绍浏览器和通过浏览器进行数据库查询的方法,并给出一些重要生物信息中心的网 址。2.2 什么是因特网因特网是一个全球性的计算机网络,连接着政府机构、科研院校以及公司企业。因特网 通过通信协议传递信息,即传输控制协议/网际协议(Transmission Contro

2、l Protocol/Internet Protocol,简称 TCP/IP)。这一协议使不同类型的计算机能以一个共同的方式进行数据交流。网络中的一台计算机称作一个节点,节点和节点之间通过传输数据包(packets)进行 通信。与传统的电话、传真等通讯方式不同,数据包可能并不直接从一台计算机传到另一台 计算机,而是通过路由器经若干节点到达最后的目标计算机。网络协议用来控制和协调数据 的有效传输。数据包传输过程中,如果该通路上的某个节点出了故障,则可绕过该节点而通 过别的路径传输。2.3 什么是 IP 地址如同每台电话机有一个电话号码一样,因特网上的每一台计算机都有一个“号码”,即 IP 地址。

3、IP 地址是一个由四个字段组成的数字串,中间用小数点分隔。每个字段的数字值 在 0255 之间,如 202.112.7.13 就是一个 IP 地址。使用 IP 地址便于计算机之间的互相识别,但却不便记忆,也容易搞错。为此,TCP/IP 协议制定了域名(domain name)系统。域名系统由若干字段组成,每个字段通常由字母和 数字组成(包括连字符“-”和下划线“_”。其顺序依次是:计算机名、计算机所处位置、 域名或子域名。例如,上述 IP 地址 202.112.7.9 的域名为:。其含义为, 北京大学生物生物信息中心(Centre of Bioinformatics, Peking Unive

4、rsity,PKU)的 Web 服 务器 www.cbi,连接在北京大学校园网 pku,属“中国教育和科研计算机网络”China Education and Research Network,简称 CERnet)一部分,域名为 。表 2.1 列举了一些因特网域 名和子域名。表 2.1A 部分国家因特网域名一览表,国家 澳大利亚 丹麦 法国 希腊 爱尔兰 意大利 荷兰 波兰 南非 瑞典 英国,Country Australia Denmark France Greece Ireland Italy Netherlands Poland South Africa Sweden United Kin

5、gdom,域名 au dk fr gr ie it nl pl za se uk,国家 中国 芬兰 德国 匈牙利 以色列 日本 新西兰 葡萄牙 西班牙 瑞士 美国,Country China Finland Germany Hungary Israel Japan New Zealand Portugal Spain Switzerland USA,域名 cn fi de hu il jp nz pt es ch us,ac,co,表 2.1B,重要因特网域名,机构 学校 公司企业 政府机构 军事机构 学术机构 公司企业 其它组织,Organisation Educational Commer

6、cial Governmental Military Academic Company Other organisation General,域名 edu com gov milorg gen,2.4 因特网上的实用工具因特网提供的通讯工具包括电子邮件(email)、新闻组(news group)、文件传输(file transmission)和远程登录(telnet)等。电子邮件是因特网上最常用的工具之一,主要用于 个人与人之间的信息交流。新闻组则是对某一问题感兴趣的一组网络用户之间的集体讨论, 可以在一个新闻组中发表各自己的意见。通过文件传输协议(File Transmission Pro

7、tocol 简 称 FTP)可以在两台计算机之间传输文件,通过 Telnet 协议可以登录到远程计算机上。大多数因特网允许进行实时通讯,如 UNIX 系统的“talk”程序、VMS 系统的“phone” 程序,均可用作网络交谈工具。用户通过在屏幕上键入字符进行“交谈”。网络交谈的进一 步发展便是网上会议,即若干用户将各自交谈内容键入到屏幕上某个窗口中,实现虚拟网络 会议。WebBoard、BioMoo 和 MultiUser Dungeon 就是这类网络交谈程序。网络交谈也称网 络“沙龙”,就象咖啡屋一样,一边喝咖啡一边进行学术讨论。不过,由于网络技术尚未十 分成熟,同时受到传输速度的限制,实

8、际使用时还不很方便,还不象咖啡屋那样自在。2.5 什么是万维网万维网即 World Wide Web,简称为 Web、WWW 或 W3,由欧洲核子物理研究所(CERN) 提出并开发,最早用于分布于全球的高能物理研究机构之间的信息共享,其宗旨在于快速、 高效地找到处于世界各地计算机系统上的数据和应用程序。万维网的迅速发展,对生物信息 领域具有深远的影响。今天,万维网已成为因特网上最先进的信息交流工具。它是一个基于 超媒体的信息系统,其发展之迅速,功能之强大,已经成了因特网的同义词。在万维网 W3 协会主页上,它被描述为“信息网络的世界,人类知识的源泉”。尽管这种说法有点夸张, 但万维网的出现,的

9、确开辟了全球信息共享的新纪元。2.6 网络浏览器网络浏览器(network browser)的出现,使因特网的巨大潜力得以有效发挥,使信息获 取变得十分方便。浏览器在客户端(client)与服务器(server)之间进行通信时,使用了一 套标准的协议。浏览器与服务器之间进行通信的第一个页面称为主页(home page)。默认的 主页由特定的浏览器设定,通常指向该浏览器开发商的网址。用户可以改变默认主页,指向 更有用的、经常访问的站点,或指向用户自己的主页。浏览器为用户提供了一个易于使用的 界面,并把文档检索、文件访问、数据库搜索等操作集成在一起。下面,我们简单介绍最常 用的浏览器。2.6.1

10、LynxLynx 是由堪萨斯州立大学学术计算服务机构开发的,作为构建校园信息系统的一部分。 Lynx 运行于 UNIX 或 VMS 操作系统。它基于纯文本界面,可使用字符型终端,如普通的 VT100 终端,或相应的仿真终端。它在因特网早期使用较为广泛。虽然文本模式浏览器的 界面不象图形方式浏览器那样漂亮,但在网络传输速度较低时,Lynx 比图形浏览器更加有 效。2.6.2 MosaicMosaic 由伊利诺斯大学国家超级计算中心于 1993 年开发,是一个基于窗口系统的超媒,体浏览器,可用于 UNIX 系统的 X-Windows、苹果公司的 MacIntosh 和微软公司的 Windows。

11、它具有单一的、友好的用户界面,为因特网上不同的协议、数据格式和信息资源提供服务。 由于以上特点,Mosaic 出现不久,就迅速在因特网上流行,并风靡一时。很快,万维网界 面工具的开发以惊人的速度增长,新的浏览器很快诞生。Mosaic 的垄断地位只维持了很短 一段时期。,2.6.3 Netscape Navigator,Netscape Navigator 即 网 络 导 航 器 , 于 1994 年 由 加 利 福 尼 亚 州 的 Netscape Communications 公司开发。作为 Mosaic 的替代品,Netscape Navigator 几乎是一夜之间便获 得成功,成为最为流

12、行的浏览器。据估计,因特网上 80%的用户使用 Netscape Navigator 浏 览网页。该浏览器集成了电子邮件、新闻组、音频和视频等许多功能,并能以动态、交互方 式创建页面。,Internet Explorer 即网络探索器,于 1995 年由微软公司开发。它以 Mosaic 为基础,适 用于 PC 机。它具有其它浏览器的各种功能,包括支持多窗口系统、支持 Java 和 ActiveX 等。 最初是专为 windows95/NT 平台开发的,新版本已能在 SUN 公司的 UNIX 系统上运行。,2.7 HTTP、HTML 和 URL,浏览器所显示的文档采用超文本(HyperText)

13、和超媒体(Hyper Media)技术,使得 Web 浏览和发布极其容易。超文本文档包含内置链接,也称为超链接(Hyper Link)。它以 特殊颜色或背底显示,或以下划线标记。用鼠标点击超链接,则可调用一个新文档。该文档 可以在同一台服务器上,也可以在另一台服务器上,不受地理位置限制。超链接之间的通信, 即 Web 服务器所使用的通信协议称为超文本传输协议(Hyper Text Transmission Protocol, 简称 HTTP)。,超文本文档是用超文本标记语言(HyperText Markup Language,简称 HTML)编写 的 。 超 文 本 标 记 语 言 用 标 记

14、 符 号 对 文 本 进 行 修 饰 。 例 如 , 用 修 饰 粗 体 , 用,修饰字体的大小和颜色,用插入水平线,用引入图片等。大 部分标记符号成对出现,终止符以斜杠“/”结束,例如。HTML 语言简单易学。最有 效的方法是查看某个 Web 页面的“Page source”,搞清各种标记符号的特定效果。HTML 文 档以.html 或.htm 作为文件扩展名,如 index.html。图 2.2 列出了典型 HTML 页面的部分代码。, PREFACE ,Preface,Welcome to our Bioinformatics Web practical.,This is an inte

15、ractive exercise that aims to provide a taste of,bioinformatics resources around the world. We hope to give a flavour of sequence,analysis, by introducing a range of widely-used analysis tools and databases.,In this tutorial, brief instructions are given in the headers; their highlighted,phrases con

16、trol the contents of the left- and right- hand frames. Frame contents,may be refreshed at any time using the left-hand menu,. Commentaries in the right-hand frames provide more detailed information than the header instructions - please read these carefully. For further info, use: ,图 2.2,HTML 文档实例,图

17、2.2 是一个 HTML 文档,说明如何用标记语言进行文本居中、图像插入等操作。该 HTML 文档就是生成 Web 页面的源代码。HTML 文档通过唯一的地址来进行访问,该地址 叫做统一资源定位符(Uniform Resource Locators,简称 URL)。URL 包括几部分,依次是 通信协议、Web 服务器地址、文件存放的路径,或者一个文件名。例如:http:/www.bioinf.man.ac.uk/dbbrowser/bioactivity/nucleicfrm.html该 URL 地址指定通信协议为 HTTP,Web 服务器位于英国曼切斯特大学的生物信息学 研究组,并给出了指向

18、超文本文档 prefacefrm.html 的路径。2.8 欧洲分子生物学网络组织早在网络浏览器普及之前,世界各国的有识之士就意识到因特网在全球通讯和信息资源 应用中的潜在作用。八十年代中期,生物数据库开始快速增长,其作用也日趋重要。用户对 使用方便、更新及时的数据库需求不断增长。1988 年,欧洲分子生物学网络组织(European Molecular Biology Network,简称 EMBnet) 成立,它把欧洲各国生物信息中心组织在一起,实现信息共享,为各国分子生物学实验室提 供服务和进行培训。EMBnet 对于生物信息资源的利用和计算生物学的发展,起到了非常重 要的作用。有了 E

19、MBnet 这样一个为本国及其周边地区服务的机构,各研究单位不必耗费大 量的人力物力,建立各自的数据库和软件系统。截止 1998 年,EMBnet 拥有 34 个节点(表 2.2),其中 26 个是国家节点。这些国家节 点由政府机构指定,其主要任务是为本国用户提供服务,包括数据库、软件等,如序列分析、 蛋白质模建、基因作图等,同时提供用户支持和培训,以及进行生物信息的研究和开发。序 列查询系统(Sequence Retrieval System,简称 SRS)就是 EMBnet 组织开发的。另外 EMBnet 还有八个专业节点,包括了那些与生物信息学相关的学术、企业或研究中心。他们对生物学 数据库和相关软件的维护起了很大作用,这些节点中欧洲生物信息学研究所(European Molecular Bioinformatics Institute,简称 EBI)负责维护 EMBL 核酸数据库,国际遗传工程 和生物技术中心(International Centre for Genetic Engineering and Biotechnology,简称 ICGEB) 负责维护蛋白质结构域数据库 SBASE,等等。表 2.2 欧洲和美国的生物信息学中心EMBnet 国家节点,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号