毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库

上传人:liy****000 文档编号:115193333 上传时间:2019-11-13 格式:DOCX 页数:10 大小:34.77KB
返回 下载 相关 举报
毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库_第1页
第1页 / 共10页
毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库_第2页
第2页 / 共10页
毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库_第3页
第3页 / 共10页
毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库_第4页
第4页 / 共10页
毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库》由会员分享,可在线阅读,更多相关《毕业设计外文资料翻译--TabSQLMySQL的工具方便用户映射数据公共数据库(10页珍藏版)》请在金锄头文库上搜索。

1、毕业设计外文资料翻译学 院: _专业班级: _ _学生姓名: _ 学号_指导教师: _外文出处:(外文)Xia X Q,Mcclelland M,Wang Y.TabSQLTool to facilitate mapping user date to public databasej. Bmc Bioinformatics,2012,11(14);1539-1558_附 件:1.外文资料翻译译文;2.外文原文指导教师评语:该英文资料选择合理,与毕业设计论文相关度很高。专业术语、词汇翻译的准确度较高,体现了较强的专业英语应用水平。翻译工作认真细致,严格按照规定,翻译材料能正确表达出原文意思,字、

2、词数满足要求,翻译材料语句通顺。翻译工作能够严格按照规定,达到考核、提高学生英语应用水平的目的,较好完成要求。签名:_ 年 月 日1. 外文资料翻译译文 译文文章标题TabSQL:MySQL的工具,方便用户映射数据公共数据库摘要背景:高通量基因组学和蛋白质组学的研究进展, 这是具有挑战性的生物学家处理大数据文件,并将它们的数据映射到公共数据库中。结果:我们开发了TabSQL,基于应用的工具,用于查看MySQL、过滤和查询数据文件的大行数。TabSQL提供的功能,下载和安装表文件从公共数据库中包括基因本体数据库(GO),Ensembl数据库、基因组数据库从UCSC基因组生物信息学网站。提供制表分

3、隔的平面文件的任何其他数据库也可以被导入。下载基因注释表可以查询在TabSQL使用图形界面或用户数据命令行。背景:在高通量的基因组学和蛋白质组学的研究中,原始数据和分析结果通常是organizedin表格式(例如,13),代表基因或探针的行,而列为实验的特点,如样品标识符、基因注释、褶皱的变化信号,或统计分析的P值。生物学家要增加额外的注释是很常见的。有公共数据库,可以是有用的来源,这样的注释。基因本体(去)项目http:/www.geneontology.org发展和维持一个受控词表的基因和基因产物的属性,并提供详细的、统一的基因和基因产物注释文件4,5;Ensembl项目http:/www

4、.ensembl.org提供各种生物 6 基因组数据库;UCSC基因组生物信息学网站http:/genome.ucsc.edu/也被从所有世界各地的研究者广泛使用 7 微软Access http:/ MySQL是搜索引擎在tabsql,因此用户需要有一个用户帐户在一个MySQL服务器。用户可以访问一个专用的服务器或MySQL,MySQL可能在本地计算机上安装。在第一tabsql运行,用户将寻求的信息对于客户/服务器的MySQL或MySQL的管理员帐户,创建一个新的用户帐户。tabsql是用纯Python。它需要或以后版本的Python 2.3三包,这是不包括在Python的标准库。论文三个额外

5、的软件包:http:/www.wxpython.org wxPython开发图形界面的分析;www.pycrypto.org pyCrypto http:/ /加密;和mysqldb http:/for the mysql- tabsql和MySQL服务器之间的接口。基于CAN tabsql运行各种操作系统(OS)的,包括微软的Windows操作系统和许多。它已测试在Windows 2000,Windows XP,Windows 7,和一系列的GNU / Linux CentOS系统,包括4和5的X。X。Fedora Core,Fedora Core 3,6,9和12的Fedora,Ubunt

6、u 8.04到Fedora,9.10.tabsql应该工作在其他操作系统环境,如果额外的Python包三是安装。一个应用实例教程,有详细的tabsql是可用的在线帮助文档中www.webarray. org/softwares/tabsql/help.html. 接口:对TabSQL图形界面由一个主窗口和一个或多个项目窗口主窗口:主窗口是一个图形界面,用于查询将随后在项目窗口中显示的数据的子集的表格。从主窗口,我们还可以创建/打开/删除项目。项目窗口:每一个项目都将显示在一个项目中,这显示了在扩展板中包含的数据。查询的结果将被添加到项目中,并在项目窗口中显示。数据组织:TabSQL允许用户交叉

7、引用他们的数据导入数据库然后过滤使用自己的查询。MySQL开源数据库管理系统http:/作为数据库引擎。在TabSQL所有数据存储在MySQL数据库中,数据被组织为项目。一个项目包括一系列的数据库表,该表将项目名称与所有表名中的前缀共享。数据可以导入到一个项目后,它已创建或打开。标签SQL可以使用MySQL服务器在本地计算机或另一台计算机在同一个局域网。尽管你可以使用一个MySQL服务器通过互联网,这是不可取的因为大量数据和安全问题,如SQL注入攻击、传输速率慢。如果用户需要使用Internet连接来访问MySQL服务器,我们建议使用一个SSH(Secure Shell)隧道转发远程MySQL

8、端口到本地计算机,从而加密TabSQL和MySQL服务器之间的通信。数据源:TabSQL旨在帮助用户标注自己的数据与公共数据库中的注释。用户数据:一般情况下,用户数据是以一个表中的格式组织起来的,在标题行中显示列名称。这些数据应保存在制表符分隔的ASCII文件,它可以很容易地导入到TabSQL项目由“添加”在项目窗口菜单命令。TabSQL自动确定每一列的数据类型,扫描后的用户数据,并创建一个结构合理的数据库表,在其中用户数据保存。如果在其他格式存在的用户数据,他们应该被转换为制表符分隔的ASCII文件。这种转换是大多数电子表格程序的标准功能。在一些情况下,用户数据可作为一个MySQL转储包。用

9、户可以加载数据到MySQL数据库导入到TabSQL使用“导入”命令,其目的是进口表从数据库在同一个MySQL服务器。公共数据库:一些公共数据库提供MySQL格式的数据文件或制表符分隔的ASCII文本文件下载。在这种格式的数据可以导入TabSQL以同样的方式为用户数据。TabSQL自动下载和存放三个知名的基因组注释的公共数据库的子集去数据库提供的菜单命令,Ensembl数据库和UCSC基因组数据库。去三亚群提供下载-“termdb”、“assocdb”、和“seqdb”,这是呈现给用户的选项。因为Ensembl数据库和UCSC基因组数据库是不同物种的多个数据库的集合,TabSQL将打开一个窗口,

10、让用户选择感兴趣的数据库时,用户点击菜单上的命令。所有必要的文件将从公共数据库FTP服务器下载并保存到本地计算机上的临时目录,随后所有的表将被加载到当前TabSQL项目。经常更新的公共数据库等,用户可以同步的本地副本,最新的数据可在网上通过重用相同的命令作为用于在第一个实例的数据下载。TabSQL会提醒用户,如果进口公共数据库不在一个时间段里更新。Internet连接的速度可以在公共数据库TabSQL引进瓶颈。这个介绍的时间成本主要取决于下载速度。我们的测试客户端在本地网络与Internet连接(T1 1.544mega比特每秒),确定引进或去“termdb”数据库可以在一分钟内完成更新。在生

11、物信息学网站数据库UCSC Ensembl或大小差异很大,下载时间这么做。下载需要几分钟到几个小时,这取决于用户选择的子集。虽然TabSQL设计与指定的公共数据库查询,这些数据库不是TabSQL强制性成分。TabSQL可单独操作和查询用户数据文件。此外,自动访问其他流行的数据库将被添加到TabSQL由作者根据用户的请求。查询:有两种方法使查询,也可以通过图形用户界面(GUI)在主窗口或通过在命令行界面输入命令(CLI)在项目窗口。有实例详细指南在网上文件的两种方法。每个查询将生成一个项目中的新表。用户可以“复制”、“粘贴”或“保存”表的内容。TabSQL与使用结构化查询语言(SQL)的MySQ

12、L服务器。SQL查询语句的使用可以保存为一个文本文件,它可以用来帮助初学者学习SQL语法。使用图形用户界面,可以通过点击主窗口中的选项进行查询。有五个部分用于查询。这些部分是用来确定输出的列,以指定搜索条件,并排序和名称结果表。基于所选的选项,TabSQL自动构造SQL“选择”命令,并将其提交给MySQL服务器。考虑到查询的性能可以显着改善的索引表,在项目窗口中的菜单命令提供了建立索引的表图形用户界面很容易使用,即使对于初学者来说。然而,命令行界面(CLI)提出了一种更灵活的方式来构建查询。通过在项目窗口中键入命令,用户可以进行非常复杂和复杂的查询。TabSQL支持完整的语法三SQL命令“选择

13、”、“改变”和“更新”。这些命令用于查询、更改表的结构/内容,或在表中创建索引。当运行在一个单一的表格,TabSQL允许命令在三的简化形式,其中只有完整的SQL语句的一部分需要打印讨论和结论:TabSQL具有三个显著特点:(1)TabSQL将自动建立一个表的制表符分隔的文件;(2)TabSQL将建立从外部数据库表像去;和(3)TabSQL将运行查询通过GUI。公共数据库和加载用户数据到数据库使TabSQL方便整合这些彼此容易进口。通过查询跨表而不需要编程,生物学家能够注释和筛选他们的数据很容易。基于TabSQL允许很多记录被进口相比微软Excel数据库。在处理巨大的高通量基因组数据集时,这一特

14、性尤为重要。因此,TabSQL是生物学家注释和丰富他们的数据的一个有用的工具可用性:TabSQL是一个开放源代码的软件包的GNU通用公共许可证下http:/www.gnu.org/licenses/gpl.txt分布。源代码是免费下载在HTTP:/ / www.webarray。org /软件/ TabSQL,或在http:/。编译的可执行文件也提供了Windows。2.外文原文TabSQL: a MySQL tool to facilitate mapping user data to public databasesAbstract Background: With advances in high-throughput genomics and proteomics, it is challenging for biologists to deal with large data files and to map their data to annotations in public databases. Results: We developed TabSQL, a MySQL-based application tool, for viewing, filtering and query

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号