基于文献的生物医学知识发现方法与工具

上传人:汽*** 文档编号:570419072 上传时间:2024-08-04 格式:PPT 页数:50 大小:3.39MB
返回 下载 相关 举报
基于文献的生物医学知识发现方法与工具_第1页
第1页 / 共50页
基于文献的生物医学知识发现方法与工具_第2页
第2页 / 共50页
基于文献的生物医学知识发现方法与工具_第3页
第3页 / 共50页
基于文献的生物医学知识发现方法与工具_第4页
第4页 / 共50页
基于文献的生物医学知识发现方法与工具_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《基于文献的生物医学知识发现方法与工具》由会员分享,可在线阅读,更多相关《基于文献的生物医学知识发现方法与工具(50页珍藏版)》请在金锄头文库上搜索。

1、基于文献的生物医基于文献的生物医学知识发现方法与学知识发现方法与工具工具内容内容Swanson关联研究及其工具关联研究及其工具vArrowsmith 的使用的使用vBitola的使用的使用生物医学信息检索技巧生物医学信息检索技巧背景与意义发表文献研究深入知识分裂文献量一、Swanson 的知识发现法的背景的知识发现法的背景Swanson教授认为教授认为: :(1) (1) 客观知识的总量与人类吸收知识的能力之间存客观知识的总量与人类吸收知识的能力之间存在着巨大的差距在着巨大的差距, ,并且这种差距在不断地扩大并且这种差距在不断地扩大; ; (2) (2) 在信息爆炸时代在信息爆炸时代, ,随着

2、科学技术的越来越专业化随着科学技术的越来越专业化, ,跨学科的信息传递变得更加困难跨学科的信息传递变得更加困难, ,就会产生知识的就会产生知识的分裂分裂, ,并且随着知识的持续增长并且随着知识的持续增长, ,这种现象会更加这种现象会更加严重严重; ; (3) (3) 一个专业领域的信息可能对另一个专业领域是一个专业领域的信息可能对另一个专业领域是有价值的有价值的, ,跨学科间一定存在着潜在的未被发现的跨学科间一定存在着潜在的未被发现的关联。关联。非相关文献的隐含关联非相关文献的隐含关联v1985 1985 年年Swanson Swanson 在一个偶然的机会在一个偶然的机会, ,发现发现2 2

3、 篇医学文献放在一起篇医学文献放在一起, ,会揭示出一个问题的会揭示出一个问题的答案答案, ,而这个答案是从单独一篇文献得不到而这个答案是从单独一篇文献得不到的。这预示着在医学文献中存在着大量的未的。这预示着在医学文献中存在着大量的未被发现的隐含的关联。被发现的隐含的关联。v例如例如,A,A表示一种物质的摄入可能导致一种独表示一种物质的摄入可能导致一种独特的生理改变特的生理改变B ,B ,而而B B又作用于身体的某器官又作用于身体的某器官或一种疾病或一种疾病C C。如果把两类文献放在一起。如果把两类文献放在一起, ,加加以研究就会获得有用的信息。即以研究就会获得有用的信息。即A A作用于作用于

4、C ,C ,而这种信息是不能根据单独一类文献得到的而这种信息是不能根据单独一类文献得到的, ,称为称为ABAB和和BCBC这两种文献是互补的。这两种文献是互补的。非相关文献的隐含关联非相关文献的隐含关联v一个专业领域的文献的作者和读者一个专业领域的文献的作者和读者, ,一般并一般并不熟知另一专业领域的文献不熟知另一专业领域的文献, ,也就是说两类也就是说两类文献从没有或很少被共同引用文献从没有或很少被共同引用, ,并且也不相并且也不相互引用互引用, ,我们称这两类文献是相互独立的我们称这两类文献是相互独立的, ,也就是非相关的。也就是非相关的。v这种情况这种情况, ,对两个不同的医学专业领域是

5、经对两个不同的医学专业领域是经常存在的常存在的, ,因此几乎没有人考虑到因此几乎没有人考虑到, ,把两类把两类文献放在一起加以研究文献放在一起加以研究, ,也不会有人注意到也不会有人注意到A A和和C C之间可能存在的隐含关联。之间可能存在的隐含关联。Medline文献集合DonR.Swanson的研究潜在的联系雷诺氏病雷诺氏病文献文献食用鱼油食用鱼油文献文献血液粘稠度血液粘稠度红细胞脆性红细胞脆性闭合式的知识发现v闭合式知识发现过程是从A和C出发,寻找共同的中间词B。vSwanson开发的网络应用软件ARROWSMITH即体现了闭合式挖掘这一思想。在成功预言了镁缺乏与神经系统疾病(1988年

6、)的关系之后,Swanson又利用ARROWSMITH系统成功地预言了消炎痛与阿尔茨海默氏症(1996年)、雌激素与阿尔茨海默氏症(1996年)、游离钙磷脂酶A2与精神分裂症(1998年)之间的关系,并发现了可以作为生物武器的潜在病毒(2001年)。闭合式的知识发现ARROWSMITH3.0vhttp:/可作为生物武器的潜在病毒v能够成为生物武器:致病性,传播性。同时涉及到病毒这两个特性的文章却特别少。vA:病毒毒力遗传方面(virulence-genetic)vC:病毒疾病传播力病毒的昆虫媒介传播(insectvectors)空气传播(air)在空气中的稳定性(stabilityofviru

7、sesinair)v通过与A和C有共同联系B找出更多符合条件的病毒。v将得到的文献经过一些系列的处理,Arrowsmith列出了三个有意义的B-LIST(病毒的集合),通过进一步的统计学分析和查阅文献,最终找出相对有意义的病毒(B)发现科研机构间潜在的合作方向v利用Arrowsmith程序,发现美国斯坦福大学和哥伦比亚大学在医学信息学研究领域的潜在合作方向v尝试将这种方法运用到寻求发现科研机构合作与交流的领域中。v结果表明,利用Arrowsmith所挖掘的科研合作与交流的内容详细、明确,能体现出研究所使用的具体方法和侧重点,能更好地体现出两个机构研究内容的相似点(可以合作之处)和不同点(可以相

8、互交流、学习之处)。开放式知识发现v开放式知识发现的过程是,对某个初始研究主题A,在MEDLINE的标题字段检索其相关文献,寻找与A在标题中共同出现的中间词B,通过筛选得到有一定意义的B,进而重复上述过程,得到目标词C。v开放式挖掘初衷是从某个疾病或药物初始,寻找疾病的潜在病因和治疗方法或者药物的潜在治疗应用。开放式的知识发现BITOLA/v输入单个的概念(疾病A),找到该概念的第一层相关概念并加以归类(药物B)。v从第一层相关概念(药物B)出发,找到它们的相关概念,并加以归类(基因C)。v检验基因和疾病是否有关联。如果没有,该基因与疾病有潜在的联系而且并没有文献报道。v提示:与疾病、生理学反

9、应或者其他表型相关的新基因、药物或者神经科学。BITOLABITOLA:openBITOLA:closeBITOLA:closeBITOLA:close生物医学信息检索技巧v学术搜索引擎Googlescholar的使用Scius的使用MedicalMatrixv网络资源利用工具Facultyof1000MedicineRRS的使用Google学术搜索v提供可广泛搜索学术文献的简便方法。v来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。1.标题链接到文章摘要或整篇文章(如果文章可在网上找到)2.引用者提供引用该组文章的其他论文。3.相关文章

10、查找与本组文章类似的其他论文。4.图书馆链接(在线)通过您已建立联属关系的图书馆资源找到该项成果的电子版本。在您登录校园网后将自动显示这些链接。5.图书馆链接(离线)找到藏有这项学术成果的图书馆。6.同组文章查找您可能看到的同属这组学术研究成果的其他文章,可能是初始版本,其中有预印本、摘要、会议论文或其他改写本。7.网络搜索Google搜索中关于该研究成果的信息。Scirusvhttp:/v综合性最强的web科研工具。4.5亿条记录,不仅仅有期刊上的内容,还有科学家的主页、课件、预印文本、专利和科研单位的收藏和网站信息。v由Elsevier科学出版社开发。Scirusv覆盖的学科范围包括覆盖的

11、学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。v每月更新,可检索1973-2002年间发表的文献。生物医学信息检索技巧v学术搜索引擎Googlescholar的使用Scius的使用MedicalMatrixv网络资源利用工具Facultyof1000MedicineRRS的使用Medical Matrixv由美国医学信息学会主办,其收集的内容专业、全面,是目前最重要的由美国医学信息学会主办,其收集

12、的内容专业、全面,是目前最重要的医学专业搜索引擎。医学专业搜索引擎。v只需在首次访问时注册,即可免费使用,提供了关键词搜索和分类目录,只需在首次访问时注册,即可免费使用,提供了关键词搜索和分类目录,非常适合适合临床医师使用。非常适合适合临床医师使用。v分类目录是其主要特色,按各种医学信息分为专业(分类目录是其主要特色,按各种医学信息分为专业(Specialties)、疾病)、疾病种类(种类(Diseases)、临床应用()、临床应用(Clinical Practice)、文献()、文献(literature)、)、教育(教育(Education)、健康和职业()、健康和职业(Healthcar

13、e and Professionals)、医)、医学和计算机(学和计算机(Medical Computing,Internet and Technology)、市场)、市场(Marketplace)等)等8大类。大类。Medical Matrixv每一大类下再根据内容的性质分为新闻(每一大类下再根据内容的性质分为新闻(News)、全文和)、全文和多媒体(多媒体(Full Text/MultiMedia)、摘要()、摘要(Abstracts)、参)、参考书(考书(Textbooks)、主要网址()、主要网址(Major Sites/Home Pages)、)、操作手册(操作手册(Procedur

14、es)、实用指南()、实用指南(Practice Guidelines/FAQS)、病例()、病例(Cases)、临床和和病理图像)、临床和和病理图像(Images、Path/Clinical)、患者教育()、患者教育(Patient Education)、教学资料()、教学资料(Educational Materials)等亚类。)等亚类。v对链接的网址按一到五个星进行分级,并且附有简明扼要的对链接的网址按一到五个星进行分级,并且附有简明扼要的评论,便于使用者事先决定是否进入其网页进一步阅读,以评论,便于使用者事先决定是否进入其网页进一步阅读,以节省时间。另外还提供免费的节省时间。另外还提供

15、免费的mailing list,定期发布网上医学定期发布网上医学资源变化情况的通知。资源变化情况的通知。 Faculty of 1000v是一种新型的文献发现和研究工具,由BioMedCentral所出版。v由2400多位专家学者推荐,提供目前世界上最重要的生物学论文资讯及研究趋势。提供超过1000名顶尖科学家的一致推荐。v有系统地组织并评价大量的科学论文信息,收录每篇具有科学价值的文献,论文重要性的评论依据是其科学成就而非这些文献在哪里发表。v每篇文章都包含专家所给的评论,并依据F1000Factor评定文章的类别。v随时获得特定研究领域中最重要的论文信息;提供作者同行针对单一论文的即时评价

16、,期刊之影响因子则对此直接评价提供重要的补充评价。RSSvRSSReallySimpleSyndicationRichSiteSummaryRDFSiteSummary是一种描述和同步网站内容的格式。一种方便的信息获取工具。RSS可以干什么RSS获取信息的模式与加入邮件列表(如电子杂志和新闻邮件)获取信息有一定的相似之处,也就是可以不必登录各个提供信息的网站而通过客户端浏览方式(称为“RSS阅读器”)或者在线RSS阅读方式这些内容。例如,通过一个RSS阅读器,可以同时浏览新浪新闻,也可以浏览搜狐或者百度的新闻。RSS可以干什么v订阅BLOG:订阅与你有共同爱好的作者的Blog;v订阅新闻;v订

17、阅期刊和PubMed上的相关记录:你可以订阅你工作中所需的技术文章。v你再也不用一个网站一个网站,一个网页一个网页去逛了。只要这将你需要的内容订阅在一个RSS阅读器中,这些内容就会自动出现你的阅读器里,你也不必为了一个急切想知道的消息而不断的刷新网页,因为一旦有了更新,RSS阅读器就会自己通知你!RSS的使用v使用RSS获取信息的前提是,先安装一个RSS阅读器,然后将提供RSS服务的网站加入到RSS阅读器的频道即可。大部分RSS阅读器本身也预设了部分RSS频道,如新浪新闻、百度新闻等。RSS的使用v在许多新闻信息服务类网站,会看到按钮,有的网站使用一个图标,有的同时使用两个,这就是典型的提供RSS订阅的标志,这个图标一般链接到订阅RSS信息源的URL。当然,即使不用这样的图标也是可以的,只要提供订阅RSS信息源的URL即可。本课程学习的重点v数据挖掘的定义v数据挖掘分类v数据挖掘的过程v数据挖掘的算法(2种)v聚类与分类v共现、同被引、引文耦合v可共现分析的字段,说明问题v实习过程(数据挖掘的过程)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号