精华版bibexcel进行中医方剂和药物分析指南

上传人:笛音 文档编号:40812650 上传时间:2018-05-27 格式:DOCX 页数:28 大小:1.09MB
返回 下载 相关 举报
精华版bibexcel进行中医方剂和药物分析指南_第1页
第1页 / 共28页
精华版bibexcel进行中医方剂和药物分析指南_第2页
第2页 / 共28页
精华版bibexcel进行中医方剂和药物分析指南_第3页
第3页 / 共28页
精华版bibexcel进行中医方剂和药物分析指南_第4页
第4页 / 共28页
精华版bibexcel进行中医方剂和药物分析指南_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《精华版bibexcel进行中医方剂和药物分析指南》由会员分享,可在线阅读,更多相关《精华版bibexcel进行中医方剂和药物分析指南(28页珍藏版)》请在金锄头文库上搜索。

1、Bibexcel 进行文献计量分析指南进行文献计量分析指南分析文本数据(中医方剂和药物分析)分析文本数据(中医方剂和药物分析)一、软件简介一、软件简介Bibexcel 是一个用于文献计量分析、特别是引文分析的完美工具。用户可以在 www.umu.se/inforsk 网站上获得最新版本(据本人验证,应该是http:/www8.umu.se/inforsk/Bibexcel/这个网站)。其安装也十分简单,只需要把文件拷贝到硬盘的目录下即可。记住,要把帮助文档即:也放在同一个目录下(在 bibexcel 打开的情况下,按下 F1 即可出现帮助系统的内容,不过是全英文的)。如果本指南不能满足你的需求

2、请到该网站上浏览网页。Bibexcel 因其灵活性而十分强大,但过于灵活会在刚开始使用的时候会带来一点点困惑,有的时候好几件事情通过一个步骤就完成了,有的时候需要把几种不同数据集结合在一起来处理文件。使用 Bibexcel 过程中需要帮助的时候可以按 F1 获得帮助,但是这个帮助往往是面向比较熟练的用户,老用户明确自己要做什么因而需要略加指点后在 Bibexcel 下完成的任务。幸运的是还有一些笔记来填充教程和快速指南留下的空缺。二、原理介绍二、原理介绍Bibexcel 软件的核心原理是“共词分析法”。该方法最早起源于 20 世纪70 年代中后期,属于内容分析法的一种。该方法主要统计一组词中两

3、两之间同时出现于一篇文献的次数,以这种“共现”次数反映这些词之间的关联程度,然后借助聚类方法可分析学科的主题结构。共词分析法的原理可描述为:两个词的“共词强度” (指两个词同时出现于一篇论文中的次数)越高,则这两个词之间的关联越紧密。1 1 定义定义共词分析(Co-word Analysis)是通过对反映文献主题内容的关键词进行统计分析,研究文献内在联系和科学结构。2 2 流程流程2.12.1 确定分析问题确定分析问题2.22.2 确定分析单元确定分析单元一种是从关键词列表、标题、摘要等进行提取;另一种数据收集方式则是利用专门的语词提取软件直接从全文抽取。(本文讲的方法与此有相似之处)2.32

4、.3 高频词的选定高频词的选定高频词的确定主要有两种方法:一种是结合研究者的经验在选词个数和词频高度上平衡,该方法具有一定的主观性;另一种是结合齐普夫第二定律辅助判定高频词的界限。(齐普夫定律是美国学者 G.K.齐普夫于本世纪 40 年代提出的词频分布定律。它可以表述为:如果把一篇较长文章中每个词出现的频次统计起来,按照高频词在前、低频词在后的递减顺序排列,并用自然数给这些词编上等级序号,即频次最高的词等级为 1,频次次之的等级为 2,频次最小的词等级为。若用 f 表示频次,r 表示等级序号,则有 frC(C 为常数)。人们称该式为齐普夫定律。)(但是齐普夫的表达仅适宜于中频词的情况,高频与低

5、频词与该表述偏差较大。于是对词频分布规律又有许多补充和深化的研究。)2.42.4 计算共词频率,得到共词矩阵计算共词频率,得到共词矩阵在共词分析中,为方便词对共现频率的运算。设计共词矩阵,对于 N 个高频词的共词分析中,便形成一个 N-N 的共词矩阵。共词矩阵的计算方法有如下几种:包容指数法、临近指数法、相互包容系数法。2.52.5 对共词矩阵进行处理,揭示共词信息对共词矩阵进行处理,揭示共词信息常用的分析方法如下。常用的分析方法如下。(1 1)共词聚类分析法)共词聚类分析法借助数据挖掘中的聚类分析法,对共词关系网络中的词与词之同的距离进行数学运算分析,将距离较近的主题词聚集起来,形成一个个概

6、念相对独立的类团。类团分析是共词聚类分析的核心内容。(2 2)共词关联分析法)共词关联分析法在共词关联分析的过程,涉及到 4 个重要的概念:支持度、置信度、期望可信度、作用度。(3 3)共词词频分析法)共词词频分析法词频分析法是利用能够揭示或表达文献核心内容的关键主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法,是定性分析法的一种。(4 4)突发词监测法)突发词监测法突发词监测是 Kleinberg 于 2002 年提出话题的突发监测(Brust detection)算法,它关注焦点词一相对增长率突然增长的词。基于单个词的词频增长率变化更有可能涉及到领域局部

7、热点的变化。3 3 应用领域应用领域(1)揭示特定领域内的研究主题及其层次之间的关系,以及其对应的研究方向间的关系,划分科学子研究领域并确定其研究结构;(2)从横向和纵向角度揭示特定领域内研究主题之间以及同其他研究主题之间的关系;(3)考察特定研究领域内研究主题发展的历史脉络及其子领域的演进态势;(4)通过词间关系的数据挖掘达到学科主题知识发现的目的。三、软件操作三、软件操作以分析文本文档为例以分析文本文档为例由于 Bibexcel 设计之初是专门用于文献计量分析、特别是引文分析的工具,该软件用于对文献的关键词、标题、摘要、期刊等进行提取和分析。所以,在进行介绍本文的用 bibexcel 软件

8、进行中医药方剂和药物分析的方法之前,先大概介绍一下 bibexcel 软件正统的用法和意义。两种用法的差别在于,用于bibexcel 分析的起始文本文档不同,其他的后续分析的操作方法,均一样。(有点长,着急者,可以略过不看,不影响使用本软件)Bibexcel 是瑞典科学家佩尔松(persson)开发的文献计量学研究软件,Bibexcel 用于帮助用户分析文献数据或者是文本类型格式的数据,实现引文分析。Bibexcel 处理的数据来自集成在 ISIWeb of Knowledge 平台上的数据库,包括 Web of Science 数据库、DerwentInnovation Index 数据库和

9、 Medline 数据库等。Bibexcel 除了对来源于上述数据库中数据的相关知识单元(作者、关键词、参考文献等)做频次分析和排序外,还实现了知识单元的共现关系矩阵。将产生的共现数据存入 excel 表格中,借助 Ucinet、Netdraw 可视化软件,做进一步的可视化分析。在 WOS(Web of Science),下载前需要对要下载的记录进行标记。然后开始下载所选择的论文,保证下载项目中包括论文的引文。可以通过“download for future analysis(为进一步分析而下载)”或者通过电子邮件发给自己,两种方式都生成纯文本文件。这个纯文本文件是 bibexcel 进行分析

10、的本体资料的开始。这个文本文档在Bibexcel 或者文本编辑器中打开的原始数据文件应该是下面这个样子:FN ISI Export Format VR 1.0 PT Journal AU Brown, S Blackmon, K TI Aligning manufacturing strategy and business-level competitive strategy in new competitive environments: The case for strategic resonance SO JOURNAL OF MANAGEMENT STUDIES NR 190 CR 1

11、998, IND WEEK 1207, V247, P22 YOUNDT MA, 1996, ACAD MANAGE J, V39, P836 ZAJAC EJ, 2000, STRATEGIC MANAGE J, V21, P429 ZAJAC EJ, 1989, STRATEGIC MANAGE J, V10, P413 BP 793 EP 815 PG 23 JI J. Manage. Stud. PY 2005 PD JUN VL 42 IS 4 GA 929TJ J9 J MANAGE STUD-OXFORD UT ISI:000229369000004 ERPT Journal A

12、U Brown, S Cousins, PD TI Supply and operations: Parallel paths and integrated strategies SO BRITISH JOURNAL OF MANAGEMENT NR 105 CR ANDERSON JC, 1991, INT J OPER PROD MAN, V11, P86 BADRI MA, 2000, OMEGA, V2, P155 BEACH R, 2000, INT J OPER PROD MAN, V20, P7 WOMACK J, 1996, LEAN THINKING WOMACK J, 19

13、90, MACHINE CHANGED WORL ZAIRI M, 1992, INT J OPER PROD MAN, V12, P34 BP 303 EP 320 PG 18 JI BRIT. J. MANAGE. PY 2004 PD DEC VL 15 IS 4 GA 874LZ J9 BRIT J MANAGE UT ISI:000225353200002 ER PT Journal AU Laycock, M TI Transforming Rover, renewal against the odds 1981-1994 - Pilkington,A SO LONG RANGE

14、PLANNING NR 1 CR PILKINGTON A, 1994, T ROVER RENEWAL ODDS BP 738 EP 739 PG 2 JI Long Range Plan. PY 1996 PD OCT VL 29 IS 5 GA VW288 J9 LONG RANGE PLANN UT ISI:A1996VW28800021 ER现在,你可以开始使用 Bibexcel 了.注:注:每一个文档都必须有个固定的开头即:FN ISI Export Format VR 1.0每条记录以 ER 结束,所以上面这个文档有三条完整的记录。实际的文献量远不止这些,可以是几百条记录。其中

15、PT,AU,SO,CD, PY 等为标签,可以要也可以不要,视自己的所需而定,这些缩写词具体所指如下:AU,author,【来源作者】TI,title,【来源篇名】/【来源文献】SO,source,【期刊】/【来源期刊】DE,description,【标引词】C1,unit,【机构名称】/【作者机构】CR,referenceNR,coutPY,year,【年代卷期】等等。上面的文本文档需要进行一定的处理,然后才能生成 bibexcel 可识别的文本文件。(如果是正统的用法,如进行引文分析之类的,则转换格式这方面内容在 Bibexcel 的帮助文件中有很多介绍,运行 Bibexcel 时按下 F

16、1 进入帮助系统,查询索引和条目,如下载、转换到 dialog 和数据准备(downloading, convert to dialog, preparing the data)。在阅读分析步骤之前阅读介绍部分有益无害。)让你的数据变成 Bibexcel 的正确格式的第一步是选择好你的数据文件然后点击“Misc Convert to dialogconvert from Web of Science”菜单。如果没有这样处理过文件,则需要通过在左上角选择原始数据(使用 view file 查看文件按钮来检查),然后利用菜单命令:MiscConvert to dialogconvert from Web of Science。最后会得到一个.doc 文件(与你原始文件同文件名,只不过是以.doc 结尾)。在抽取出你要进一步分析的字段之前,选择和查看这个文件,比如在每一行的开头是否有完好的标签(PT-, AU-, SO-, CD-, PY-等),这些标签表明记录的内容,是否有干净的行结束标识“|”和记录结束标志“ER |”。注意 Bi

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号