CiteSpace信息可视化软件

上传人:飞*** 文档编号:50608431 上传时间:2018-08-09 格式:PPT 页数:20 大小:3.85MB
返回 下载 相关 举报
CiteSpace信息可视化软件_第1页
第1页 / 共20页
CiteSpace信息可视化软件_第2页
第2页 / 共20页
CiteSpace信息可视化软件_第3页
第3页 / 共20页
CiteSpace信息可视化软件_第4页
第4页 / 共20页
CiteSpace信息可视化软件_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《CiteSpace信息可视化软件》由会员分享,可在线阅读,更多相关《CiteSpace信息可视化软件(20页珍藏版)》请在金锄头文库上搜索。

1、CiteSpace信息可视化软件的使用主讲人: 陈 悦 “”创新研究团队 大连理工大学WISE实验室 2010年4月5日第二届科学知识图谱与科学计量学方法与应用高级讲习班 1999年率先发表了该领域第一部专著 2002年创办了该领域第一份、目前仍为 该领域唯一的专业期刊Information Visualization 2002年独立创办了每年一度的 Symposium on Knowledge Domain Visualization (KDViz)系列国际讨论会, 2005年提出信息可视化领域面对的十大 挑战性问题;在信息可视化领域中引入 Pathfinder算法,扩展和提高了文献引文

2、共被引网络分析的效率和应用范围。 2002年,获国际美国信息科学与技术学 会 (ASIST)和美国科学信息研究所(ISI)“ 引文研究奖”(Citation Research Award) 。Dr.Chaomei CHEN当代信息可视化与科学知识图谱学术领域中的国际顶尖学者和领军人物之一 信息可视化新领域的最早开拓者之一美国德雷赛尔大学 (Drexel University)信息科学与技术学院副教授要点: 设计理念- 想做什么- 如何实现(理论基础、概念模型、具体流程)- 能做什么 软件系统的介绍 使用步骤1 CiteSpace的设计理念 想做什么?识别和跟踪研究领域的演变,并尽量使其简易明了

3、地 可视化显示出来;将知识的宏观计量与微观计量相结合,为科研人员跟踪前沿,寻找科学问题提供便利的辅助 工具;为进入某个领域的新人提供快速了解全域知识及前沿 的便捷途径;为研究科学技术史的学者提供一个新的视角,便于揭 示学科或知识领域的发展历程;为相对枯燥的科学研究提供趣味性及艺术性的享受; 理论基础 a 库恩的科学发展模式把科学发展看成科学革命的历史过程, 科学在未形成统一范式之前处于前科学 时期;范式形成之后,进入常规科学时期, 人们在科学共同体中按范式解题,是范式 积累期;发展一定阶段,出现反常和危机; 人们寻求新的范式取代旧范式,导致科学 革命的发生;之后,迈进新范式下的新的 常规科学期

4、。因此,科学发展本质上是常 规科学与科学革命、积累范式与变革范 式的交替运动过程。这个模式得到科学 界的普遍认同。T.S.Kuhn (1962) 科学革命的结构AC b 引用分析和共被引分析引用分析可以反映知识的流动共被引分析可以揭示知识结构反映被引证文献之间的关系, 被频繁共被引的文献应该具有相似 的研究内容。当分析大量文献数据 时,就会形成大型的共被引矩阵, 采取降维的技术手段,形成相应的 聚类,即知识基础。B c 社会网络分析更强调关系的研究,突出节点在关系网络中的位置。中心性 度中心性 中介中心性 d 信息论标签词的选取 tf*idf (Weighted Term Frequency(

5、tf*idf) 基于词频和 逆向文本频率算法 ,有效过滤常见的词而保留重要的词。 Log-Likelihood Ratio 对数似然率算法 根据概率密度函数决 定最大可能性,找出最有可能的词。Mutual Information 互信息是信息熵的引申概念,它是对两 个随机事件相关性的度量,找出合适的明确的词。 e 图论有选择地控制图中点连接的密度,即网络的精简,在诸 如引文网络这样的复杂网络可视化研究中是一个有挑战性的 实际问题 降维 PathFinder Minimum Spanning Tree概念模型 用时间切片抓拍(Time-sliced snapshot)来显示 研究领域的演变创造性

6、地将引用分析和共被引分析综合起来Chen, C. (2006) CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientificliterature. Journal of the American Society for Information Science and Technology, 57(3), 359-377.三个关键性问题 l识别研究前沿的本质正在兴起的理论趋势和新主题的涌现,映射于知识基础。 l标注研究前沿一般方法:从引用文献共被引聚类的文章中提取出词集。理

7、想方法:从不引人注目的较为持久的主题中识别出明显 的新趋势和快速变化。CiteSpace:是基于从Title、Abstract、Descriptors、 Identifiers中提取出的突变词(burst terms)而确定的。 l及时识别新趋势和突变寻找关键节点关注中介中心性(Betweeness)和突变性(Burst)Betweeness,度量通过网络中节点的最短路径的条数Burst,在某时间段内被引频次或共现的频次突然增加的节点Sigma (),对网络中节点中介中心性和突变性综合考虑的度量指标 引文数据 Citation Data Source共引矩阵 Co-Citation Matri

8、x解释 Interpretation检索 Retrieval自动标注 Auto Labeling类标签 Cluster Labels降维 Dimensionality Reduction因子、主成分、 Factors, Components,意义和分析线索 Sense Making and Analytic Cues分类 Categorization施引文献 CITING Articles被引文献 Cited Author/Referen ces概述 Summarization主题句 Topical Sentences引文的SVD SVD of Citing Articles引文网络 Netw

9、ork of Citing Articles聚类 Clustering类 Clusters可视化 Visualization图谱 Graphics聚合 Aggregate具体流程在自然语言处理中,最常见的两 种分类问题分别是,将文本按主题归 类和将词汇表中的字词按意思归类分类的关键是计算相关性。 SVD ,即利用矩阵中的奇异值分解办 法来解决分类的问题,属于潜在语义 分析的数学技术,目的是克服信息检 索系统中词汇不匹配的问题。 我们能用CiteSpace做什么?- 理清某个知识领域的发展脉络,揭示发展历程,也可以 理清某个研究人员的研究历程;- 发掘发展过程中的关键节点;- 辅助对科研人员及科

10、研机构的评价;- 快速识别某个研究领域的经典文献,辅助科学研究活动 中的文献综述;- 实现文献计量与地理地图的整合;- 揭示某个知识领域的知识结构- 2 CiteSpace软件系统介绍 http:/cluster.cis.drexel.edu/cchen/citespace/ 软件运行环境与系统要求在安装和启动CiteSpace之前,首先应确保电脑上有Java Runtime 1.4 或者更高的版本(最新版本的CiteSpace2.2.R8需要Java Runtime 1.6 或者更 高的版本)。对电脑其他的基本要求主要包括16MB以上的内存空间,5MB 以上的硬盘空间,以及Microsoft

11、 Windows version 95, 98 or NT或者更高版本 的操作系统。软件开发于2003年9月,其版 本不断升级和更新,当前版 本为CiteSpace-2.2.R8( 2010年3月) 谁在使用CiteSpace?l CiteSpace信息可视化软件特色可以分析主流数据库的各种科学文献Web of Science论文、Derwent专利、NSF基金、Scopus数据库论文不需要经过繁琐的数据预处理简单易用的用户界面和操作方式图谱可以反应随时间演化趋势图谱的享受性及趣味性l 使用CiteSpace信息可视化软件的准备 确定知识领域(主题词、关键词、期刊)原则:完整而精确 下载数据,创建数据集 download*.txt 数据除噪数据检索流程研究目的选择数据库期刊影响因子专家访谈期刊Medline明确知识域WOSEIScopus创建数据集词频专家访谈数据处理词专业性较强学科交叉性较强 数据检索3 基本步骤 启动 http:/cluster.cis.drexel.edu/cchen/citespace/ 创建一个新项目 设定时间分区 分析对象的选择点、词源、词、链接强度、数据筛选、图谱修剪、可视化 数据的运行 图谱的可视化 图谱的解读与分析(默认)演示主窗体界面菜单及快捷按钮时间条信息角图谱显示区可视化窗口调控区可视化信息显示及控制区可视化信息显示区工具条

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号