基于主成分分析的科学评价

上传人:xzh****18 文档编号:41711549 上传时间:2018-05-30 格式:PDF 页数:6 大小:1.09MB
返回 下载 相关 举报
基于主成分分析的科学评价_第1页
第1页 / 共6页
基于主成分分析的科学评价_第2页
第2页 / 共6页
基于主成分分析的科学评价_第3页
第3页 / 共6页
基于主成分分析的科学评价_第4页
第4页 / 共6页
基于主成分分析的科学评价_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《基于主成分分析的科学评价》由会员分享,可在线阅读,更多相关《基于主成分分析的科学评价(6页珍藏版)》请在金锄头文库上搜索。

1、第 卷 第 期 年 月基于主成分分析的科学评价维度研究 以 为例宋丽萍 王建芳 刘芮 摘 要借助主成分分析, 以 的 ? 为数据源对物理学、 化学、 社会学、 免疫学四学科的科学评价主要维度进行解析。分析表明一维空间的科学评价在覆盖 信息的同时将损失其余的 , 个维度才能以 的精度描述论文的学术影响力, 进而将科学评价的 个维度分别命名为引用维、 共享维与利用维, 从而说明以引用为基础的传统科学评价的片面性, 并揭示科学评价的多维构成。 关键词主成分分析 科学评价 ? 分类号 : 本文系国家社会科学基金项目“ 科技政策视角下科学评价指标及方法研究” ( 项目编号: ) 与教育部人文社会科学青年

2、基金项目“ 基于群体智慧的微博客信息可信度评价机制研究” ( 项目编号: ) 研究成果之一。 作者简介宋丽萍, 天津师范大学管理学院教授, 博士, ? : ? ; 王建芳, 中国科学院文献情报中心副研究员, 博士; 刘芮, 天津师范大学历史文化学院馆员, 硕士。收稿日期: 修回日期: 本文起止页码: 本文责任编辑: 王善军科学评价, 是一个探索中的问题。对于什么是科学影响力, 目前没有清晰的界定, 科学评价方法尚处于争议之中, 然而科学评价的多维性是科学共同体的共识 。维度, 英文为 , 数学中指独立时空坐标的数目, 通常指我们分析目标对象所采用的角度。主成分分析( , ) , 是将高维空间映

3、射到低维空间中, 通过舍弃不重要的特征向量缩减维度、 消除变量之间相关性, 从而从原始变量中筛选最佳变量子集合的多元统计方法 。本文将借助 , 以 为数据源对论文科学评价的主要维度进行解析。 相关背景印本环境中, 引用成为科学评价的同义语, 然而,在线科研环境的兴起打破了引用等同于学术影响力的成规, 如何描述数字时代的学术影响力成为新的议题。恰逢此时, 美国北卡罗来纳大学博士研究生 提出替代计量学( ) , 从而为科学评价提供了新的视角并将评价重心从期刊转至论文自身, 因此论文层面的科学评价成为关注的焦点, 而 则成为论文科学评价的先行者。 期刊系列是开放获取的“ 领头羊” 。其中 被誉为期刊

4、的航母, 该刊创刊于 年 月, 因 年间影响因子保持 以上而闻名,因收录范围跨越 多个学科而著称。 年 月, 为规避期刊影响因子用于评价论文影响力的弊端, 并基于论文的重要性体现在发表后被关注与引用情形的出版哲学, 在每篇文章后新增 ? ( ) 以探索论文层面的评价方式。 采用利用状况( ) 、 社会共享状况( 包括 和 ) 、 学术性标签标注指标( 指 和 ) 、 学术性引用情形( 在 、 、 中引用情况) 、 非学术性引用情况( 在 等张贴的情况) 描述论文影响力 。 所开创的以科学社区为主导的论文评价方式为出版界提供了良好范例, 、 以及 出版集团竞相效仿 。本文将以 为例, 立足于论文

5、层面的科学评价, 通过上述指标间关系解析科学评价维度及其构成。 数据采集与统计鉴于 具有学科综合性的特点, 本文采用 : 网站的 , 选取其中物理学、 化学、 社会学、 免疫学用于分析。其中免疫学、 物理学、 化学作为自然科学的代表, 而社会学则作为社会宋丽萍, 王建芳, 刘芮 基于主成分分析的科学评价维度研究 以 为例科学的典型。回溯年限为 年, 以兼顾自然科学和社会科学引用行为的差异, 并保证 年的被引统计区间。以免疫学为例, 在 : 网站高级检索界 面中设 定检索 式 为: : : : : 。检索结果为: 社会学文献 篇、 免疫学文献 篇、 物理学文献 篇、 化学文献 篇,共计 篇。对于

6、上述记录, 首先采用计算机编程语言 抓取了文献的篇名, 并将其导入 , 利用第三方软件包 实现对于 与 的读写; 继而利用篇名链接, 点击 获取该文的 指标。数据采集日期为 年 月。由于 、 等指标记录过少, 不具统计意义, 数据前处理过程中将上述指标剔除, 最终将每篇论文在 、 ( ) 、 ( ) 、 系统中的被引量、 、 与 阅读统计、 记录等 项数据用于进一步分析。其中将每篇文献视作一条记录, 个学科中各有 个样本, 每个样本共有 个变量, 从而构成 个 阶矩阵。鉴于 维空间的复杂性, 下文将以 探索综合变量以提取其中的主成分。 个学科的主成分分析 必要性与适用性分析本文将通过相关分析确定变量的相关程度, 进而确定 的必要性。相关性分析结果表明( 见表 表 ) , 在 个变量组成的 个不重复的变量对中, 以相关系数 为阈值, 免疫学为 组, 占 ; 社会学为 组, 占 ; 物理学为 组, 占 ; 化学为 组, 占 。由此说明接近 或 以上的变量具有相关性, 即这些变量存在信息上的重叠, 因此通过 析出其中的主要因素是必要的。表 物理学原始变量相关矩阵相关系数 表 化学原始变量相关矩阵相关系数 表 免疫学原始变量相关矩阵相关系数

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号