信息计量第六章

上传人:j****9 文档编号:54985589 上传时间:2018-09-23 格式:PPT 页数:68 大小:3.08MB
返回 下载 相关 举报
信息计量第六章_第1页
第1页 / 共68页
信息计量第六章_第2页
第2页 / 共68页
信息计量第六章_第3页
第3页 / 共68页
信息计量第六章_第4页
第4页 / 共68页
信息计量第六章_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《信息计量第六章》由会员分享,可在线阅读,更多相关《信息计量第六章(68页珍藏版)》请在金锄头文库上搜索。

1、第六章 洛特卡定律,滨州医学院 张雪艳 ,A. J. Lotka (1880-1949),占教职员工总人数的38.9%,占专职教师人数的39.4%,占教授人数的61.6%,2006中国大学100强名单(前20强),武书连:中国大学评价课题组,第一节 洛特卡定律的产生,一、洛特卡定律的创始人洛特卡 Alfred James Lotka (1880-1949) 美国的著名学者,擅长于统计分析 The frequency distribution of scientific productivity. Journal of the Washington Academy of Sciences, 19

2、26,16: 317-323.,二、洛特卡定律的产生背景 1、物理学的巨大进展带动自然科学的各个领域。 2、科学家投入更多的精力产出科技成果。 3、科学家协作论文数量不均匀引起重视。,第一节 洛特卡定律的产生,三、科学生产率 劳动生产率是指在单位时间内生产的产品数量,或者是生产单位产品所耗费的劳动时间。 科学生产率(scientific productivity)是指科研人员在一定时期内所发表的科学论文(著)的数量。 科学生产率是评价科学工作者对科学贡献大小的一个定量指标(科学生产效率),已经被广泛应用于著者规律的研究中。,第一节洛特卡定律的产生,1、决定科学发展的主要因素社会的政治、经济发展

3、水平 科研资金的投入 科研人员的数量和质量 科研设备状况 信息保障等,科研队伍 论著发表 成果专利 论文引文 科技奖励,教育部科技发展中心的统计数字,第一节 洛特卡定律的产生,2、几个基本观点 从科学文献的角度来说,科学技术领域的工作者只有在其一生所从事的工作中至少发表过一篇科学论文才有资格被称之为科学工作者,即科研人员。,谭浩强(1934) 清华大学教授,引自:http:/ 一个人参与编著和主编的书竟然发行了4400多万册! 与人合著的BASIC语言发行1200万册! 自1980年以来,编著计算机著作130种、主编250种,共380种,是编著科技著作最多的人!,第一节 洛特卡定律的产生,科学

4、工作者是科学研究的主体,其科学活动的产物科学文献是科学工作者科学思想的重要表达形式之一。 科学工作者的集合,构成科学论文的“著者群体”,且与科学的发展密切相关。 本章显然是以科研成果(科学论文)的数量做为评价科学工作者对科学做出贡献大小的尺度。,第一节 洛特卡定律的产生,3、基本假设 尽管科学工作者对科学贡献的大小可以由多种标准进行衡量,但为了简化问题,而且,科学文献又的确是衡量科学贡献大小的最为直观、明确、易于统计比较的指标,因此,我们假定以下假设在一定条件下是成立的,即:每篇科学论文对该学科的贡献的大小是一样的。在此假设条件下,我们就可以通过科学论文的数量来判断科学工作者对科学的贡献。,第

5、二节 洛特卡定律的内容,(一)洛特卡定律的形成 1、研究的学科领域 化学领域:选择了在国际化学领域的著名文摘杂志CA进行统计研究。统计时间范围:19071916年10年的累积索引。对著者的选择:取著者累积索引中family names为A和B的著者共6891人,合著者中取senior authors。,第二节 洛特卡定律的内容,物理学领域:选择了当时(1910年出版)最完整的奥尔巴赫(Felix Auerbach)物理学史一览表(Geschichtstafeln der physik)进行统计分析。统计时间范围:自有物理学重要著作以来至1900年期间的著者。对著者的选择:取全部著者共1325人

6、。,第二节 洛特卡定律的内容,2、数据的组织方法按著者发表论文数量的多少“升序”排列。,科学生产能力频率分布表(摘录),第二节 洛特卡定律的内容,3、数学模型及其表述 撰写 x 篇论文著者的数量占著者总人数的百分比 f(x)与其所撰写的论文数量 x 平方的乘积大致为一恒量(c)。上述规律可以用下式表示:f(x)x2 =c,第二节 洛特卡定律的内容,即:发表 1 篇论文的著者数量占著者总数量的比大约为 c,发表 2 篇论文的著者数量占著者总数的比为c/4,发表 3 篇论文的著者数量占著者总数的比为c/9,发表 x 篇论文的著者数量占著者总数的比为c/x2 。,第二节 洛特卡定律的内容,洛特卡定律

7、: 在一定时间内,发表 x 篇论文的著者数量占著者总数的百分比 f(x) 与其所发表的论文数量 x 的平方成反比。 其数学模型为:,第二节 洛特卡定律的内容,-(6-1)f(x)发表x篇论文的著者数量占著者总数的百分比,f(x)1 x发表论文的篇数(x=1,2,3,.,n,.) c某学科主题的特征常数,对于上式,c 值约为0.6079(可证明),第二节 洛特卡定律的内容,(二)常数c的推论 c=6/2=0.6079 利用这一结果,我们可以进一步推导: f(x)=f(1)/ x2 y(x)=y(1)/ x2 其中,y(x)-发表x篇论文的著者人数y(1)-发表1篇论文的著者人数,第二节 洛特卡定

8、律的内容,(三)洛特卡定律的图像表示 对于模型: f(x)=c/ x2 ,可以通过取对数的方法将其转化为线性模型。 横轴为著者发表论文数量的对数;纵轴为发表x篇论文的著者数量占著者总人数百分比的对数,第二节 洛特卡定律的内容,如果斜率近似为-2,则该直线可以由下式表示:lnf(x)=-2lnx+lnc即 f(x)=c/x2 从 Lotka 定律可以看出,科学工作者对科学发展的贡献的差异是非常大的。,CA 1.8880.007,Auerbach 2.2010.017,第二节 洛特卡定律的内容,洛特卡定律中存在的若干问题 (一)对合著者的处理 (multiple authorship),著者%,年

9、,1910-1960年期间,以集体形式发表的化学方面的科学著作的发展情况1一个作者 2两个作者 3三个作者 4四个作者,第二节 洛特卡定律的内容,(一)对合著者的处理方法,第二节 洛特卡定律的内容,(一)对合著者的处理方法 1、正规计数法(normal count approach) 对每一合作者分别统计计数一次。 2、调节计数法(adjusted count approach) 根据合著者的数量,每个合著者被赋予一定的份额。 3、加权计数法 根据合著者对论文贡献的大小,采用不同的“权值”,区别对待。一般第一著者权值较高,以下依次降低。,第二节 洛特卡定律的内容,(二)对“高产著者”的处理方法

10、,高产作者部分出现下拐现象,第二节 洛特卡定律的内容,(二)对“高产著者”的处理方法 1、乌拉齐(J.Vlachy)法:删除著者的数量为著者总和的平方根。CA:68911/2=83 Auerbach:13251/2=36 2、1%法:删除著者的数量为著者总和的1%。CA:68911%=69 Auerbach:13251%=13 3、平方根法:删除著者的数量为发表1篇论文的著者总和的平方根。CA:39911/2=63 Auerbach:7841/2=28 4、观察法:数据/图象,第二节 洛特卡定律的内容,(三)对指数值取值范围的分析 帕欧(M.L.Pao)对48组数据的K-S(Kolmogoro

11、v-Smirnov test)表明, “倒数反比规律”的确存在(其中有39组数据全部通过检验)。 一般认为,x 的指数具有多值性,其取值范围一般在1.23.8之间波动。 洛特卡定律的推广形式:f(x)=c/x 或 y(x)=y(1)/x (1.23.8),第二节 洛特卡定律的内容,(四) 洛特卡定律的数据处理 Pao,M.L. Lotkas law: a testing procedure. Information Progressing and Management,1985;21(4):305-320) 五个步骤: 1、数据的收集 2、数学模型的建立 3、斜率的计算 4、参数c值的计算 5

12、、K-S检验(Kolmogorov-Smirnov Test),例:北京大学对化学学报(19851987)的统计,n=6,1、数据的收集,2、数学模型的建立,3、斜率的计算,4、参数c值的计算,建立数学模型:,5、K-S 检验(Kolmogorov-Smirnov Test),近似公式: =0.01 1.63/ =0.05 1.36/ =0.10 1.22/ =0.15 1.14/ =0.20 0.20/ 也可查K-S检验D值表,第三节 洛特卡定律的修正和发展 普赖斯定理(Prices law),一、普赖斯定理的文字描述对于洛特卡定律,普赖斯做了进一步的研究。1963年,普赖斯在其名著小科学,

13、大科学(Little Science, Big Science. N.Y.: Columbia Univ. 1963)一书中认为:大约10%的杰出科学工作者(elites)发表的论文量占同期出版的所有论文量的50%。并进而认为:撰写全部论文数量一半的杰出科学家的数量为全部科学家数量的平方根。,令论文数量为P(x) (x=1,2,,m,xmax) 论文累积量(1m):P(1m)= 论文累积量(mxmax):P(mxmax)= 论文总量(1xmax): P(1xmax)= 累积著者人数(mxmax): 全部著者人数(1xmax) :,于是,普赖斯定理可用下面的公式来表示:如果有m 满足:那么,一定

14、有:(式中,xmax表示在统计数据中科学工作者所写的最多论文的数量)。,高产作者人数(撰写全部论文数量一半的杰出科学家),全部科学家数量的平方根,推论1:杰出科学家中最低产与最高产科学家所撰写的论文数的关系为:推论2:杰出科学家人数与全体科学家总人数的比例关系:,第四节 洛特卡定律的应用,一 洛特卡定律的应用 例1. 利用 SCI 对杰出科学家的评选,杰出科学家与论著高被引频次成正相关关系,且具有人才预测价值,第四节 洛特卡定律的应用,例2. 学科核心著者群体分布统计分析,相关研究部分实例介绍,MEDLINE人类基因组专题论文著者群研究,二、洛特卡定律应用中需要注意的问题(一)学科领域的影响: 学科性质、范围、研究特点、发展阶段及其与其他学科的相关程度等都有影响(二)洛特卡定律本身的局限性(三)统计数据的局限,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号