文档详情

洛特卡定律课件

cl****1
实名认证
店铺
PPT
659.50KB
约45页
文档ID:575093437
洛特卡定律课件_第1页
1/45

洛特卡定律洛特卡定律小组成员:小组成员: 王王 琦琦 刘刘 娟娟 谭谭 琴琴洛特卡定律 目录目录¡洛特卡其人¡洛特卡定律概述¡洛特卡定律的研究(侧重国外部分)¡洛特卡定律的应用¡洛特卡定律的特点与注意事项洛特卡定律 1、洛特卡其人、洛特卡其人籍贯:籍贯: 1880年3月生于奥地利的伦伯格,父母都是美国人履历:履历: 早期教育是在法国和德国接受的毕业后,先后在美国化学总公司、国家专利局、国家标准局等机构工作1938-1939年任美国人口协会主席、1942年任美国统计协会主席成就:成就: 洛 特卡 ( A l f r e J . h a k a ) 是美国著名学 者和科学计量学家他擅长于统计研究 , 在科学上的兴趣首先集 中在生物体总数的动态状况研究 , 并发展 了一 种用出生率 、 死亡率和年龄分布函数表示的“ 人 口分析理论” 1 9 2 6年 ,他天 才地提出了用一对联立微分方程表示的“ 竞争增长律” 后来. 他又将统计研究 的方向转移 到科学 家与其发 表的科学文献之间 的数量关系上, 进行 了开剖性 的研 究工作, 并发表了“ 科学生产率的频率分布” 等著名论文 , 从而较早地创立了世界 闻名 的 洛特卡定律” , 为文献计量学的诞生和发展作出了创造性 的贡献。

洛特卡定律 u1926年,在美国一家人寿保险公司供职的统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院报》上发表了一篇题名为《科学生产率的频率分布》的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献这篇论文发表后并未引起多大反响,直到1949年这一成果才引起学术界关注,并誉之为“洛特卡定律”文中他统计了《化学文摘》1907~16年索引中的以A和B开头的6,891名作者及其论著数,并统计了奥尔巴赫(Auer bach)的《物理学史一览表》(1919)中的1,325位科学家及其论著数u在上述统计分析的基础上,他发现:“写了2 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/4; 写了3 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/9; ⋯⋯写了n 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/ n2 ”这就是著名的洛特卡定律洛特卡定律 趣味小故事趣味小故事 布拉德福定律、齐普夫定律、洛特卡定律被认为是文献计量学中最基本的三个定律. 他们之间的关系就像欧洲的一个传统的三角恋爱的故事,这个故事如下:故事取自故事取自:车尔尼雪夫斯基 的小说《怎么办》故事背景故事背景:小说描写的是十九世纪五十--六十年代的俄国。

在这个时 期,一切社会问题都归结为与农奴制及其残余作斗争故事如下故事如下: 房产管理人的女儿韦拉在医学院学生洛普霍夫的帮助下拒绝了父母包办婚姻的企图,脱离家庭,与原医学院学生洛普霍夫结合并创办了一所实行社会主义原则的缝纫工场两年后,韦拉与洛普霍夫的好友基尔萨诺夫相爱,洛普霍夫感到韦拉与基尔萨诺夫性情相投,他们在一起生活会更幸福,于是毅然出走,假装自杀,使他们能够结合以后,洛普霍夫受职业革命家拉赫梅托夫的委托,出国进行革命活动,数年后由美国回到彼得堡,与波洛佐娃结婚,并同基尔萨诺夫和韦拉重新会面,两对夫妇幸福地生活在一起,共同进行着他们所热爱的事业洛特卡定律 2、、洛特卡定律洛特卡定律概述概述¡ 诞生:诞生:1926年,洛特卡最先研究了科学文年,洛特卡最先研究了科学文献数献数 量与著作数量之间的关系,并创造性地提出量与著作数量之间的关系,并创造性地提出“科学生产率科学生产率”的概念的概念 ——即指在一定时间内科学工作者在科学上所表即指在一定时间内科学工作者在科学上所表现出的能力和工作效果,通常现出的能力和工作效果,通常用其生产的科学文用其生产的科学文献数量来衡量。

献数量来衡量 在提出科学生产率概念的同时,洛特卡就围在提出科学生产率概念的同时,洛特卡就围绕它进行了统计研究选用绕它进行了统计研究选用《《化学文摘化学文摘》》与与《《物物理学史一览表理学史一览表》》来研究科学家的著述数量,以此来研究科学家的著述数量,以此经过数据统计、归纳分析及运用数学工具的推算经过数据统计、归纳分析及运用数学工具的推算得出洛特卡定律,得出洛特卡定律,即写有即写有x篇论文的作者频率与篇论文的作者频率与x的平方呈反比的平方呈反比洛特卡定律 频数频数频率频率洛特卡定律 这就是科学生产率的“平方反比定律”的表达式2、洛特卡定律概述公式公式 表述:表述:洛特卡定律 理论意义:理论意义: 1 9 2 6年洛特卡 ( D a r k a ) 定律创立 至今已整整 8 0年 ,是文献计量学 中创立最早 的一个定律 ,洛 特 卡定 律也 是 文献 信 息 计 量学 的 经 典 定 律 之 一为文献计量学的诞生奠定了一定的基础 , 其创立是值得纪念的 2、洛特卡定律概述洛特卡定律 布拉德福定律 、齐普夫定律、洛特卡定律被认为是文 献计量学中最基本的三个定律。

研究对象:研究对象: 1 期 刊上刊载的论文 2 文章中每个词的出现频次 3 科学工作者 的著述 分析单元:分析单元: 1期刊数 2单词量 3著者群 计量方法:计量方法:都是通过对文献的调查和统计,取得数据并进行 分析归纳来定量地认识文献情报流总结:总结:这三个定律最初都是 按照某一具体事项在其主体来源中的出现频 率排序而导出 来的,然后通过数学工具来进一步求出其分布函数 通过 微分处理和分区处理发现,这三种分布函数具有相似性 , 可以认为它们是一种分布规律的不同表现形式 三三大大定定律律的的对对比比2、洛特卡定律概述洛特卡定律 ¡洛特卡定律的命运洛特卡定律的命运u由于多种原因,洛特卡定律沉睡了30多年,后来由于普赖斯等人的发掘,自60年代起引起人们的重视u今天,洛特卡定律仍然经常被科学学家、情报学家等引证和研究 ————引自引自《《科学的计量研究科学的计量研究》》 北京大学科学与社会研究中心 周 程2、洛特卡定律概述洛特卡定律 3、关于、关于洛特卡定律的洛特卡定律的研究(侧重国研究(侧重国外)外)¡1926年,年,Lotka发表关于科学生产率的著名文章后,刚开始发表关于科学生产率的著名文章后,刚开始并未引起学术界重视。

并未引起学术界重视¡一直到一直到1949年,洛特卡的研究结论才被称为年,洛特卡的研究结论才被称为“洛特卡定律洛特卡定律”¡在在《《人类行为和最省力法则人类行为和最省力法则》》一书中,一书中,齐普夫齐普夫较早将其称作较早将其称作“平方反比定律平方反比定律” 60年代初期,由于年代初期,由于普赖斯的两部重要著作的出版普赖斯的两部重要著作的出版,使洛特卡,使洛特卡的研究工作和成果随之得以广泛传播,有力地推动了这一定的研究工作和成果随之得以广泛传播,有力地推动了这一定律的研究和发律的研究和发 展¡1969年,年,费尔桑费尔桑((Foirthorne)首次将布拉德福、齐普夫以)首次将布拉德福、齐普夫以及芒代尔布罗分布同洛特卡的频率分布联系起来,及芒代尔布罗分布同洛特卡的频率分布联系起来,指出洛特指出洛特卡的关系式对低产作者来说是适合的卡的关系式对低产作者来说是适合的By 刘娟刘娟洛特卡定律 ¡70年代,年代, 研究较深入的:研究较深入的:科尔科尔((R·C·Coile)和弗拉奇()和弗拉奇(J·Valchy)¡前者找到了一种判断某组实验数据是前者找到了一种判断某组实验数据是否符合洛特卡分布的鉴定方法;否符合洛特卡分布的鉴定方法;¡后者则探讨了洛特卡定律的影响因素后者则探讨了洛特卡定律的影响因素及作用。

及作用 对美国国会图书馆和伊利诺斯大对美国国会图书馆和伊利诺斯大学图书学图书 馆的图书进行统计研究馆的图书进行统计研究因因 国会图书馆的统计数据只取自十年国会图书馆的统计数据只取自十年的机读著者目录,结果不严格符合洛的机读著者目录,结果不严格符合洛氏分布,氏分布, 而伊利诺斯大学的而伊利诺斯大学的数据覆盖了有数据覆盖了有史以来出现的所有作者及论著史以来出现的所有作者及论著,因而,因而严格符合洛特卡分布定律严格符合洛特卡分布定律洛特卡定律 3.1、对、对洛氏分布一般公式的研究洛氏分布一般公式的研究¡f(x)=c/xn f(x):写了写了x篇论文的作者占所有作者数的百分比篇论文的作者占所有作者数的百分比C为某主体领域的特征常数,为某主体领域的特征常数, Lotka::a=2 确定确定a和和C??实际上,它仅局限于实际上,它仅局限于a=2的情形;确立的只是科的情形;确立的只是科学生产率的平方反比律一些学者探讨了洛氏定学生产率的平方反比律一些学者探讨了洛氏定律的普遍性意义律的普遍性意义a并不一定都等于并不一定都等于2,,C会在会在0..6079附近上下波动。

附近上下波动洛特卡定律 指数指数a,通常采用最小二乘法估算公式;,通常采用最小二乘法估算公式;N为被考察的数据对的数量为被考察的数据对的数量,洛特卡定律 指数指数C:洛特卡和弗拉奇的推导:洛特卡和弗拉奇的推导¡洛:洛: f(x)=c/x2 ¡弗:弗:a为任意值为任意值a=2时,即时,即 C=f(1)=60.79%a=4,, C=∏4/90=1.08241a为其他非负分数值时,用下列公式先求出级为其他非负分数值时,用下列公式先求出级数之和,再计算数之和,再计算CC=∏2/6=60.79%洛特卡定律 弗拉奇的研究结论弗拉奇的研究结论¡不同的不同的a值将产生一个显著不同的常数值将产生一个显著不同的常数c,而而且且a的较小变化的较小变化(特别是在特别是在a<<2时时)就会引起就会引起C值的明显的变化值的明显的变化¡下面列举了下面列举了a的部分样本值和对应的的部分样本值和对应的C值;值;其中常数其中常数C可以通过前面的公式计算可以通过前面的公式计算洛特卡定律 指数和常数的对应值指数和常数的对应值2.86%2.58%2.43%4.26%洛特卡定律 3.2、洛氏定律的适用性研究、洛氏定律的适用性研究¡洛特卡定律是对两个洛特卡定律是对两个学科抽样统计的推广学科抽样统计的推广,在其他情况下,在其他情况下是否适用?是否适用?¡ 研究学者:研究学者:休伯特(休伯特(Hubert)、德莱斯顿()、德莱斯顿(Dresden)、)、戴维斯(戴维斯(Davis))等都进行过研究,涉及到不同学科、时等都进行过研究,涉及到不同学科、时期、国家或单位、类型的科学文献的作者分布规律。

从各期、国家或单位、类型的科学文献的作者分布规律从各个不同角度来检验或修正洛氏定律个不同角度来检验或修正洛氏定律¡有的还深入到文献的某些子集,如某一年度有的还深入到文献的某些子集,如某一年度/某一类型的文某一类型的文献,如会议文献、图书等;献,如会议文献、图书等; 或某一单位收藏的文献等,或某一单位收藏的文献等,进行作者分布的探讨;进行作者分布的探讨; ¡有的则对洛氏定律提出了修正的可能性,如普赖斯有的则对洛氏定律提出了修正的可能性,如普赖斯((Price)) 、布克斯坦(、布克斯坦(Bookstein)、阿利森)、阿利森((Allision)等人的论著研究了这一课题,特别是)等人的论著研究了这一课题,特别是Price的的研究取得了重要成果研究取得了重要成果¡目前,一般认为,在一定统计条件下,洛氏定律在大多数目前,一般认为,在一定统计条件下,洛氏定律在大多数学科领域是适用的,能够描述科学文献作者分布规律和科学科领域是适用的,能够描述科学文献作者分布规律和科学家著述的行为模式学家著述的行为模式洛特卡定律 ¡国外学者在经济学、生物学、情报学、图国外学者在经济学、生物学、情报学、图书馆学、法医学、人类学、计算机学等不书馆学、法医学、人类学、计算机学等不同学科领域分别对其进行了适用性验证,同学科领域分别对其进行了适用性验证,并以此为基础并以此为基础提出了修正洛特卡定律的可提出了修正洛特卡定律的可能性。

能性¡其中最具影响力的是其中最具影响力的是1986年年帕欧帕欧利用包括利用包括20个学科和个学科和3个大型图书馆目录在内的个大型图书馆目录在内的48组组有关文献作者分布的数据验证洛特卡定律,有关文献作者分布的数据验证洛特卡定律,并重新界定了洛特卡分布中并重新界定了洛特卡分布中参数的取值范参数的取值范围围,推动了洛特卡定律的发展,推动了洛特卡定律的发展洛特卡定律 3.3、洛氏分布机理的研究¡ 大量修正性实验总结:大量修正性实验总结:影响洛特卡平方反比律影响洛特卡平方反比律f(x)=c/x2的因素:的因素: ①①学科特征学科特征统计研究的学科的性质、范围、特点、发展阶段以统计研究的学科的性质、范围、特点、发展阶段以及与其他学科的相关度等都会对其分布产生本质上的影响及与其他学科的相关度等都会对其分布产生本质上的影响¡原因:原因:一方面,科学的一方面,科学的分化分化趋势显著,一个学科内部可能会不趋势显著,一个学科内部可能会不断产生新的发展点;另一方面,科学研究的断产生新的发展点;另一方面,科学研究的综合化综合化趋势也在加趋势也在加剧,边缘科学不断得到发展各学辩的研究方法也产生了一些剧,边缘科学不断得到发展。

各学辩的研究方法也产生了一些新的特点新的特点¡而而洛特卡定律掩藏了不同学科、同一学科在不同发展阶段上文洛特卡定律掩藏了不同学科、同一学科在不同发展阶段上文献与作者分布间的差异性,缺乏对学科发展及文献增长的动态献与作者分布间的差异性,缺乏对学科发展及文献增长的动态性描述性描述;此外,洛特卡定律对;此外,洛特卡定律对合作现象合作现象的研究较少,对合著者的研究较少,对合著者的科学贡献研究不足因此,随着现代研究环境的不断变化,的科学贡献研究不足因此,随着现代研究环境的不断变化,洛特卡定律的普适性受到了一定的限制洛特卡定律的普适性受到了一定的限制¡以主题数据拟合洛特卡分布需要注意进行数据的甄别和选取,以主题数据拟合洛特卡分布需要注意进行数据的甄别和选取,样本容量的控制样本容量的控制洛特卡定律 ¡影响表现:影响表现: 研究表明,研究表明,基础理论学科与应用技术基础理论学科与应用技术学科之间、学科之间、比较比较成熟的学科与新兴学科成熟的学科与新兴学科之间、范围之间、范围宽广的宽广的学科与较窄学科与较窄的学科之间,其文献的作者分布呈的学科之间,其文献的作者分布呈现出一定的现出一定的差别差别 就物理学而言,就物理学而言,a=2是合理的;对于技术科学、是合理的;对于技术科学、社会科学和人文科学来说,社会科学和人文科学来说,a值将增大;而规模值将增大;而规模较大和科研合作程度较高的学科,较大和科研合作程度较高的学科,a会变小。

会变小¡在很长一段时期内,对洛特卡定律的验证基本在很长一段时期内,对洛特卡定律的验证基本上是在理论科学领域进行的,大多数情况下符上是在理论科学领域进行的,大多数情况下符合洛合洛 氏分布¡例:例:1979年,加拿大学者将洛氏定律引入到应年,加拿大学者将洛氏定律引入到应用科学和工程技术领域,发现存在着一定偏差用科学和工程技术领域,发现存在着一定偏差但他们认为这可能是但他们认为这可能是理论科学和技术科学理论科学和技术科学之间之间的差异而引起的的差异而引起的洛特卡定律 ②统计条件 统计时,影响平方反比定律的主要有两个量统计时,影响平方反比定律的主要有两个量 ——统计研究的时间跨度和作者数量统计研究的时间跨度和作者数量一般来说,若统计的时间较长(如来说,若统计的时间较长(如10年以上)、年以上)、作者集合较大(如作者集合较大(如1000人以上),人以上), 其研究其研究将会得到比较客观的结论将会得到比较客观的结论洛特卡定律 ¡罗兰德罗兰德《《w..D .. Roland)认为,认为,数据样本的时间选择对洛数据样本的时间选择对洛持卡定律的拟合非常重要持卡定律的拟合非常重要¡特别是当一个学科的学术研究进入到成熟期之后,由于产文特别是当一个学科的学术研究进入到成熟期之后,由于产文量较小的低产作者人数的增加,时间因素的影响更加明显。

量较小的低产作者人数的增加,时间因素的影响更加明显事实上,每一个学科都存在着各自不同的发展阶段,洛特卡事实上,每一个学科都存在着各自不同的发展阶段,洛特卡定律对定律对不同阶段不同阶段的科学生产率的描述能力不同的科学生产率的描述能力不同¡萌芽期萌芽期,其作者数量很少,研究成果微乎其微;,其作者数量很少,研究成果微乎其微;¡而一旦发现了而一旦发现了学科学科“先锋先锋”,将很快取得突破性的学术进展,,将很快取得突破性的学术进展,洛特卡不能很好地描述这两个时期的作者分布洛特卡不能很好地描述这两个时期的作者分布¡论文作者数量剧增,出现核心律者的高峰期论文作者数量剧增,出现核心律者的高峰期,洛特卡定律则,洛特卡定律则体现出对作者分布良好的描述力体现出对作者分布良好的描述力¡基于以上分析,基于以上分析,要对某学科领域进行洛特卡分布的拟合以对要对某学科领域进行洛特卡分布的拟合以对其研究状况和科学生产率有全面准确的了解,必须注意其数其研究状况和科学生产率有全面准确的了解,必须注意其数据的来源,包括时间范围的界定、学科内分支研究领域的选据的来源,包括时间范围的界定、学科内分支研究领域的选取、来源期刊的学术水平等因素。

取、来源期刊的学术水平等因素——C值越大,说明作者的分布越平均,高产作者的贡值越大,说明作者的分布越平均,高产作者的贡献越小洛特卡定律 ¡国外提供的一些数据,国外提供的一些数据, 其症结一般都在一篇其症结一般都在一篇论文作者分布比率偏高上如洛特卡数据应论文作者分布比率偏高上如洛特卡数据应为为60.79%,, 而利夫斯而利夫斯 ((D·H·Leavens )) 的的计量经济学数据是计量经济学数据是63.50% ,, 美国国会图书美国国会图书馆关于馆关于 Marc磁带标题作者的数据是磁带标题作者的数据是65.65% 这样的偏差实际上是由这样的偏差实际上是由统计数据时间范围统计数据时间范围的不同所至的不同所至统计数据的时间范围统计数据的时间范围洛特卡定律 洛特卡定律 ③③研究方法研究方法¡在科学生产率的研究中,洛特卡所采取的方法基本上在科学生产率的研究中,洛特卡所采取的方法基本上是可取的,但是可取的,但在选择化学数据时却采用了不正规的抽在选择化学数据时却采用了不正规的抽样方法¡后来的研究说明,后来的研究说明,处理方法处理方法上的差异,特别是对合著上的差异,特别是对合著者和高产作者群的不同处理将会影响其研究结果。

高者和高产作者群的不同处理将会影响其研究结果高产作者的数据对其直线关系影响颇大产作者的数据对其直线关系影响颇大¡因此,因此,在确定洛特卡分布关系时必须截删一部分高产在确定洛特卡分布关系时必须截删一部分高产作者数据作者数据同时,由于科学技术的发展和科学研究出同时,由于科学技术的发展和科学研究出现的新的特点,使得现在的著述规律与洛特卡那时的现的新的特点,使得现在的著述规律与洛特卡那时的情况已大不相同因此,洛特卡情况已大不相同因此,洛特卡对合著者的处理对合著者的处理方法方法现在就不太合适了,而应该加以改进现在就不太合适了,而应该加以改进¡在研究和运用洛特卡定律时,如何处理合著者和截删在研究和运用洛特卡定律时,如何处理合著者和截删高产作者数据是两个必须解决的重要问题高产作者数据是两个必须解决的重要问题洛特卡定律 国内国内——以一个实验为例以一个实验为例¡定律验证工作起步较晚,始于定律验证工作起步较晚,始于20世纪世纪80年代,但成果斐然,并在年代,但成果斐然,并在分析验证结果的基础上.在分析验证结果的基础上.在合著者的处理、合著者的处理、K—S检验的适用范检验的适用范围、洛特卡分布中参数的拟合方法围、洛特卡分布中参数的拟合方法等方面提出了不少独到的见解,等方面提出了不少独到的见解,并积极将洛特卡定律并积极将洛特卡定律应用到新兴学科发展趋势的预测研究应用到新兴学科发展趋势的预测研究中,目中,目前验证研究多集中于前验证研究多集中于各类学报及学术期刊各类学报及学术期刊,而对,而对特定学科或主题特定学科或主题领域领域的验证研究较少,仅有的数学类科学文献和哲学类科学文献的验证研究较少,仅有的数学类科学文献和哲学类科学文献两个学科类研究样本的拟合结果都不支持洛特卡定律。

两个学科类研究样本的拟合结果都不支持洛特卡定律¡VIP的检索结果表明,截至的检索结果表明,截至2008年,验证洛特卡分布的文献共有年,验证洛特卡分布的文献共有30篇,在这篇,在这32个样本中,有个样本中,有3例结果不支持洛特卡定律:例结果不支持洛特卡定律:《《物理物理学报学报》》论文合著者不符合洛特卡分布,数学和哲学文献的分布情论文合著者不符合洛特卡分布,数学和哲学文献的分布情况也不符合洛特卡分布况也不符合洛特卡分布¡除此之外,除此之外,《《水利学报水利学报》》、、《《数理统计与管理数理统计与管理》》、、《《林业科学林业科学》》、、《《数学学报数学学报》》等专业期刊和等专业期刊和《《八一农学院学报八一农学院学报》》、、《《西藏民族学西藏民族学院学报院学报》》 、、《《期刊管理文摘期刊管理文摘》》等学报型期刊以及嘉兴府志所载明等学报型期刊以及嘉兴府志所载明清文献均服从洛特卡分布清文献均服从洛特卡分布¡值得特别提出的是,中国科学院国家科学图书馆尝试将洛特卡定值得特别提出的是,中国科学院国家科学图书馆尝试将洛特卡定律引入律引入古典目录学研究古典目录学研究领域,并根据拟合的洛特卡参数推知当时领域,并根据拟合的洛特卡参数推知当时的学术发展状况,具有一定的现实指导意义。

的学术发展状况,具有一定的现实指导意义洛特卡定律 洛特卡分布拟合与洛特卡分布拟合与K—S检验的矛盾检验的矛盾¡华东师范大学商学院情报系的一个实验¡1997~2006年十年间图书情报领域以及CSSCI收录的8种核心期刊作者著述情况的数理统计分析,从多角度对图书情报领域洛特卡定律进行验证注:注:K—S检验:检验: Kolmogorov-Smirnov检验(柯尔莫哥洛夫检验(柯尔莫哥洛夫-斯摩斯摩洛夫),拟合优度检验法,用来检验数据的分布是不是符合一个理洛夫),拟合优度检验法,用来检验数据的分布是不是符合一个理论的已知分布论的已知分布洛特卡定律 洛特卡定律 ¡被被CSSCI收录的收录的8种图书馆学情报学核心期刊中,除种图书馆学情报学核心期刊中,除《《情报情报科学科学》》和和《《图书馆杂志图书馆杂志》》外的其他外的其他6种期刊的洛特卡分布函种期刊的洛特卡分布函数都通过了数都通过了K—S检验而10年间图情领域所有刊载著者及年间图情领域所有刊载著者及其论文文献的洛特卡分布函数也未通过其论文文献的洛特卡分布函数也未通过K—S检验,其著者检验,其著者总量高达总量高达49084,,Dmax值值0..0165远远大于临界值远远大于临界值Do0.073。

K—S检验:检验:计算计算累积累积实际频率分布实际频率分布函数函数和累积和累积理论频理论频率分布函数率分布函数的差值若差值中的最大值若差值中的最大值大于大于临界值,则认临界值,则认为理论和实际有显为理论和实际有显著差异;反之,则著差异;反之,则认为理论和实际无认为理论和实际无显著差异显著差异洛特卡定律 ¡图书情报领域各核心期刊图书情报领域各核心期刊C值在值在0..76~~0..89间浮间浮动,说明动,说明这这8种图情核心期刊中,在高产作者群稳种图情核心期刊中,在高产作者群稳定的情况下,科学研究的队伍在不断扩张,新生的定的情况下,科学研究的队伍在不断扩张,新生的科研力量正在逐渐形成规模并取得论文成果,科研科研力量正在逐渐形成规模并取得论文成果,科研新秀的涌现使核心期刊论文作者的分布越来越平均新秀的涌现使核心期刊论文作者的分布越来越平均,,特别是一篇论文作者所占的比率明显提高特别是一篇论文作者所占的比率明显提高¡而根据而根据10年间图情领域所有期刊著者和论文数据拟年间图情领域所有期刊著者和论文数据拟合的洛特卡分布函数中,合的洛特卡分布函数中,C值仅值仅0..591,不仅远远,不仅远远低于低于8种核心期刊的种核心期刊的C值,也低于其他学科的特征常值,也低于其他学科的特征常数。

数¡差异的产生是由于第二组拟合数据源于图情领域内差异的产生是由于第二组拟合数据源于图情领域内所有学术期刊数据的融汇,包括核心期刊和众多非所有学术期刊数据的融汇,包括核心期刊和众多非核心期刊,而各期刊的办刊宗旨、关注领域、学术核心期刊,而各期刊的办刊宗旨、关注领域、学术水平都存在很大水平都存在很大差异差异,数据交融混合后产生不同于,数据交融混合后产生不同于第一组数据的拟合结果也在情理之中第一组数据的拟合结果也在情理之中C值越大,说明作者的分布越平均,高产作者的贡献越小值越大,说明作者的分布越平均,高产作者的贡献越小洛特卡定律 ¡计算临界值的公式:计算临界值的公式:¡临界值临界值D0的大小仅仅取决于的大小仅仅取决于著者群著者群的大小著者数著者数量越大,临界值越小,检验精度越高,越不容易通量越大,临界值越小,检验精度越高,越不容易通过过K—S检验¡图书情报领域起步较早、理论体系完整、发展相对图书情报领域起步较早、理论体系完整、发展相对成熟,成熟,著者群体庞大,数量众多著者群体庞大,数量众多,文献量大,所以,,文献量大,所以,以图情领域所有论文作为样本,样本容量过大,不以图情领域所有论文作为样本,样本容量过大,不容易通过容易通过K—S检验。

相应的,由于检验相应的,由于《《情报科学情报科学》》和和《《图书馆杂志图书馆杂志》》的著者群体庞大,著者数量分别高的著者群体庞大,著者数量分别高达达1685和和1384,最终也没有通过,最终也没有通过K—S检验洛特卡定律 ¡K—S检验不适应大样本容量的数据拟合检验检验不适应大样本容量的数据拟合检验其适其适应范围较窄,不能反映成熟学科的发展情况,只能应范围较窄,不能反映成熟学科的发展情况,只能截取部分时域或者作者群体进行分析,或是对著者截取部分时域或者作者群体进行分析,或是对著者规模较小的新兴学科进行分析也就是说,规模较小的新兴学科进行分析也就是说,用用K—S检验的洛特卡规律不适用于具有庞大著者群的成熟检验的洛特卡规律不适用于具有庞大著者群的成熟学科,更不能适应这些学科的历史性研究学科,更不能适应这些学科的历史性研究¡更多实验参见:南京大学信息管理系李丽娜更多实验参见:南京大学信息管理系李丽娜.《《多视角对洛特多视角对洛特卡定律的验证和阐释卡定律的验证和阐释》》(选择了不同的数据组作为研究对象,(选择了不同的数据组作为研究对象,从学科、多种同类型期刊、一种期刊三个角度对洛特卡定律从学科、多种同类型期刊、一种期刊三个角度对洛特卡定律进行了验证。

进行了验证洛特卡定律 附:附: 1++1/2²++1/3²++ … ++1/n²→π²/6 的证明的证明¡首先是由欧拉推出来的,要用到泰勒公式首先是由欧拉推出来的,要用到泰勒公式¡将将sinx按泰勒级数展开:按泰勒级数展开: sinx==x--x3/3!++x5/5!--x7/7!++ … 于是于是sinx/x==1--x2/3!++x4/5!--x6/7!++ … ¡令令y==x2,有,有sinx /x==1--y/3!++y2/5!--y3/7!++ … 而方程而方程sinx==0的根为的根为0,±π,±2π,… 故方程故方程sinx /x ==0的根为的根为π²,(2π)²,… 即即1--y/3!++y2/5!--y3/7!++…==0的根为的根为π²,(2π)²,… ¡由韦达定理,常数项为由韦达定理,常数项为1时,根的倒数和=一次项系时,根的倒数和=一次项系数的相反数数的相反数 即即1/π²++1/(2π)²++…==1/3! 故故1++1/2²++1/3²++ … ==π²/6 洛特卡定律 4、洛特卡定律的基本应用¡洛特卡定律在信息分析与预测中的作用是明显的,比如我们可以利用它来预测著作数量与文献数量,从而便于搜集信息、掌握文献信息流的变动规律、预测科学家数量的增长和科学发展的规模及趋势等。

¡此外,在分析研究人口的分布状况和城市的比例结构等类似的信息分析与预测工作中,洛特卡定律也有一定的应用洛特卡定律 4、洛特卡定律的基本应用总体来说表现在三个方面: 一、反映科技劳动成果状况一、反映科技劳动成果状况: 可从统计或估算著者数量来预测文献数量的增长速度和文献流向; 二、科学估计劳动规模:科学估计劳动规模: 预测科学家数量的增长和科学家发展的规模及趋势; 三、掌握科学论文的作者队伍:三、掌握科学论文的作者队伍: 研究科学家的活动规律,研究人才的著述特征,合理编制著者索引,规划检索刊物体系;洛特卡定律 4、洛特卡定律的基本应用具体来说表现在以下几个方面:具体来说表现在以下几个方面:¡科研人员的著述状况和发表论文数量科研人员的著述状况和发表论文数量—测定具有不同数量论文的作者之分布规律—揭示科学工作者生产科学文献的能力¡分析每一篇论文的作者数量—阐明完成一篇科学论文要“占用”多少作者洛特卡定律 4、洛特卡定律的基本应用¡在信息科学、图书馆学方面在信息科学、图书馆学方面—测定各学科的“平均文献作者数”,合理编制著者索引、规划检索刊物体系的参考价值和指导意义。

¡在预测科学方面在预测科学方面—预测文献数量的增长速度和文献流向的动向—预测科学家数量的增长和科学发展规模¡在科学学和人才学方面在科学学和人才学方面—科学家的活动规律、研究著述特征,便于科学学的理论研究和科学史的探讨洛特卡定律 5、洛特卡定律的特点 立足于三个方面:立足于三个方面: 一、研究对象一、研究对象 二、相关模型二、相关模型 三、函数关系三、函数关系洛特卡定律 5、洛特卡定律的特点¡研究对象: 科学论文在作者上集中与分散的的分布现象具体来讲表现在三个方面: a、揭示某一具体对象在其主体来源中的集中与离散规律; b、我们所考察的具体对象的绝大多数集中与少数主体来源; c、具体对象的少部分却分散在大多数的主体来源之中洛特卡定律 5、洛特卡定律的特点¡相关模型:相关模型: 采用频次排序的方法,即按照某类作者出现的频次大小(实际发表论文数)排位,而非按照作者所写的论文多少比较来对作者进行等级排序,因而等级上会有空位。

洛特卡定律 5、洛特卡定律的特点¡函数关系:函数关系: 反映某种主体与其所表现的特征之间的数量对应关系,论文在作者上的集中与分散成都只限于平方反比关系,即只给出了这种集中与分散程度的单一描述洛特卡定律 6、洛特卡定律的几点注意1、经验定律:、经验定律:洛特卡定律毕竟只是从两组实际统计数据中总结出来的经验定律,尽管许多学者进行了有益的探讨,但至今还需要进一步从理论上进行严格的论证2、平方反比规律:、平方反比规律:平方反比规律并不能很好地符合各个学科各种文献统计范围的著者与文献的分布规律,然而就倒幂次这个意义上讲,即a取一定范围浮动值时,还是比较好地反映了著者与其撰写的论文数量上的规律3、高产作者处理:、高产作者处理:洛特卡当年得出平方反比定律形式时,对高产作者部分进行了删节,摒弃了与平方反比率相悖的因素洛特卡定律 Thank you! 洛特卡定律 。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档