全面了解洛特卡定律•报告人:朱成林•学号:123072主要内容:1.认识洛特卡2.洛特卡的新发现3.人们又发现了洛特卡定律?4.“洛特卡”在中国5.洛特卡定律的大用处1、认识洛特卡1.1年少时的洛特卡在133年前,同样是一个阳光明媚的上午,住在奥地利伦伯格的一家美国家庭迎来了一个新的成员,这就是我们今天要讲的主角的发明者——阿尔弗雷德.J.洛特卡年轻的洛特卡曾在法国和德国求学,毕业后即离开欧洲,前往大洋彼岸的美国谋职,并先后在美国化学总公司、国家专利局、国家标准局等机构工作1.2 洛特卡成为科学家1926年,46岁的洛特卡将统计研究的方向转移到科学家与其发表的科学文献之间的数量关系上此时的洛特卡正供职于美国一家人寿保险公司,他经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院报》上发表了一篇题名为《科学生产率的频率分布》的论文,虽然这篇论文发表后并未引起多大反响,但到1949年这一成果引起学术界关注,并誉之为“洛特卡定律”这也使默默无闻的洛特卡成为世界著名的科学计量学家洛特卡擅长于统计研究,在科学上的兴趣首先集中在生物体总数的动态状况研究,并发展了一种用出生率、死亡率和年龄分布函数表示的“人口分析理论”。
2、洛特卡的新发现2.1 洛特卡的实验1926年,洛特卡凭借多年的统计直觉发现科学家与其论文间可能存在一定的联系因此,他选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源做了一个统计实验,旨在研究科技工作的论著数量分布,通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献他统计分析了《化学文摘》1907年~1916年10年累计索引中,姓氏以字母A和B开头的6891位作者,并分别列出发表过1篇到346篇论文的人数而后统计分析了《物理学史一览表》中1900年前物理学领域内出现的1325位物理学家及其论著2.1 洛特卡的实验频数频数频率频率在上述统计分析的基础上,洛特卡发现:“写了2篇论文的科学家人数大约是写了1篇论文科学家人数的1/4;而写了3篇论文的科学家人数大约是写了1篇论文科学家人数的1/9;同样,写了n篇论文的科学家人数大约是写了1篇论文科学家人数的1/n²”这就是后来著名的“洛特卡定律”又被齐普夫称为“平方反比定律”2.2 洛特卡发现的是一个经验规律3、人们又发现了洛特卡定律?由于多种原因,洛特卡定律沉睡了30多年,后来由于普赖斯等人的发掘,自60年代起引起人们的重视。
60年代初期,普赖斯的两部重要著作的出版使洛特卡的研究工作和成果随之得以广泛传播,有力地推动了这一定律的研究和发展70年代,科尔(R·C·Coile)找到了一种判断某组实验数据是否符合洛特卡分布的鉴定方法;弗拉奇弗拉奇(J·Valchy)则探讨了洛特卡定律的影响因素及作用1969年,费尔桑(Foirthorne)首次将布拉德福、齐普夫以及芒代尔布罗分布同洛特卡的频率分布联系起来,指出洛特卡的关系式对低产作者来说是适合的3.1 “洛特卡定律”一般公式的研究 其中,n为单个作者发文数,且1≤n≤T;T为单个作者最大发文数;f(n)为发表n篇论文的作者的比例;a与c为常数3.1.1 “洛特卡定律”中的“a”对于a的确定,洛特卡是根据统计结果总结出的其中,N为被考察的数据对的数量,X为logx,Y为logya=2但是人们对a=2这一结论提出了怀疑人们常采用最小二乘法估算,公式为:3.1.1 “洛特卡定律”中的“a”到70年代,弗拉奇对a进行的研究表明,a值在1.2~3.5之间波动可见a=2只是洛特卡倒幂法则一般公式的一个特例。
而a的取值要受到N的大小、学科的性质和发展程度等因素的影响在一定意义上说,特征指数a被看做是科学论文作者分布不平衡性的量度标准洛特卡通过统计结果认为a=2,在此条件下求c:令 n=1,2,……,则有:3.1.2 “洛特卡定律”中的“c”公式两边取累积和:由于f(n)表示撰写n篇论文的作者比例,显然有:3.1.2 “洛特卡定律”中的“c”则有:以上是洛特卡确定的c,实际上它仅局限于a=2的情形;确立的只是科学生产率的平方反比律一些学者探讨了洛氏定律的普遍性意义a并不一定都等于2,而c会则在0.6079附近上下波动对此,3.1.2 “洛特卡定律”中的“c”通过以上公式计算当a=2时,可得C=f(1)=60.79%,说明此时上述公式是正确的弗拉奇也提出了自己的观点,当a取任意值时,可以用以下公式计算c:通过计算不同的a值与c值,3.1.2 “洛特卡定律”中的“c”不同的a值将产生一个显著不同的常数c,而且a的较小变化(特别是在a<2时)就会引起c值的明显的变化下面列举了a的部分样本值和对应的c值;其中常数c可以通过前面的公式计算弗拉奇发现3.1.2 “洛特卡定律”中的“c”2.86%4.26%2.8%2.5%3.2 对“洛特卡定律”的适用性研究由于洛特卡只是对两个学科进行统计分析,人们不禁疑问:一条途径,即是希望从数学方法上修正“洛特卡定律”,代表人物有普赖斯(Price)、布克斯坦(Bookstein)、阿利森(Allision)等人。
另一条途径,则是利用“洛特卡定律”对其他学科的作者文献分布情况进行实证研究,如休伯特(Hubert)、德莱斯顿(Dresden)、戴维斯(Davis)等对此,国外学者基本从两个途径进行研究:洛特卡定律在其他学科中是否也适用洛特卡定律在其他学科中是否也适用吗吗??3.2 对“洛特卡定律”的适用性研究图情学经济学生物学人类学法医学计算机学国外学者的实验领域3.3 洛氏分布机理的研究通过大量修正性实验,总结影响洛特卡“平方反比定律”f(x)=c/x2的因素有:1.学科特征学科的性质、范围、特点、发展阶段以及与其他学科的相关度等都会对其分布产生本质上的影响研究表明,基础理论学科与应用技术学科之间、比较成熟的学科与新兴学科之间、范围宽广的学科与较窄的学科之间,其文献的作者分布呈现出一定的差别就物理学而言,a=2是合理的;对于技术科学、社会科学和人文科学来说,a值将增大;而规模较大和科研合作程度较高的学科,a会变小在很长一段时期内,对洛特卡定律的验证基本上是在理论科学领域进行的,大多数情况下符合洛氏分布2.统计条件统计时,影响平方反比定律的主要有两个量:统计研究的时间跨度和作者数量一般来说,若统计的时间较长(如10年以上)、作者集合较大(如1000人以上),其研究将会得到比较客观的结论。
3.3 洛氏分布机理的研究3.研究方法在科学生产率的研究中,洛特卡所采取的方法基本上是可取的,但在选择化学数据时却采用了不正规的抽样方法后来的研究说明,处理方法上的差异,特别是对合著者和高产作者群的不同处理将会影响其研究结果高产作者的数据对其直线关系影响颇大因此,在研究和运用洛特卡定律时,如何处理合著者和截删高产作者数据成为学者展开讨论的两个重要问题3.3 洛氏分布机理的研究4、 “洛特卡”在中国国内对于洛特卡定律的研究起步较晚,20世纪 80年代国内才出现相关研究,通过文献检索得到最早的研究学者是王洵、文武商等,他们在论文中简述了洛特卡定律的形成及适用性等问题国内学者对“洛氏定律”的研究同国外学者的研究路径基本一致,一部分致力于对洛氏一般公式的参数进行数学修正,另一部分则致力于对洛氏定律适用性差异的内在机理进行研究•方曙、李后强:以分形理论解释了洛特卡定律及公式中幂指数的意义, 为从数学角度研究该定律开辟了新的研究思路•罗式胜:从其局限性出发,推导出洛特卡定律的第二种描述形式,为理论的进一步完善做了必要的准备•张贤澳:指出最小二乘法确定参数的缺陷,主张以非回归分析法,直接对参数 n(即上述a)、c 值进行估算。
•吴承祯:对以上方法进行了总结, 认为以遗传算法拟合洛特卡分布,能更好地实现最优拟合•钟旭:对合著者是否符合洛特卡定律进行了验证,证明合著者的科学生产率的分布符合洛特卡定律•林宝山 ,曲焕云,李丽娜:认为 K—S 检验更适应新兴科学的研究,但其具有局限性,不适用于成熟学科及学科著者群的历史性研究因此,需要一种更优越的方法来保证洛特卡定律验证结果的科学准确4、 “洛特卡”在中国5、“洛特卡定律”的大用处从科学学方面,从科学学方面,研究科学家活动规律、研究科学家活动规律、人才的著述特征人才的著述特征从情报学方面看,从情报学方面看,洛氏定律可以预测洛氏定律可以预测著者数量和文献数量著者数量和文献数量从人口学方面看,从人口学方面看,分析研究人口的分布状况分析研究人口的分布状况和城市的比例结构和城市的比例结构利用洛特卡定律利用洛特卡定律对网络作者的活动对网络作者的活动进行分析进行分析结语:洛氏的著者分布规律自1926年提出,经过30余年的沉寂终被人们所熟知,并称其为“洛特卡定律”洛特卡定律”创立至今已经80多年诚然,“洛特卡定律”的适用性一直受到国内外学者的质疑,并不断有学者提出修正。
但无可争议的是,这一定律是文献计量学三大定律中创立最早的一个定律,也是文献信息计量学的经典定律之一在此之后,文献计量学的其他两大定律相继创立,共同奠定了文献计量学的基础谢谢!•报告人:朱成林•学号:123072。