《信息计量学03之课件》由会员分享,可在线阅读,更多相关《信息计量学03之课件(38页珍藏版)》请在金锄头文库上搜索。
1、信息计量学信息计量学 第二章 文献信息增长规律(1)1信息计量学03-之2.1科学文献数量与科学发展科学文献数量与科学发展n2.1.1 文献信息流及其特性文献信息流及其特性n2.1.2 科学文献的增长科学文献的增长n2.1.3 反映科学发展的指标反映科学发展的指标n2.1.4 两个结论两个结论2信息计量学03-之2.1.1 文献信息流及其特性文献信息流及其特性n文献信息流:具有一系列主题特征的科学文献的集合。文献信息流:具有一系列主题特征的科学文献的集合。u静态特性:在一定时间内科学文献在空间的分布性质。静态特性:在一定时间内科学文献在空间的分布性质。n布拉德福定律、齐普夫定律、洛特卡定律布拉
2、德福定律、齐普夫定律、洛特卡定律u动态特性:科学文献随时间的延续而增长和老化的性质。动态特性:科学文献随时间的延续而增长和老化的性质。n文献信息增长规律、文献信息老化规律文献信息增长规律、文献信息老化规律n“当前,已发表文章的增长、老化和离散规律,理当前,已发表文章的增长、老化和离散规律,理所当然地被视为标志科学文献发展的最根本的规律。所当然地被视为标志科学文献发展的最根本的规律。”(苏苏米哈依洛夫)米哈依洛夫) 3信息计量学03-之n2008-20092008-2009网络游戏用户对比网络游戏用户对比 4信息计量学03-之 20092009年网络游戏用户规模持续增长,规模年网络游戏用户规模持
3、续增长,规模达到达到2.652.65亿人,较亿人,较20082008年增长年增长41.5%41.5%。值得关。值得关注的是,网络游戏是所有互联网娱乐领域中唯注的是,网络游戏是所有互联网娱乐领域中唯一使用率上升的服务,网民使用率从一使用率上升的服务,网民使用率从20082008年的年的62.8%62.8%提升至提升至68.9%68.9%。 原因:原因:n 网页游戏在网页游戏在20092009年得到了良好的发展年得到了良好的发展 n SNS SNS游戏游戏( (社交类游戏社交类游戏) )在在20092009年迅速崛起年迅速崛起 5信息计量学03-之n20092009网络文学用户网络文学用户 CNN
4、ICCNNIC在本次调查中增加了网络文学应用的研究。调查结果显示,网络文学在本次调查中增加了网络文学应用的研究。调查结果显示,网络文学用户规模达到用户规模达到1.621.62亿人,使用率为亿人,使用率为42.3%42.3%。 原因原因: :n 网络文学的开放性,使用户能够方便快捷的进行文字阅读,网络文学的开放性,使用户能够方便快捷的进行文字阅读,n 网络文学传播的广泛性及分成的模式又刺激了作家的创作热情网络文学传播的广泛性及分成的模式又刺激了作家的创作热情 网络文学受版权影响较大,盈利能力较其他互联网行业偏低,但网络文学受版权影响较大,盈利能力较其他互联网行业偏低,但网络文学可以为网络游戏、电
5、影、电视以及动漫等文化产业提供丰富的素材。网络文学可以为网络游戏、电影、电视以及动漫等文化产业提供丰富的素材。从发展趋势看,未来互联网的开放性会将更多的内容引入到网络文学,而网从发展趋势看,未来互联网的开放性会将更多的内容引入到网络文学,而网络文学内容的增多也会为其他产业提供更有力的支持,实现网络文学与其他络文学内容的增多也会为其他产业提供更有力的支持,实现网络文学与其他行业的彼此促进。行业的彼此促进。6信息计量学03-之n2008-2009网络视频用户对比网络视频用户对比 7信息计量学03-之 网络视频作为越来越被认可的媒体网络视频作为越来越被认可的媒体表现形式,市场价值、广告价值和受众规模
6、仍表现形式,市场价值、广告价值和受众规模仍将持续提升。将持续提升。20092009年视频网站对内容体系进行年视频网站对内容体系进行了大规模调整,将内容重点更多放在了影视剧了大规模调整,将内容重点更多放在了影视剧和专业机构制作的内容上。和专业机构制作的内容上。n网络视频媒体与传统影视媒体由竞争走向合作,网络视频媒体与传统影视媒体由竞争走向合作,n网络作为实现影视节目二次传播的新渠道网络作为实现影视节目二次传播的新渠道n传统新闻媒体、电视台和影视媒体纷纷拓展网传统新闻媒体、电视台和影视媒体纷纷拓展网络视频传播渠道络视频传播渠道8信息计量学03-之n2008-2009网络娱乐类应用用户对比 9信息计
7、量学03-之2.1.2 科学文献的增长科学文献的增长(I)n科学文献的增长科学文献的增长(Growth of Scientific literature) :随着时间的推延文献数量的增长情况。:随着时间的推延文献数量的增长情况。u实例:实例:美国化学文摘的增长情况:美国化学文摘的增长情况:n第一个第一个100万篇万篇 32年年(19071938),n第二个第二个100万篇万篇 18年,年,n第三个第三个100万篇万篇 8年,年,n第四个第四个100万篇万篇 4.75年,年,n第五个第五个100万篇万篇 3.3年年10信息计量学03-之2.1.2 科学文献的增长科学文献的增长(II)n科学知识量
8、的急剧增长科学知识量的急剧增长是科学文献激增的主要原是科学文献激增的主要原因因第一次翻番第一次翻番从公元初从公元初 一一 1750 1750年年历时历时17501750年年第二次翻番第二次翻番从从17501750年年 一一 1900 1900年年历时历时150150年年第三次翻番第三次翻番从从19001900年年 一一 1950 1950年年历时历时5050年年第四次翻番第四次翻番从从19501950年年 一一 1960 1960年年历时历时1010年年科学知识量翻番情况科学知识量翻番情况n其他原因:社会、教育、材料和加工技术等因素其他原因:社会、教育、材料和加工技术等因素11信息计量学03-
9、之2.1.3 反映科学发展的指标反映科学发展的指标n科学文献数量的变化科学文献数量的变化,是反映科学发展情况的,是反映科学发展情况的一个重要标志。一个重要标志。n其他指标:其他指标:u人员的数量人员的数量u机构的数量机构的数量u资金的数量资金的数量12信息计量学03-之2.1.4 两个结论两个结论1.科学知识的增长与科学文献数量的增长并不科学知识的增长与科学文献数量的增长并不是完全等同的。是完全等同的。科学知识量的增长并不是科学文献增长的惟一科学知识量的增长并不是科学文献增长的惟一原因。原因。科学文献数量并不是反映科学发展情况的惟一科学文献数量并不是反映科学发展情况的惟一标志。标志。2.科学文
10、献数量是最有效的科学指标。科学文献数量是最有效的科学指标。绝大部分的人类科研活动及其成果都是以文献绝大部分的人类科研活动及其成果都是以文献方式来记录和贮存的,两者关系密切。方式来记录和贮存的,两者关系密切。科学文献的数量巨大,且易于收集。科学文献的数量巨大,且易于收集。科学文献易于统计分类。科学文献易于统计分类。13信息计量学03-之2.2文献信息增长及其规律研究文献信息增长及其规律研究n2.2.1文献信息增长的影响及对策文献信息增长的影响及对策n2.2.2文献信息增长规律的意义与内容文献信息增长规律的意义与内容14信息计量学03-之2.2.1文献信息增长的影响及对策文献信息增长的影响及对策n
11、负面影响:负面影响:u影响情报工作的效率和情报事业的发展。影响情报工作的效率和情报事业的发展。u造成很多科研工作的重复和浪费。造成很多科研工作的重复和浪费。n对策:对策:u在技术手段上,采用计算机等现代化的先进技在技术手段上,采用计算机等现代化的先进技术和设备来处理和利用文献情报。术和设备来处理和利用文献情报。u在理论上,加强对在理论上,加强对文献增长规律文献增长规律的研究。的研究。15信息计量学03-之2.2.2文献信息增长规律的意义与内容文献信息增长规律的意义与内容n研究意义:研究意义:u揭示科学发展的某些特点和规律。揭示科学发展的某些特点和规律。u可以预测文献增长的趋势,从而为科学情报工
12、可以预测文献增长的趋势,从而为科学情报工作未来的发展提供决策依据。作未来的发展提供决策依据。n主要内容:主要内容:u理论研究:建立准确的数学模型及理论解释,以理论研究:建立准确的数学模型及理论解释,以进一步揭示科学文献的增长规律。进一步揭示科学文献的增长规律。u应用研究:运用文献增长规律指导实际情报工作应用研究:运用文献增长规律指导实际情报工作和情报管理;将文献数量指标用于度量知识,以和情报管理;将文献数量指标用于度量知识,以揭示科学发展规律等。揭示科学发展规律等。16信息计量学03-之2.3文献信息的指数增长规律文献信息的指数增长规律n2.3.1 文献信息测度指标的分类文献信息测度指标的分类
13、n2.3.2 指数函数及其特性指数函数及其特性n2.3.3 文献信息指数增长模型文献信息指数增长模型n2.3.4 指数增长模型分析指数增长模型分析17信息计量学03-之2.3.1文献信息测度指标的分类文献信息测度指标的分类n分类一:分类一:u绝对值指标绝对值指标n图书数量、期刊数量、论文数量图书数量、期刊数量、论文数量u相对值指标相对值指标n某个学科文献占全部文献的比例、不同类型文献的某个学科文献占全部文献的比例、不同类型文献的比例、不同语种文献的比例比例、不同语种文献的比例.n分类二:分类二:u非累积数(增量)非累积数(增量)u累积数累积数(总量)(总量)18信息计量学03-之n200920
14、09年第三季度中国电影市场研究报告年第三季度中国电影市场研究报告 2007-2009年第三季度电影市场数据年第三季度电影市场数据19信息计量学03-之20信息计量学03-之21信息计量学03-之22信息计量学03-之23信息计量学03-之2.3.2 指数函数及其特性指数函数及其特性n指数函数:自变量指数函数:自变量x在指数的位置上,在指数的位置上,y=ax(a0,a不等于不等于1) 性质比较单一,性质比较单一, 当当a1时,函数是递增函数,且时,函数是递增函数,且y0; 当当0a0. n幂函数:自变量幂函数:自变量x在底数的位置上,在底数的位置上,y=xa(a不等于不等于1). a不等于不等于
15、1,但可正可负,取不同,但可正可负,取不同的值,图像及性质是不一样的。的值,图像及性质是不一样的。 24信息计量学03-之n“指数增长规律指数增长规律”反映了事物反映了事物“持续生产自我持续生产自我”的过程。当一个量在一个既定的时间周期中,的过程。当一个量在一个既定的时间周期中,其百分比增长是一个常量时,这个量就显示出其百分比增长是一个常量时,这个量就显示出指数增长指数增长 n只有当事物的只有当事物的“持续增长率持续增长率”为常数时,才满为常数时,才满足足“指数增长规律指数增长规律” 。u持续增长率总量增加速度持续增长率总量增加速度 / 总量总量25信息计量学03-之2.3.3 文献信息指数增
16、长模型文献信息指数增长模型n“知识能产生知识,就像金钱能生利息一样。知识能产生知识,就像金钱能生利息一样。”(A.C.Doyle)u科学知识的增长也符合指数增长规律吗?科学知识的增长也符合指数增长规律吗?26信息计量学03-之2.3.3.1 Ryder的发现的发现n1944年,年, Fremont Ryder,对美国有代表性,对美国有代表性的大学图书馆的藏书增长率进行了研究。的大学图书馆的藏书增长率进行了研究。u结论:美国主要大学图书馆的藏书量,平均每结论:美国主要大学图书馆的藏书量,平均每16年递增一倍。年递增一倍。u数学规律?数学规律?27信息计量学03-之 德里克德里克.普赖斯普赖斯 (
17、Derek John de Solla Price,1921-1983) ,英国著名科学史家、科学学家、情报学,英国著名科学史家、科学学家、情报学家。家。1946年获伦敦大学实验物理学博士学位,后在新年获伦敦大学实验物理学博士学位,后在新加坡拉费尔斯学院任教。加坡拉费尔斯学院任教。1954年,获剑桥大学科学史年,获剑桥大学科学史博士学位。博士学位。1962年,任美国耶鲁大学科学史客座教授,年,任美国耶鲁大学科学史客座教授,后任该校医学和科学史系主任。后任该校医学和科学史系主任。1976年,荣获国际技术史学会授予的达芬奇奖;年,荣获国际技术史学会授予的达芬奇奖;1981年,荣获国际科学社会研究学
18、会授予的贝尔纳奖;年,荣获国际科学社会研究学会授予的贝尔纳奖;1983年,被遴选为瑞典皇家科学院国外院士。年,被遴选为瑞典皇家科学院国外院士。在他去世后不久,在他去世后不久,Scientometrics设立设立“普赖斯普赖斯纪念奖纪念奖”;美国耶鲁大学设立;美国耶鲁大学设立“普赖斯科学学奖普赖斯科学学奖”。一生共发表论著一生共发表论著240多件,主要有:巴比伦以来的科学多件,主要有:巴比伦以来的科学(Science since Babylon, 1961);小科学,大科学;小科学,大科学(Little Science, Big Science, 1963);科学论文网络;科学论文网络(Netw
19、orks of Scientific Papers, 1965)。)。普赖斯普赖斯为科学计量学和文献计量学的发展、为科学学的成为科学计量学和文献计量学的发展、为科学学的成长作出了重要的贡献,并在许多交叉领域都取得了显著的长作出了重要的贡献,并在许多交叉领域都取得了显著的成就。成就。28信息计量学03-之2.3.3.2 Price的指数增长模型的指数增长模型(I)n“似乎没有理由怀疑任何正常的、日益增长的科似乎没有理由怀疑任何正常的、日益增长的科学领域内的文献是学领域内的文献是按指数增加按指数增加的,每隔大约的,每隔大约1010年年到到1515年时间增加一倍年时间增加一倍”;“每年增长约每年增长
20、约5-75-7”。(Price,巴比伦以来的科学,巴比伦以来的科学,1961)n普赖斯曲线普赖斯曲线100200300400tF(t)29信息计量学03-之2.3.3.2 Price的指数增长模型的指数增长模型(II)n F(t) aebt (a0,b0) uF(t):时刻:时刻t的文献的文献累积量累积量; ut:时间(一般以年为单位);:时间(一般以年为单位);ua:条件常数,即统计的初始时刻:条件常数,即统计的初始时刻(t0)的文献量;的文献量;ue:自然对数的底:自然对数的底(e2.7183,有时可近似地,有时可近似地取为取为2);ub:时间常数,即:时间常数,即“持续增长率持续增长率”
21、(某一年文献的某一年文献的累积增加量与前一年文献累积总数的比值累积增加量与前一年文献累积总数的比值) 30信息计量学03-之2.3.3.2 Price的指数增长模型的指数增长模型(III)n F(t) aebt (a0,b0) uF(t):时刻:时刻t的文献的文献累积量累积量; ut:时间(一般以年为单位);:时间(一般以年为单位); ua:条件常数,即统计的初始时刻:条件常数,即统计的初始时刻(t0)的文献量;的文献量;ue:自然对数的底:自然对数的底(e2718,可近似地取为,可近似地取为2);ub:时间常数,即:时间常数,即“持续增长率持续增长率”(某一年文献的累积增某一年文献的累积增加
22、量与前一年文献累积总数的比值加量与前一年文献累积总数的比值) 100200300400tF(t)31信息计量学03-之2.3.3.3 重要指标的计算重要指标的计算(I)1.“持续增长率持续增长率 b” 与与 “年增长率年增长率 r”u b = ( dF(t) / dt ) / F(t)nb:持续增长率、连续增长率、增长系数;:持续增长率、连续增长率、增长系数;n在指数增长模型中,在指数增长模型中,b为常数;为常数; u r = ( F(t2) - F(t1) ) / F(t1)nr:年增长率(:年增长率( t2 t1 =1年);年);u r = eb 1 bn“年增长率年增长率”近似等于近似等
23、于“持续增长率持续增长率”。u例题:设某一时刻,某一学科的文献量为例题:设某一时刻,某一学科的文献量为10000件,件,文献年增长率为文献年增长率为10%,那么,那么10年以后的文献量是多年以后的文献量是多少?少?100年以后呢?年以后呢?32信息计量学03-之2.3.3.3重要指标的计算重要指标的计算(II)2.“翻倍时间翻倍时间 d”u d = ln2 / b 0.693 / bn“翻倍时间翻倍时间”与与“持续增长率持续增长率”成反比。成反比。3.“增长到增长到K倍所需的时间倍所需的时间T”u T = lnK / b33信息计量学03-之2.3.4 指数增长模型分析指数增长模型分析(I)1
24、.几何性质分析几何性质分析ub越大,曲线越陡;越大,曲线越陡;a值决定曲线的位置,不影值决定曲线的位置,不影响曲线的形状响曲线的形状tF(t)F(t)=aebtb值不同值不同tF(t)a值不同值不同34信息计量学03-之2.3.4 指数增长模型分析指数增长模型分析(II)2.正确性分析正确性分析uPrice提出的提出的“指数增长模型指数增长模型”是建立在事实基础是建立在事实基础之上的。之上的。u大量的统计结果表明,大量的统计结果表明,“指数增长模型指数增长模型”正确反映正确反映了科学文献的实际增长情况。了科学文献的实际增长情况。u“指数曲线的存在,显然具有普遍性和长期性。指数曲线的存在,显然具
25、有普遍性和长期性。”(Price)35信息计量学03-之2.3.4 指数增长模型分析指数增长模型分析(III)3.成因分析成因分析u指数增长规律的成因:事物的增长速度与现存该事物指数增长规律的成因:事物的增长速度与现存该事物的数量成正比。的数量成正比。u科学文献指数增长的原因:科学文献的增长速度是科学文献指数增长的原因:科学文献的增长速度是与现存的科学文献的数量成正比的。与现存的科学文献的数量成正比的。u“科学的发展同前一代人遗留下的知识量成比例。科学的发展同前一代人遗留下的知识量成比例。”(恩格斯)(恩格斯) n(社会学观点)社会情报交流的影响与推动(社会学观点)社会情报交流的影响与推动n“
26、指数增长规律指数增长规律”反映了事物反映了事物“持续生产自我持续生产自我”的过程。的过程。n只有当事物的只有当事物的“持续增长率持续增长率”为常数时,才满足为常数时,才满足“指数增指数增长规律长规律” 。(其中,持续增长率总量增加速度。(其中,持续增长率总量增加速度 / 总量)总量)36信息计量学03-之2.3.4 指数增长模型分析指数增长模型分析(IV)4.局限性分析局限性分析指数增长模型表示的是指数增长模型表示的是“文献累积量文献累积量” (总量)与(总量)与时间(年)的关系,未能反映时间(年)的关系,未能反映“非累积量非累积量”的变化的变化规律。规律。n“如果按每年问世的出版物数量来判断
27、科学文献的增长,如果按每年问世的出版物数量来判断科学文献的增长,那么它的进展甚至连几何性都不是,而仅仅是算术性的。那么它的进展甚至连几何性都不是,而仅仅是算术性的。” (苏苏米哈依洛夫)米哈依洛夫) 指数增长模型未考虑文献指数增长模型未考虑文献“老化老化”、“停刊停刊”等问等问题,与实际情况有出入。题,与实际情况有出入。37信息计量学03-之2.3.4 指数增长模型分析指数增长模型分析(V)4.局限性分析局限性分析指数增长模型对指数增长模型对“起始时间起始时间”很敏感,不同的统计很敏感,不同的统计起点会得到不同的结果。起点会得到不同的结果。n“在一个特定年度开始作累积曲线在一个特定年度开始作累积曲线”,那么无疑这一年,那么无疑这一年之前的文献被忽略了,结果增长率的估计通常偏大。之前的文献被忽略了,结果增长率的估计通常偏大。” (K. O. May, 1968) 指数增长模型只在一定的时间范围内有效,难以预指数增长模型只在一定的时间范围内有效,难以预测较长时间之后的文献总量。测较长时间之后的文献总量。38信息计量学03-之