基于作者贡献的合著网络加权模式研究

资源描述

《基于作者贡献的合著网络加权模式研究》由会员分享，可在线阅读，更多相关《基于作者贡献的合著网络加权模式研究（6页珍藏版）》请在金锄头文库上搜索。

1、工作研究基于作者贡献的合著网络加权模式研究朱丽娟1， 2， 3于建荣2( 1 中国科学院国家科学图书馆，北京 100190; 2 中国科学院上海生命科学信息中心，上海 200031; 3 中国科学院研究生院北京 100190)文摘社会网络分析方法越来越多地被应用到合著关系研究当中，目前几种合著网络边权计算的方法均存在各自的缺点和不足。本文针对根据合著次数及合著强度计算合著网络边权方法中将文献中各作者之间合著关系做相同处理，而不考虑不同作者之间合著关系强度差异性这一缺点，从作者贡献的角度，引入作者署名次序、通讯作者情况等因素对这种方法进行改进。并对改进前后的结果进行对比分析，结

2、果表明基于作者贡献的合著网络模型比基于作者数量的合著网络模型更好地反映合著状态。关键词含权合著网络加权模式作者贡献Research of Weight Measurement of Co Author Networks Based on Author ContributionZhu Lijuan1， 2， 3，Yu Jianrong2( 1 National Science Library，Chinese Academy of Sciences，Beijing 100190;2 Shanghai Information Center for life Sciences，CAS，Shanghai

3、 200031;3 Graduate University，Chinese Academy of Sciences，Beijing 100190)Abstract: Social network analysis becomes more and more popular in the study of co- author relation-ship，but there exist specific shortcomings and defects in the present calculation methods aboutweight measurement in co- author

4、 networks Against the defect that calculation methods using collab-oration times and collaboration strength to calculate collaboration network weight usually conduct thesame treatment to all authors in the literature and neglect the different role of different authors pla-ying in the collaboration r

5、elationship strength， this paper improve that method from the perspective ofauthor contribution by considering factors such as authors signature sequence，corresponding authorsand so on By comparing the results between the original and the improved methods，the resultsshow that measure of co author ne

6、tworks based on author contribution is more effective than meas-ures based on author number in reflecting the state of collaborationKey words: Weighted co author networks，Measurement of weight，Author contribution1前言自 2001 年 Newman 首次用社会网络方法构建合著关系网络对合著关系进行分析研究开始1， 2 ，社会网络分析方法越来越多地被应用到合著关系研究当中，为能够更准确

7、地描述各领域合著关系的真实情况、更好地了解科学领域的合作状态、了解科学合作的发展机制、发现科研合作的一般特征等提供了新的思路。目前合著网络边权计算的方法有多种，主要有根据合著次数计算网络边权3 ; 根据合著次数及合著强度计算2 ; 根据合著次数、合著强度和合著效果计算4 以及广义的科研合作网络边权计算方法5 61图书馆杂志( Library Journal)2011 年第 5 期( Vol30 No 5)等。其中第一种方法不仅反映作者之间是否存在关系，并对关系大小予以区分，但是这种方法将不同合著论文中的合著关系做相同处理，没有考虑合著人数的影响; 第二种方法根据合著人数的不同，

8、对单篇文献中的合著强度予以区分，但这种方法将文献中各作者之间合著关系做相同处理，不考虑不同作者之间合著关系强度的差异; 第三种方法对不同文献根据其被引情况做不同处理; 第四种方法对合著、引用和致谢三种行为加以不同的权重来研究广义科研合作网络。后两种方法均考虑到文献的被引情况，由于被引用本身的特点，这两种方法存在着时间滞后性6 。本文将针对前文第二种方法 Wi， j= k1 nk1将文献中各作者之间合著关系做相同处理，而不考虑不同作者之间合著关系强度差异性这一缺点，从作者贡献的角度对其进行改进。 2基于作者贡献的合著网络加权模式构建合著网络中两作者之间合著关系的强度即两节点之间连边

9、大小，会根据合著网络中作者之间合著次数的不同而有所不同，一般来说，在单次合著行为的合著强度基本相当时，合著次数多的作者之间要比合著次数少的作者之间的关系更为紧密，更加了解彼此7 。两作者之间的合著关系是多次合著行为形成的结果，一般来说，作者之间的合著次数会越来越多，相应作者之间的关系也会越来越紧密。作者之间合著次数随着时间的推移逐渐增加，以致于两作者之间的合著关系越来越紧密，从而影响到了整个合著网络。2004 年， Newman 提出了根据合著次数及合著强度共同来计算合著关系网络边权的方法2 ，这种方法对简单加权的方法进行了一定程度的改进，认为两个作者之间的合著强度不是

10、恒定的，而是根据文献合著作者人数的不同而有所不同，一篇文献著者的数量和合著强度成反比。Wki， j=1 nk1Wi， j= kWki， j= k1 nk1其中: Wki， j 论文 k 中，作者 i 与作者 j 之间的合著强度nk 论文 k 中，合著作者的总人数Wi， j 作者 i 与作者 j 两个节点之间的边权针对这种方法将文献中各作者之间合著关系做相同处理，而不考虑不同作者之间合著关系强度差异性这一缺点，可以从作者贡献的角度对其进行改进和完善，在合著关系权重计算过程中不仅考虑合著文献数量及文献作者人数因素，还将对作者署名次序、通讯作者情况等作者贡献相关因素予以考虑。从作者

11、贡献角度来衡量单次合著行为各个作者之间的合著强度，可以从作者贡献、合著作者数量及作者署名次序( 包括通讯作者情况) 等方面着手。2 1作者贡献模型目前对作者贡献的研究有很多，主要有理想状态下作者贡献模型即线性分布模型和指数分布模型。理想状态下作者贡献模型，是在不考虑通讯作者情况，所有合著论文的署名次序排列代表作者贡献大小，且其贡献份额递减程度是相同的情况下，其分布为线性分布8 ，如下:C( s)=( n s +1) ns =1( n s +1)其中， s 表示作者署名次序， n 表示作者数量。指数分布模型9 :C( a， s)=1 as 1其中， a 是反映作者次序权重的常数，

12、大于 1， s表示作者署名次序， n 表示作者数量。a 越大，不同次序的作者贡献极差就越大。一般情况下，合著文献作者数量越少，不同署名次序的作者贡献差异就越大，反之，则不同署名次序的作者贡献差异就越小。因此，参数 a 的数值要随着合著文献作者数量而在一定范围内有所波动，作者数量越少，则参数 a数值应越大。作者贡献线性模型，在不考虑通讯作者的情况下，作者贡献大小按照合著论文的署名次序排列，且其贡献份额递减程度是相同的，均为 C =2 n( n +1)，随着作者人数的增加贡献份额递减程度C 也相应减少。当作者人数足够大时，相邻作者人数之间的贡献份

13、额递减程度C 趋近于相等，limn+ Cn 1 Cn=0 。而当相邻作者人数之间的贡献份额递减程度C 趋近于相等时，作者贡献线性模型则无法准确描述作者人数及署名次序对作者贡献的影响。此处以万分之五作为临界值，低于万分之五将不再考虑，也就是使得相邻作者人数之间的贡献份额递减程度之差Cn 1 Cn0. 0005作为作者贡献线性模型的有效范围，即 n20 是该作者贡献线性模型的适用范围。无论是线性分布模型还是指数分布模型，都与匈牙利 P Vinkler 对 68 名化学研究人员在 1987 年71朱丽娟于建荣:基于作者贡献的合著网络加权模式研究发表的合著论文中的作者贡献度调查所得出的加权比

14、例结果接近10 ，线性分布模型在作者人数大于 20后作者之间贡献级差过小，但由于作者人数超过 20的文献数量较少且指数分布中参数 a 的确定较为复杂，所以在含权合著网络边权模型的构建过程中，以线性分布作为作者贡献简化模型。国际上一般很看重通讯作者，通讯作者即文章最重要的作者。通讯作者往往是论文的第一作者，当第一作者与通讯作者不同时，则有必要注明通讯作者情况。在存在通讯作者，且通讯作者不是第一作者的情况下，将通讯作者与第一作者同等看待，也就是假设通讯作者所做贡献与第一作者所做贡献是等同的，那么考虑通讯作者情况的作者贡献模型:C( s， n， p， t， m)=n +1 s1

15、m 1 2n( n +1)+ p( t 1)其中， s 表示作者的署名次序， n 表示文献 k 的作者数量， p 表示文献 k 是否存在通讯作者( 有通讯作者时 p =1，反之则 p =0) ， t 表示通讯作者的署名位置， m 表示作者 i 是否是通讯作者( 作者 i 是通讯作者时 m =1，反之 m =0) 。由于作者贡献简化模型的限制，合著作者人数不宜超过 20 人。2 2合著关系加权模型由于作者之间的合著关系是作者之间多次合著行为作用的结果，通过一次次的合著行为将某一领域内独立的各个作者联系起来，形成复杂的合著网络。前文假设合著网络边权是由单次合著关系强度累计叠加形成的，合

16、著网络的边权与合著次数及单次合著关系强度密不可分，如下:Wi， j= kWki， j其中， Wki， j 第 K 次合著行为中，作者 i 与作者 j 之间的合著关系强度Wi， j 作者 i 与作者 j 两个节点之间的合著边权根据前文的作者贡献模型 C ( s， n， p， t)=n +1 s1 m 1 2n( n +1)+ p( t 1)，可以得出单次合著关系强度模型:Wki， j=2( n +1) ( S1 mii+ S1 mjj) n( n +1)+2p( t 1)又合著网络边权是由单次合著关系强度累计叠加形成的 Wi， j= kWk i， j，所以合著网络模型中，两个作者之间的连边权重为:Wi， j= k2( n +1) ( S1 mii+ S1 mjj) n( n +1)+2p( t 1)其中， s 表示作者的署名次序， n

展开阅读全文