计算社会学

上传人:w****i 文档编号:104411412 上传时间:2019-10-09 格式:PDF 页数:54 大小:4.63MB
返回 下载 相关 举报
计算社会学_第1页
第1页 / 共54页
计算社会学_第2页
第2页 / 共54页
计算社会学_第3页
第3页 / 共54页
计算社会学_第4页
第4页 / 共54页
计算社会学_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《计算社会学》由会员分享,可在线阅读,更多相关《计算社会学(54页珍藏版)》请在金锄头文库上搜索。

1、译文 第 7 卷 第 6 期 2011 年 6 月 70 不可重复的自述性数据。新的科学技术,比如视频 监控(video surveillance)1、电子邮件和“智能” 名徽(“smart” name badges),可以提供一段时 长中的每时每刻的交互图景,这幅图景提供了人们 关系间的结构和内容等信息。比如,通过电子邮件 的数据来研究群体交互,这样可以解决如下人类通 信的时空动态特性问题:这些工作组是达到了一个 几乎没有改变的平衡状态,还是在随着时间大幅度 变化2?什么样的交互模式代表着具有高成效的群 组和个人?从我们收到消息和内容的多样性是否能 预示我们的能力和表现3?面对面的群组互动可

2、以 通过“社会计量器”(sociometers)来进行评估。这 样的电子设备可以佩戴在身上,用来捕获物理上的 接近、位置、移动和其他方面的个体行为和群体互 动。这些设备采集回的数据可能会引发一些有趣的 问题,比如,一个组织内(成员间)互相接近的模 式和通信模式,以及与具有高效表现的个人和群体 相联系的流动模式4。 我们也能了解到一个社区的“宏观”社会网 络看起来是什么样的5,并且是如何随着时间演化 的。电话公司拥有用户多年的通话模式记录,像谷 歌和雅虎这样的电子商务门户网站收集全球的即时 通讯数据。这些信息是否可以描绘出一幅社会级 通信模式的综合图景?这些交互通过怎样的方式影 作者: 大卫 拉

3、泽尔 等 译者: 孟 雷 秦 兵 计算社会科学* 关键词:计算社会科学 * 2009年2月,以哈佛大学大卫拉泽尔为首的15位美国知名大学教授联名在美国科学(Science)杂志上发表 了题为“计算社会科学”的具有里程碑意义的论文,论文宣告:随着人们能够收集和分析大规模的人类行为数 据并从中发现个人和群体行为的模式,一个新的研究领域“计算社会科学”诞生了。本文译自美国科学杂 志2009年2月第6期文章Computational social science。www.sciencemag.org/cgi/content/full/323/5915/721/DC1 我们生活在网络之中。我们定期查收电

4、子邮 件,在各处拨打移动电话,刷卡乘坐公交车,并且使 用信用卡购物。我们在公众场所的活动可能被视频摄 像机记录,医疗信息可能会存储成电子文件。我们可 以发布博客任人浏览,还可以通过社交网络来维持友 谊。上述种种活动都留下了数字踪迹。通过这些数 字踪迹可以描绘出个人和群体行为的综合图景,这 有可能会改变我们对于生活、组织、社会的理解。 收集和处理海量数据的能力已改变了诸如生物 学和物理学这样的领域。但是数据驱动的“计算社会 科学”(Computational Social Science)的出现却太过 缓慢了。在经济学、社会学和政治学的顶级刊物上几 乎没有这一领域的论文发表。但是计算社会科学正在

5、 显露端倪它出现在谷歌和雅虎这样的互联网公司 中,也出现在美国国家安全局这种政府机构中。计算 社会科学可能会变成私人公司和政府机构的专属领 域。或许会有另外一种情况,出现占有私有数据的特 权学术研究群体,他们使用私有数据发表的论文是无 法被批驳和复现的。上述两种情形对于积累、验证和 传播知识这些长远的公众利益不会有任何益处。 基于一个开放的学术环境,计算社会科学通过 加强对个体和群体的认知会给社会带来哪些益处? 是什么阻碍了计算社会科学的出现? 迄今为止,对人类相互影响的研究主要靠那些 第 7 卷 第 6 期 2011 年 6 月 71 响着经济生产力和公众健康?跟踪人们的行动也变 得越来越简

6、单6。移动电话使我们有可能在大范围 内跟踪人在一段时间内的移动和物理邻近7。这样 的数据可以揭示流行病传播的内在机理:一些病原 体,比如流感病毒,是如何由物理接近推动而在人 群中传播的? 互联网提供了一个完全不同的渠道来了解人们 在说什么和如何进行联系8。比如,在刚刚过去的 政治大选,跟踪政治辩论、谣言、政治立场和其他 话题在博客中的传播9,以及个体在互联网上“冲 浪”的行为10,从而可以从他们所进行的搜索中了 解选民的关切。虚拟世界在本质上使我们可以捕获 个体行为完整记录,可以为研究提供丰富的机会, 实现以其他方法无法实现或不被人们接受的实验11。 相似地,社交网络提供了独一无二的机会去了解

7、一 个人在网络中的地位对其方方面面的影响,从他们 的品味到他们的情绪再到他们的健康12,在此自然 语言处理则提供了更强的能力来组织和分析来自互 联网和其他资源的海量文本13。 简而言之,一个计算社会科学正在出现,它 充分发挥了(互联网)在前所未有的广度、深度和 范围上收集和分析数据的能力。但是,固有的障碍 会限制该学科的发展。目前网络环境可以提供万亿 字节级别的,能描述每一分钟的交互情况和整个人 群个体的位置的数据,但现有的描述人类行为的方 法并非在此基础上发展起来的。现有的社会网络理 论,大部分都是基于一次性的“快照式”的数据, 一般都只包含几十个人,这样的理论对于包含了地 点、财务交易和通

8、信信息的百万人大规模纵向数据 集又能够告诉我们什么呢?这些海量的,正在出现 的关于人们如何进行交互的数据集当然为群体人类 行为的研究提供了有价值的新视角,但是我们现有 的研究方法可能不适用。 在计算社会科学的发展中还有很大的体制性障 碍。从研究方法层面分析,在物理学和生物学里的 调查目标在观察和干预过程中带来的挑战不同于社 会科学。夸克和细胞既不会介意我们发现它们的秘 密,也不会对于我们在研究过程中改变它们的环境 发出抗议。在基础设施上,从社会学到计算社会科 学的变化幅度要超过从生物学到计算生物学,这在 很大程度上是由于需要解决分布式监控、许可权获 取和加密等问题。在社会科学领域里可用的资源还

9、 比较少,即使社会科学部门到计算机科学或工程部 门之间物理上的(还有就是行政上的)距离也比其 他科学要大。 或许最棘手的挑战在于数据的访问和隐私。这 些社会科学所感兴趣的大部分数据是私有的(比如 移动电话和金融交易信息)。在美国在线(AOL)公 司泄露其许多用户“匿名”搜索记录之后,随之而 来的混乱凸显了在通过私有公司共享个人数据过程 中对个人和公司可能带来的潜在风险14。为了推动 研究同时又保护消费者的隐私,为公司提供可信赖 性的保障,需要建立工业界与学术界合作和数据共 享的经得起考验的模式。更一般地讲,妥善地处理 隐私问题至关重要。最近美国国家研究理事会(U.S. National Res

10、earch Council)关于地理信息系统数据 的报告强调指出,即使对于采取谨慎匿名处理后的 数据依然可以从中抽取出个人资料15。去年,美国 国家卫生研究院(U.S. National Institutes of Health) 和英国惠康基金会(Wellcome Trust)突然将一部分 图1 来自博客(blogosphere)空间的数据:上图是一 个政治博客群的链接结构(从2004年开始),红色节 点代表保守派,蓝色节点代表自由派。橙色链接从自 由派博客指向保守派,紫色链接反之。每个博客节点 的大小反映了指向该博客的其他博客的数量。复制自 文献8。 译文 第 7 卷 第 6 期 2011

11、 年 6 月 72 基因数据库从在线访问列表中删除16。这些数据看 起来是匿名的,只是简单地报告了特定遗传标记的 总出现率。但是,研究发现基于从数据库中收集的 每个个体得到的完整数据的统计威力,仍有潜在的 可能性进行去匿名化(deanonymization)17。 一个小小的戏剧性的破坏隐私事件就可能会 产生能够将计算社会科学这一新兴研究领域扼杀的 规则和法规,因此需要程序、技术和规则组成的一 种自律机制来实现既降低风险又保留进行研究的可 能性。作为这种自律机制的基石,美国伦理审查委 员会委员(U.S. Institutional Review Boards)必须增 强他们的技术知识来了解产生

12、侵权和个人伤害的可 能性,因为新的危害的产生条件会不同于现存的模 式。许多伦理审查委员会成员可能没有能力去评估 复杂数据有可能被去匿名化的可能性。再者,伦理 审查委员看来有必要对创建一个安全的、集中式的 数据基础设施进行监管。目前,已有的数据集分散 于许多群体,这些群体对于数据安全和各种不同的 协议的处理能力和理解力参差不齐。研究者本身必 须开发出能够保护隐私同时又能保留对研究来说不 可或缺的数据的技术。这样的系统,反过来,可能 会对管理用户隐私和数据安全的产业有用18。 最后,计算社会科学的出现与其他刚刚出现的 交叉学科(比如可持续性科学)都需要发展一套培 养新学者的机制。终身教职委员会和编

13、辑委员会需 要了解和奖励那些发表跨学科文章所做的努力。作 为开端,计算社会科学需要的是社会和计算机科学 家团队的工作。长远地看,需要考虑学术界是要培 养计算社会科学家,还是要培养懂计算机的社会科 学家和懂社会学的计算机科学家组成的团队。认知科 CCFU-52:陕西师范大学 2011年5月13日,“CCF走进高校” 活动在陕西师范大学举 行。北京大学“百人计划”、“教育部机器感知与智能重点实验 室”、信息科学技术学院博士生导师袁晓如研究员作了“谈可视 化与可视分析研究进展 ”的精彩报告。报告会由计算机科学学 院副院长吴振强副教授主持,院长李永明教授出席报告会,学院 相关教师及研究生聆听了本次报告

14、会。 袁晓如研究员在报告中介绍可视化的由来及主要应用领域, 从如何通过引入信息可视化和人机交互的新手段分析处理复杂科 学数据,构建人与数据沟通的桥梁;介绍了复杂高维时空数据可视分析技术,介绍了可视化分析在大 气模拟数据、地震目录数据、交通轨迹数据等领域的应用。还介 绍了北京大学在可视化方面的研究成果及国际研究进展情况,可 视化领域的主要研究方向,指出了可视化领域的一些科学问题。 袁晓如研究员与计算机科学学院师生进行了亲切的沟通和交流, 生动、细致地解答了同学们的提问。报告会上,师生提问踊跃, 气氛热烈,袁晓如研究员的精彩回答博得了全场的阵阵掌声。 本次“CCF走进高校”活动提高了研究生对可视化

15、研究领域 的认识,对同学们的职业规划发展有很大的启发,为学习与就业 起到了帮助作用。 (余) 第 7 卷 第 6 期 2011 年 6 月 73 1 D. Roy et al., “The Human Speech Project,” Proceedings of the 28th Annual Conference of Cognitive Science Society, Vancouver, BC, Canada, 26 to 29 July 2009 2 J. P. Eckmann et al. Proc. Natl. Acad. Sci. U.S.A. 101, 14333 (200

16、4) 参考文献 译者 孟 雷 哈尔滨工业大学计算机学院社会计算 与信息检索研究中心博士生。 lmeng 学的出现为计算社会科学的发展提供了一个有力的模 式。认知科学所涉及的领域从神经生物学到哲学再到 计算机科学,已经吸引了数目可观的资源来投资创 立一个共同的领域,并且为过去一代公共物品(public good)1做出了很大的贡献。我们认为计算社会科学也 具备同样的潜力,并且值得获得类似的投资。 作者: 大卫拉泽尔(David Lazer) 哈佛大学(Harvard University, Cambridge, MA, USA.) 阿历克斯彭特兰(Alex Pentland) 麻省理工学院(Massachusetts Institute of Technology, Cambridge, MA, USA.) 拉达阿达米克(Lada Adamic) 密歇根大学(University of Michigan,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号