《元闭包的验证》由会员分享,可在线阅读,更多相关《元闭包的验证(11页珍藏版)》请在金锄头文库上搜索。
1、三元闭包原理的大数据验证需要先解决两个问题 第一,将三元闭包原理最初的定性陈述 转变成一种可以定量考察的表达; 第二,找到一种合适的社会网络数据。三元闭包原理的两种表达 最初的表述:如果两个互不相识的人有了有了 一个共同朋友一个共同朋友,则他们俩在未来成为朋友 的可能性增加增加。 可以转变成:如果两个互不相识的人的共的共 同朋友数越多同朋友数越多,则他们俩在未来成为朋友 的可能性越大越大。 三元闭包原理:如果两个互不相识的人的的 共同朋友数越多共同朋友数越多,则他们俩在未来成为朋 友的可能性越大越大11 2 3 4 共同朋友个数成为朋友概率用什么数据验证?用什么数据验证? 电子邮件网络社会网络
2、 一所大学的2万多学生在一年里的通信关系数据 只关心谁和谁何时有过通信,不关心内容三元闭包:哪一种情形更有可能?现在一段时间后“可能性”怎么衡量? 假设:网络中有100对节点,某一时刻之前 没边,但分别都恰好有5个共同的朋友 如果,一个月里,其中有20对节点俩俩之 间发生了通信,80对依然没有 就说:两个不相识但有5个共同朋友的人, 在一个月里将成为朋友的概率为0.2“Empirical Analysis of an evolving social network,” Science 2006共同朋共同朋友数成 为 朋 友 的 概 率数据验证过程示意11 2 3 465 4321(1,4) (
3、1,6) (2,3) (2,5) (3,4) (3,5) (4,6)2 3 2 3 0 2 2* *共同朋 友数共同朋 友数01234成为朋 友概率要点小结 以三元闭包原理的验证为例,我们看到了一种利 用大数据分析,定量考察某些社会科学定性认识 的方法 其中有两个关键 将社会科学原理的定性描述,转化为便于定量分析的 表述,形成数据指标(与共同朋友数对应的概率) 选择合适的数据,以及从原始数据中提炼出指标数据 的方法在线测试题 设下图是某社交网络,节点表示人,边表示朋友关 系。试分别给出其中不是朋友的两个人的共同朋友 数。按照三元闭包原理,在未来某时间点之前,哪 两人成为朋友的可能性较大?654321非好友:非好友:(1,4) () (2,3) () (2,5) () (3,4) () (4,6)共同朋 友数:22312