大数据分析_链接挖掘

上传人:xiao****1972 文档编号:73263203 上传时间:2019-01-25 格式:PPT 页数:11 大小:1.46MB
返回 下载 相关 举报
大数据分析_链接挖掘_第1页
第1页 / 共11页
大数据分析_链接挖掘_第2页
第2页 / 共11页
大数据分析_链接挖掘_第3页
第3页 / 共11页
大数据分析_链接挖掘_第4页
第4页 / 共11页
大数据分析_链接挖掘_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《大数据分析_链接挖掘》由会员分享,可在线阅读,更多相关《大数据分析_链接挖掘(11页珍藏版)》请在金锄头文库上搜索。

1、浅谈链接挖掘R土本概结构刻画“社交网络“的思路吴社交网络由很多节点CNode),和连接这些节点的一种或多种特定的链接CLink)组成“节点表示数据实例,链接则表示实例之闰存在的各种关系(Relation)“社会网络的结构属性,如节点的度数(Degree)、连通性Connectivity“子图(Subgraph)有助于我们对社团或群体行为的研究。链接挖据中的数据表示心=基本表示:才“行为裂(Aclonj。社坤阜络中的实体。联系(Relationtiej:不同的社会炬佛通过联系连捶在一起。一复杂的模式包括:5一元组(D龌d)=由两个行为者及他们之间的关系组成,这是研究关系楼式的基本喵鲛“二图(Gu

2、bgroup):由网络中的二部分行动和他们乙町伯关系组成以岖述卡李研亨社会咖络中的一个jJ所兮有的舱愉“图(Graph):所有行动者及其之间的关系,分析社会网络吏4狙Q仪典型的链接挖掘任务介组。基于锥接的节点排序LinKBasedObjectRanking*基于链接的节点分类(Link-BasedObjectClassification)*节点聚类(ObiectClustering)*链接预洪(LinkPrediction)*子图发现(SubgraphDiscovery*图分类(GraphClassification)基于链接的节点排序(Link-BasedObjectRanking)描泓经李

3、宋的链糖锦煌i描林荣税沥租为中心应的焦属深中的*根据复杂程度不同,可分为局部度量和全局度量(静态图)。一局部度量包括“度中心度“(DegreeCentrality),即桅个顺点的度数;一全部度量包括“特征向量/能量中心度“(EigenvectoPowerCentrality)“其他的排序方法壤啤链接萝相似节区旌于煜个节店垛口大引人工G.JehandJWigonlSinihenkAiessr【。山ur】-】e亡.hang:e543,2005,小Sun.H-CuD.ChalrabariandC-FaloulsosRelevancesearchandanomalydelectioninbiparie

4、graphs-SIGKDExploratons7(3),December2005.*扩展阅读(很老,很经兴):N一LFreeman.Centralityinsocialnetworks:Conceptualclarifiations.SoNetworks,1:215-239,1979.懒咫=PBonacich.Powerandcen【ra_t吝Aamilyofmeasures,A飘键蹬等暹fSociclogy;92(5):1170-1182,198咬燮啵e基于链接的节点分类(Link-BasedObjectClassification)。传统机器学习中的分类问题是基于数据实例(节点独立且分布的

5、假设。一个数据图G=(OiL)表示节点集合O和他们之间的链接集合L,LBOC将O中的成员赋予某一类标签,与传统ML最大的区别在于节点的类别是彼此相关的-条件随机场(ConditionalRandomFields)的概念,扩展了传统最大熵模型对于数据的结构必须是链式结构的限制根*小LafisnyAMeCallumandFPersira,Condiionalrandomfields:存PrbabilsticImodelsforseqmehtingandIspelingsequancedataInProcofICML-01,2001.=对每个数据实例增加新的属性来扩展简单的机器学习分类器,使其能处理

6、基于链接的节点分类问题1,Q.LuandLGetoor.Linkbasedclassification.InInternational嶂薄ConferenceonMachineLeamming,2003.一增加的新属性度量了类标签在节点组成的马尔可夫毯惠曹糠Blanket)中的分布侧帷节点聚类(ObjectClustering)又称为群体检测(GroupDetection),将有着共同的特征的节点聚集。修栗鹦中的菀奠和链接都居于同一种类,稚体检测技术可以分成干块建模(Blockmodeling是将社会网络分割成个体的集合,称为位震6Fpgiion定义在链绣集合吴聚合林兴之间的相似尿最评用江匹置

7、一谱图分剩的方法(SpectralGraphPartitioningMethods)用确定为了使睾丛到指定数员群i而可以去捧的近似最小链接集合来解决群体检测问LHDe舶【骤疃c。删u吖structureinnetworks.EuropeanPhysical量源c奂孙伟挂人人应(ptweenhestCentality9的规点,用刻吊边的踏柏雯度量桦确定途狼晃伴刍俊振。JRTylerD,MWilnson,andBAHuberman,EmailasSpeotiosopy:AulomatedDiscoveryofCommuntiyStcturewiihinOrganizationsKbwerBWDev

8、enterTheNetherlandsTheNetherlands2003.基于随机块建模(StochasticBlockmodeling的方法=仵随机块建模巾观测到的社会团络被假设为对依糊的随机块模标疫责雍意招甥继探健浩年棣徐醇邢恩.随机箐壹邸咬c=链接预测(LinkPrediction)预测是基于它所链接的节点属性和已观测到的链接来,沥沥挂技一顽测社会中人与人之间的朋友关系,电子邮件、电话联系,合作一存在一个霆间蹇列在某个时间点t的连接状态已知,要预测H+1时间点的链寅类分类问题对于可能有连接存在的两个加途也寸以市必oi顷岫方法一完全基于网络的结构信恩进行预测E不同图近似尺度下的预测一D.

9、Uben-NowelandJ,Keinberg,Thelnkpredietonproblenforsooialnetwgrtsipages556.559,2003.“在进行链接预测时使用属性信息j(L。istcRegressionMedepD,利h征(Re闾mn疆|Features)类的存在,关系特征的定义是由数排库查诚引入嚼抓2APopesoulandLHUngar.Statstoalrelatonal_eammgforincA_WiorkshoponLeamingStatstcalModelsfromRe】氨【|。e川L友一种结构逵辑回归模型HN链接预测(LinkPrediction)续5

10、大为数据集多数是稀疏的冈而链接预测比较囱为链接预测构造统计模型的一个难点在于,链接的先验概率往往很低(模型评价和预测可行程度的定量上都比较低)。提高预测质量的方法:-使预测全体化乙-在整个链接的图、标签和边上构造一个概率模型1-基于马尔可夫随机场(Markovrandomfields的网络结构联合模型*节点集合O,属性集X,边集E,MRF建模了在边集E上的联合分布P(E),或者基于节点属性的条件分布P(EjIX)BR.ChellappaandA.Jain.Markovrandomfields:th氓napplications.AcademicPress,Boston,1993悯灞螂e子图发现(

11、SubgraphDiscovery)“个图的集合中找到感兴趣的或者频繁出现的图中寻找频繁子图:AGM算法,寻找所有满足最小支持的归纳子图*A.Inokuchi,TWashio,andH.Motoda.AnAprioribasedalgorithmforminingfrequentsubstructuresfromgraphdata,量InEurcpeanConferenceonPrinciplesandPracticeof3KnowledgeDiscoveryandDataMining,pag3513-23,2000.-9Span,先将每一幅图映射到浩度优先搜索编码,并字典序排序,可以避免候选

12、子图生成的代价,最后在这个字典序定义的搜索树上进行深度优先搜索“X.YanandJHan.9Span:Graph-basedsubstructurepmining.InInternationalConferenceonDataMmm熹蔡爵熹冉在一子匹在RKE船子图发现(SubgraphDiscovery)续?关寥有效的柱成j图和基于压缩的启发式搜索-利用基于MDL的启发式来指导子图的搜索,可以用于子图发现和图分类“D.小CookandL.B.Holder.Substructure小discoveryusingminimumdssciiptionisngthand着backgroundknowiedge:JournaiofArtificialIntelligenceResearch,1:231-255,1994.-基于图的归纳(Graph-BasedInduction),通过嗣w将频絮出王见的顶卢组合成块来庄缩输入的囹刚余E醉胍R8e

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号