
上传人:新** 文档编号:511414987 上传时间:2023-10-04 格式:DOC 页数:50 大小:1.75MB
返回 下载 相关 举报
第1页 / 共50页
第2页 / 共50页
第3页 / 共50页
第4页 / 共50页
第5页 / 共50页


1、独创性声明学位论文题目: 基于LDA的社交网络链接预测模型研究 本人提交的学位论文是在导师指导下进行的研究工作及取得的研究成果。论文中引用他人已经发表或出版过的研究成果,文中已加特别标注。对本研究及学位论文撰写曾做出贡献的老师、朋友、同仁在文中作明确说明并表示衷心感谢。学位论文作者: 签字日期: 年 月 日学位论文版权使用授权书本学位论文作者完全解西南大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权西南大学研究生院(筹)可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文

2、。(保密的学位论文在解密后适用本授权书,本论文:不保密,保密期限至 年 月止) 。学位论文作者签名: 导师签名:签字日期: 年 月 日 签字日期: 年 月 日目 录摘 要IABSTRACTII第1章 绪论11.1研究背景11.2研究现状21.3主要工作31.4论文结构41.5 本章小结5第2章 相关理论和技术62.1主题模型62.2复杂网络72.3社交网络82.3.1社交网络的发展82.3.2 社交网络的定义92.3.3 社交网络的数据表示102.4 社交网络分析112.5链接预测132.5.1链接预测算法142.6 本章小结16第3章 基于LDA的社交网络链接预测模型173.1 概述173.

3、2总体框架173.3 形式化描述183.4用户兴趣信息特征提取203.4.1 兴趣主题提取203.4.2 兴趣主题相似度计算233.5社交网络结构信息特征提取233.6分类器的构造253.7模型的可行性和有效性分析253.7.1 可行性分析253.7.2 有效性分析2738 本章小结27第4章 实验294.1 实验平台294.2 数据集294.2.1 数据来源294.2.2 社交网络的构造294.2.3 数据的平衡处理314.3 实验目的314.3 评价方法314.4 实验具体方案324.5 实验结果与分析324.5.1 用户兴趣信息特征324.2.2 网络拓扑结构特征344.2.3 结果分析

4、与比较344.6 本章小结36第5章 总结和展望37参考文献39致 谢43攻读硕士学位期间公开发表的论文44I西南大学硕士学位论文 摘要基于LDA的社交网络链接预测模型研究计算机软件与理论专业硕士研究生 补嘉指导教师 唐 雁 教授 摘 要随着Web2.0技术的不断发展,基于社区的服务,如Wikipedia、 Flickr和Facebook等越来越流行。在社区中,人们可以寻找和上传自己喜爱的图片,可以与社区中的其他用户进行链接,成为朋友。社交网络是依靠人与人之间的朋友关系组织在一起的系统,是现实人际网络的子集。社交网络用户数量的急剧增加,给网络中用户关系、用户信息等数据的挖掘带来了巨大挑战。利用

5、用户节点的属性信息、社交网络的拓扑结构特征等预测用户节点对之间是否存在朋友关系链接,便是其中一个研究热点。现有的社交网络链接预测算法,如CN算法1、AA算法2、katz算法3等,主要关注社交网络中用户节点对之间的拓扑结构相似特征,缺乏对其属性信息之间潜在语义关系的重视,链接预测的精度不高。此外,在社交网络中,用户的兴趣信息数量巨大,如果直接对每个用户的每个兴趣进行语义关系分析,则需耗费大量时间。针对以上问题,本文引入主题模型、潜在迪里克雷分布模型(LDA, Latent Dirichlet Allocation),首先利用LDA模型对用户节点对之间的兴趣信息进行建模,提取社交网络用户兴趣信息的

6、主题,比较主题之间的语义相似度,这与直接对每个用户的兴趣信息进行分析相比,能够在捕获信息的潜在语义关系的同时,有效降低计算时间复杂度。其次,把复杂网络中的网络资源分配算法RA(Resource Allocation)用来对社交网络的结构信息进行特征提取。然后,通过构造分类器,利用有监督学习框架综合语义特征和拓扑结构特征进行社交网络链接预测。通过在真实的社交网络LiveJournal数据集上进行实验,与现有的链接预测算法比较,结果证明,本文提出的基于LDA的社交网络链接预测模型与已有的工作相比,在一定程度上,能够有效地提高链接预测精度。关键词:社交网络 LDA RA 链接预测AbstractRe

7、search on Social Network Link Prediction Model based on LDA Major: Computer Software and Theory Research Direction: Web Application Technologies Supervisor: Prof. Yan Tang Author: Jia Bu (112009321001986)ABSTRACTWith the fast development of Web2.0 technology, the services based on the social communi

8、ty are more and more popular, for example, Wikipedia, Flickr and Facebook. In the community, people can find and upload their favorite photos, link to other users. Social Networks are the systems that relying on the friendships between people, they are a subset of interpersonal networks. The number

9、of social network users has increased dramatically and it has brought great challenges to mining the relationship of the users, the information of the users in the network. One data mining problem of interest for social networks and the characteristics of the structure for social networks is the fri

10、endship link prediction problem.However,many social network link prediction algorithms focus on the topology structure similarity between nodes in the networks, for example,CN algorithm1,AA algorithm2 ,katz3 algorithm and so on.But these algorithms dont focus on the semantic relations between users

11、interests.It results that the accuracy of link prediction is not high.At the same time, the user interests in the social network are huge, if we analysis the semantic relationship of them directly, we will spend a lot of time.To solve the above problems,we introduce the topic model ,the Latent Diric

12、hlet model.First,we use LDA to model the interests between the user nodes and extract the topics of users interests in the social network,analyze the semantic similarity between these topics. Compared with the direct analysis of interests for each user,it not only can capture the latent semantic rel

13、ations,but also can reduce the computation time complexity effectively.Then for the first time,we use the Rescource Allocation algorithm in the complex network into the social network to grasp the structure feature accurately.At last,by constructing the classifiers,we use of supervised learning fram

14、ework integrate semantic feature and the toplogical structural characteristics to predict the friendship links in the social network. We apply the Social Network Link Prediction Model based on LDA to a real social network called LiveJournal, compare with the other methods to verify its viability and effectiveness. Experimental results on the subset of LiveJournal show the usefulness of the LDA features and structure features for predicting friendships.Key words: LDA, RA, social network, friendship link predictionIII第1章 绪论16 西南大学硕士学位论文


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号