基于java的社交网络的信息采集系统的研究与设计毕业设计

上传人:xiao****1972 文档编号:116580662 上传时间:2019-11-16 格式:DOCX 页数:27 大小:511.13KB
返回 下载 相关 举报
基于java的社交网络的信息采集系统的研究与设计毕业设计_第1页
第1页 / 共27页
基于java的社交网络的信息采集系统的研究与设计毕业设计_第2页
第2页 / 共27页
基于java的社交网络的信息采集系统的研究与设计毕业设计_第3页
第3页 / 共27页
基于java的社交网络的信息采集系统的研究与设计毕业设计_第4页
第4页 / 共27页
基于java的社交网络的信息采集系统的研究与设计毕业设计_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《基于java的社交网络的信息采集系统的研究与设计毕业设计》由会员分享,可在线阅读,更多相关《基于java的社交网络的信息采集系统的研究与设计毕业设计(27页珍藏版)》请在金锄头文库上搜索。

1、本科毕业设计(论文)基于JAVA的社交网络的信息采集系统的研究与设计学院(系): 专业班级: 学生姓名: 指导教师: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包括任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。作者签名: 年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的全部或部分内容编入有关数

2、据进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于 1、保密囗,在 年解密后适用本授权书 2、不保密囗 。(请在以上相应方框内打“”)作者签名: 年 月 日导师签名: 年 月 日摘 要本文借助开发平台Eclipse针对社交网络新浪微博开发了一个信息采集器,能够实现对新浪微博的信息采集,所得结果对于新浪微博的开发具有重要的指导意义。论文主要研究了社交网络的信息采集原理,并以新浪微博为研究对象,借助JAVA编程软件实现对微博信息的采集。本论文的主要工作有以下几个方面:首先是利用微博系统的JAVA SDK获取数据,该技术通过调用微博平台提供API来获取数据。这部分工作

3、需要利用微博系统的JAVA SDK获取数据的工作流程,调用API需要通过用户身份的鉴权。目前使用OAuth鉴权,其优点是数据准确快捷,很少因微博平台的变化而变化,但缺点是接口提供商限制的因素多且不稳定。其次通过JAVA编程设计一个良好的界面,调用API接口实现对授权用户的信息采集,通过输入一个关键词,在授权用户好友微博圈里进行匹配,将出现该关键词的好友微博返回到txt文件中进行保存,同时将历史采集记录保存下来,实现对授权用户好友信息的主题采集。研究结果表明,通过调用API接口获取用户微博数据这种方式实时有效,能够满足我们对新浪微博授权用户微博实时信息的主题采集。本文的特色在于通过调用API接口

4、实现对新浪微博信息的主题采集快速便捷,而且设计了一套完善的显示与保存方案,能够对新浪微博的后续研究提供数据。关键词:社交网络,新浪微博,API,信息采集AbstractThis paper is mainly to develop an information collector, which can collect the information of Sina micro-blogging by the use of Eclipse. The results of this paper have important guiding significance for the further

5、study of Sina micro-blogging.In this paper, we mainly introduce the principle of social networks. On the basis of this, we take Sina micro-blogging as our research object, using JAVA programming software for the information collection of it. The main work of this paper has the following aspects: Fir

6、st, we introduce the principle of JAVA SDK, which is provided by the Sina micro-blogging system to obtain data. The method to get the data by SDK is to use the API interfaces of Sina micro-blogging. This part of the work requires the use of JAVA SDK to get the access to the API. Only when we have th

7、e access to the API of Sina micro-blogging, we can get through the identity authentication of Sina microblogging. Currently Sina micro-blogging use the OAuth 2.0 protocol for the identity authentication. The advantage of OAuth2.0 is fast and accurate, which rarely changes due to changes of the micro

8、-blogging platform. But the drawback is that there are too many limiting factors for API. Then we use the JAVA programming software Eclipse to design a friendly interface to realize the information collection of Sina micro-blogging. By entering a keyword in the input area, the system we designed can

9、 match the keyword with Sina micro-blogging.Once the keyword appears in the micro-blogging, the system will collect the information of the Sina micro-blogging .By the same time, the system will save the information to the data file and save the recorded history of the collection, to achieve the auth

10、orized subject collection for the Sina micro-blogging.The research results show that by using the API interface to get data this way, we can realize the real-time information collection of Sina micro-blogging.The characteristic of this paper is to use the API to realize the subject collection of Sin

11、a micro-blogging, quick and effective, which can save a lot of time. In addition to this, I design a set of friendly interface, which can display and save the information effectively and provide data for the further study of Sina micro-blogging .Key Words:social network,Sina micro-blogging,API,infor

12、mation collection目 录第1章 绪论11.1 研究背景和意义11.2 国内外研究现状21.3 论文主要工作31.4 论文结构安排4第2章 系统相关技术52.1 JAVA技术简介52.2 新浪微博开发平台52.2.1 微博JAVA SDK52.2.2 微博应用的创建62.2.3 OAuth2.0授权认证72.2.4 微博内容的获取92.3 本章小结9第3章 信息采集系统设计与实现103.1 系统总体设计103.2 系统各模块实现113.2.1 授权认证的实现113.2.2 启动模块的实现133.2.3 微博内容的获取143.3 系统效果显示153.3.1 主页面效果显示153.3

13、.2 采集信息效果显示163.4 本章小结19第4章 总结与展望204.1 总结204.2 前景与展望20参考文献21致 谢22第1章 绪论1.1 研究背景和意义随着网络技术的发展,互联网跨入到web2.01时代。在web2.0时代中,整个互联网平台不停扩展着人们之间的社会关系,从而促使多种社交网络平台的出现,产生了多种新颖的交互模式和途径。社交网络是一种在线交互媒体,该媒体最显著特点为具有强大的信息传播能力与影响力。近些年来,社交网络迅速发展。在国外,以 FaceBook,Twitter为代表,在国内,以新浪微博,腾讯微博,QQ空间,百度贴吧以及人人网为代表。这些社交网络平台向人们提供社会网

14、络服务,使得用户能够方便快捷地通过互联网自由分享自己的个人信息,获取和传播其他用户的信息。如此一来,整个社交人群的交互信息和背景信息等形成一张社会网。国内社交媒体中,近年来以微博的发展最为迅速,用户群规模增长最快。根据相关统计,国内2014年1月份社会化媒体排行榜如表1.1所示。由1.1可以看出,有三大微博平台跻身社会化媒体分享榜前十,微博平台已经成为社会化媒体中最受欢迎的平台,其中尤以新浪微博最为火热。在2013年7月中国互联网络发展状况统计报告中提到:“截至 2013年6月底,我国微博网民规模为3.31亿,较2012年底增长了2216万,增长7.2%。网民中微博使用率达到了56.0%,较上

15、年底增加了1.3个百分点。2014年4月17日,新浪微博正式登陆纳斯达克,成为全球范围内首家上市的中文社交媒体。表1.1 2014年社会化媒体的排行榜排名媒体名称分享百分比排名媒体名称分享百分比1新浪微博17.93%6开心网5.09%2QQ空间16.49%7搜狐微博4.86%3微信16.17%8飞信4.14%4腾讯微博6.40%9百度贴吧3.86%5人人网6.22%10QQ好友3.16%随着微博的爆炸式发展,它逐步成为国内外学者共同关注的焦点。微博是一种允许用户用即时更新的简短文本(一般信息发布字数在140个以内)并可以公开发布的博客形式。微博包含海量的数据信息,它允许任何人阅读或者只能由用户选择的群组阅读。目前微博已经成为网民获取信息的重要途径之一,微博从满足人们弱关系的社交需求上逐渐演变成为大众化的舆论平台,越来越多机构及公众人物都通过微博来发布或传播信息。微博的三大特点:(1) 便捷性。微博网站即时通讯功能非常强大,通过QQ和MSN直接书写,在有网络

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号