本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc

上传人:cn****1 文档编号:548390444 上传时间:2023-07-13 格式:DOC 页数:62 大小:623KB
返回 下载 相关 举报
本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc_第1页
第1页 / 共62页
本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc_第2页
第2页 / 共62页
本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc_第3页
第3页 / 共62页
本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc_第4页
第4页 / 共62页
本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《本科毕业设计-微博舆情管理平台:数据分析系统的设计与实现.doc(62页珍藏版)》请在金锄头文库上搜索。

1、 毕业设计(论文)中文题目:微博舆情管理平台 数据分析系统的设计与实现英文题目: MicroBlog Public Opinion Management Platform: The Design and Implementation of the Data Analysis System中文摘要随着网络技术应用的普及和发展,舆情的传播方式和传播速度都发生了根本性变化, 网络舆情对人类的社会状态产生了全方位的影响,微博舆情则是网络舆情的重要组成部分,它的特点有:直接性,突发性,偏差性,丰富性和互动性。本文以微博消息为研究对象,研究了微博消息传播的特点与模型,通过对抓取数据的分析发现了微博传播的单

2、向性,便捷性,背对脸等特点,还有微博意见领袖在微博传播中的重要作用,微博热点的产生规律。根据对数据分析的结果提出了趋势分析的算法。利用空间向量模型完成对微博内容的结构数据化,利用K-means算法完成对微博消息的聚类分析,找到所要分析的某类微博内容,进而在这类微博中找出微博消息意见领袖,提出微博意见领袖影响力评估算法,WeiboRank算法,并结合算法完成了微博消息预警模块的实现,初步实现了微博舆情管理平台的数据预警分析功能。关键词:微博舆情 文本聚类 趋势分析 1北京交通大学毕业设计(论文) AbstractAlong with the universal application and r

3、apid development of network technology, the approaches that the net-mediated public sentiment spread have been fundamentally changed. The net-mediated public sentiment has exerted huge influence on the way that the society operates. As the one of the most significant parts of the net-mediated public

4、 sentiment, the public sentiment which is produced and spread by the microblog has several important characters, such as directness, immediacy, deviation, variability, interactivity.Taking the microblog messages as our investigating subject, this paper aimed to do research on the characteristics and

5、 models of delivering messages between microblog users, Through the analysis of the capture data found unidirectional, micro-blog communication convenience, back on the face and other characteristics, and raised an effective algorithm to sort these kinds of messages. Using the spatial vector model,

6、the K-means algorithm did cluster analysis on microblog messages, and found out the opinion leaders among tremendous messages. Then, an influential estimation algorithm of the microblog opinion leaders was raised,WeiboRank algorithm. Together with the estimation algorithm, we also achieved the early

7、 warning part and some basic data warning analysis functions on the whole microblog-mediated public sentiment platform.Key words:microblog-mediated public sentiment, text clustering, trend analysis目 录一、概述11.1 课题背景与研究意义11.1.1课题背景11.1.2研究现状31.1.3研究意义31.2论文结构4二、微博消息传播模型42.1微博消息传播的特点42.2微博用户状态62.3微博意见领袖

8、72.4微博传播模型9三、微博舆情管理平台的设计与实现123.1微博舆情管理平台的总体流程123.2数据分析系统设计流程13四、微博舆情管理平台的实现144.1样本选取与数据来源144.2微博数据转化154.3微博文本聚类174.3.1文本聚类定义174.3.2机器学习184.3.3K-means算法194.4微博意见领袖重要性评估214.4.1 PageRank算法214.4.2 WeiboRank算法224.4.3 算法对比234.5微博舆情预警模块254.5.1微博舆情预警254.5.2趋势分析模块264.6趋势分析结果比较29五、结论与展望315.1系统不足315.2未来展望325.2

9、.1改进预期325.2.2新增功能325.3结束语33参考文献34附录: 翻译原文35Cluster Analysis:Basic Concepts and Algorithms351Overview401.1.1What Is Cluster Analysis?401.1.2 Different Types of Clusterings411.1.3Different Types of Clusters442.Road Map47 K-means47 Agglomerative Hierarchical Clustering48 DBSCAN48附录: 中文翻译48聚类分析:基本概念及算法4

10、81概述511.1.1什么是聚类分析?511.1.2不同类型的群集合521.1.3簇的不同类型532.路线图56K-means算法56凝聚层次聚类56DBSCAN5654北京交通大学毕业设计(论文) 第 页一、 概述1.1 课题背景与研究意义1.1.1课题背景随着时代的进步,技术的发展和web2.0时代的到来,网络舆情也呈现蓬勃发展的势头,截至2012年12月底,我国网民规模达5.64亿,手机网民规模也已达到4.20亿,我国微博用户规模为3.09亿,较2011年底增长了5873万,网民中的微博用户比例较上年底提升了六个百分点,达到54.7%。相当一部分用户访问和发送微博的行为发生在手机终端上,

11、截至2012年底手机微博用户规模达到2.02亿,即高达65.6%的微博用户使用手机终端访问微博。微博,即微博客(MicroBlog)的简称,是一个基于用户关系信息分享、传播以及获取平台,用户可以通过WEB、WAP等各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。美国埃文威廉姆斯推出的twitter是最早的微博平台,也是目前最著名的平台。2007年,中国第一家带有微博色彩的网站“饭否网”开张,到2009年新浪微博的开通,中国第一家推出微博的门户网站,微博正式进入中文上网主流人群视野。2011年10月,中国微博用户总数达到2.498亿,成世界第一大国。微博成为网络舆情的一大组

12、成部分。舆情是“舆论情况”的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者及其政治取向产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。对于舆情的内涵,国内的研究者们有着不同的认识。有研究者指出:“所谓舆情,实际上就是大众密切关心的热门话题或反映了某些社会心理的观点与看法,其较高层次是思潮,基本层次是情绪。大众传媒对此应该有足够的敏感,并以恰当的方式进行舆论引导,减少社会震荡。”另有研究者认为:“舆情即民意情况,涉及公众对社会生活中各个方面的问题尤其是热点问题的公开意见(外露的部

13、分)或情绪反应(既可能外露又可能不外露的部分)。”更多的学者倾向于如下认识:“舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。如果把中间的一些定语省略掉,舆情就是民众的社会政治态度。”这一定义将舆情界定为民众的社会政治态度,突出了民众与国家管理者之间的关系,抓住了舆情的核心,因此本文在以下的论述中,也采用这一定义。任何一种技术的出现及发展,或多或少会对社会生活造成一定的冲击和影响。网络从诞生的那一天起,就开始深刻地影响人们的生活、学习、思考、交流和娱乐的方式。与此同时,现实生活与虚拟世界交互影响,呈现出一种你中有我、我中有你的局面。以

14、网络为平台,通过新闻、评论、发帖、回复等为载体表现出来的舆情,就是网络舆情。以网络为载体的网络舆情,核心是单个或多个事件,是海量网民感情、态度、建议、观点的表达,互动与传播,以及后续的影响力的集合。 带有广大网民的主观性,未经媒体验证和包装,直接通过多种形式发布于互联网上。舆情管理与监控,就是通过对互联网信息挖掘采集技术的整合,实现自动抓取互联网中的海量信息,可以利用一些算法自动对信息分类,主题分析,倾向分析等功能,形成图表或者简报结论,便于用户掌握。舆情的本质是民众的社会政治态度,而在网络上,某种抽象的社会政治态度是需要以一些具体的形式反映出来的。或者说,舆情在网络上要为人所知、激起网民共鸣

15、、或者在网络上被传播,必然要借助于一定的载体。在网络上,舆情的载体主要有新闻评论,论坛(社区)发帖、跟帖,博客,播客,微博等。与传统舆情相比,网络舆情具有传播快速和实时互动的特点。网络的出现使得地球村的梦想得以实现,一条消息可以在瞬间传遍世界。相应的,某个舆情通过各大网站、论坛的转贴可以在极短时间内为大量人知晓,这在以前是难以想象的;在网络舆情体现最明显的论坛、社区、博客、微博等空间,每一个网民都可以实时地发表自己的观点,大家共同讨论或辩论,不同观点或立场的网民进行交锋,可以通过互动推动舆情的发展或深化,引起更多人的关注。1.1.2研究现状随着网络技术的发展和时代的进步,网络舆情的重要性已经毋庸置疑,有关网络舆情管理与检测的研究也日趋成熟,有关网络舆情管理与监测的系统越来越多,微博舆情的分析平台也有出现,不过多数为政府和企业服务,只监控有可能爆发的负面信息和重大事件,不对普通用户开放,而有关微博消息的分析软件不但费用昂贵而且只是对信息的已传播轨迹进行呈现和分析,缺乏对微博消息未来走向的一个分析预测,也无对微博消息传播范围广度

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号