大数据时代如何运用指数分析舆情

上传人:F****n 文档编号:96402176 上传时间:2019-08-26 格式:PPT 页数:57 大小:3.07MB
返回 下载 相关 举报
大数据时代如何运用指数分析舆情_第1页
第1页 / 共57页
大数据时代如何运用指数分析舆情_第2页
第2页 / 共57页
大数据时代如何运用指数分析舆情_第3页
第3页 / 共57页
大数据时代如何运用指数分析舆情_第4页
第4页 / 共57页
大数据时代如何运用指数分析舆情_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《大数据时代如何运用指数分析舆情》由会员分享,可在线阅读,更多相关《大数据时代如何运用指数分析舆情(57页珍藏版)》请在金锄头文库上搜索。

1、,2016,大数据时代 如何运用指数分析舆情,主讲人:韩少卿,组员:王 闯,网络大数据,1.1,大数据的概念,1,2,3,感知数据,人类原创数据,运营数据,人类社会数据生产方式,1.1,大数据的概念,1.1,大数据的概念,1.1,大数据的概念,1.1,大数据的概念,“大数据”不是部分,而是全部数据,是不确定、不准确的信息,着重在了解是“什么”而不是“为什么”,1.1,大数据的概念,大数据时代 维克托迈尔舍恩伯格,1.1,大数据的概念,大数据本身不是一种新的产品或新的技术,大数据的出现只是数字化时代数据量不断增加的一种现象,1.1,大数据的概念,MB,GB,TB,PB,EB,海量数据,大数据,1

2、.1,大数据的概念,1.2,大数据的发展进程,1.3,大数据的特点,数据自身的状态与价值随着 时空变化而不断发生演变,Variety(流动速度快),数据的价值没有随数据量的指数 增长呈现出同比例上升,Value(价值巨大但密度低),结构化数据、半结构化数据 和非结构化数据,Velocity(数据类型繁多),大量交互数据被记录和保存,数据 规模从TB到PB数量级,Volume(数据体量巨大),4 个 V: Volume、Velocity、Variety、Value,1.3,大数据的特点,1.4,大数据如何产生,微博,云 计算,LBS,物联网,托马斯H达文波特:大数据之所以产生,是因为传感器和微型

3、计算机处理器在人们日常生活中无处不在。,1.4,大数据如何产生,1.5,网络大数据,网络舆情,2.1,舆情的概念,舆情指在一定的社会空间内, 围绕中介性社会事项的发生、发展和变化, 作为舆情主体的民众对国家管理者产生和持有的社会政治态度。,广义的舆情,就是指民众的全部生活状况、社会环境和民众的主观 意愿,也就是通常所说的“社情民意”。,2.2,网络舆情的概念,网络舆情是社会舆情的一种表现形式,指在一定的网络空间中,各种社会群体对自己关心或与自身利益相关的热点事件或事物所表现出来的具有一定影响力并带有倾向性的认知、情绪、态度和意见的总和。,2.3,网络舆情的特点,2.4,网络舆情的信息来源,网络

4、舆情信息来源指标特点,2.5,网络舆情传播的特点,2.6,网络舆情的演变过程,表2.1:网络舆情演变模型,2.7,网络舆情的演变过程,舆情影响,萌芽,扩散,爆发,波动消退,经历时期,表2.2:网络舆情预警模型,良好,正常,隐患,不安全,危险,2.7,网络舆情的演变过程,舆情影响,萌芽,扩散,爆发,波动消退,经历时期,表2.3:政府应对舆情模型,良好,正常,隐患,不安全,危险,启动舆情监测 制定应急预案 制定保障方案 实施信息公开,专家网上答疑 关注意见领袖 网民互动交流,事件初步解决 公开进展信息 引导舆情过渡,事件经验总结 监测衍生舆情,舆情指数,3.1,网络舆情指数的概念,3.2,网络舆情

5、指数体系构建的基本原则,3.3,互联网大数据挖掘技术,3.3,互联网大数据挖掘技术,3.4,网络舆情监测指数体系(兰月新),3.4,网络舆情监测指数体系(兰月新),3.5,舆情大数据指数(刘建明),刘志明网络舆情大数据,3.6,网络舆情指数体系(IRI),“网络舆情指数体系(IRI)”是由中国传媒大学网络舆情(口碑)研究所设计,该指数体系是国内第一个权威的、可量化的、科学的网络舆情指数体系,重点突出网络舆情指数的实时动态性以及可理解、可描述、可解释等特点。,3.7,百度司南舆情系统指数,3.8,清博指数,以大数据为核心技术支撑,全方位整合传统门户、微博、微信、论坛、外媒等舆情信息矩阵,高效稳定

6、的数据采集平台,深度分析挖掘网络舆情,预测消费者的商业兴趣与社交行为,为企业品牌评估、战略部署提供有力数据支撑。,WCI,3.8,清博指数-微信传播指数WCI,3.8,清博指数-微博传播指数BCI,指标体系: 主要通过活跃度和传播度两大维度来进行评价,发博数X1、原创微博数X2、 转发数X3、评论数X4、原创微博转发数X5、原创微博 评论数X6、点赞数X7。,3.8,清博指数-微博传播指数BCI,3.8,清博指数-网红指数OCI,网红指数OCI侧重于对网红传播力和影响力的量化评估,评估模型包括三大维度、十余项项量化指标,通过全网数据的采集,建立基于大数据的开放评估模型。,3.8,清博指数-VR

7、指数WII-VR,评估指数包括企业和产品的网络关注度(微博讨论及官微粉丝数、微信相关文章及总阅读数等),全网推广度(网页、新闻、官网、社交媒体平台等相关信息推广)和网络热销度(主流电商平台:以淘宝/天猫和京东为主)三大维度。,3.9,PDI(Pandata Index)全景数据评估指数,全景数据评估指数PDI 1.0算法说明:使用文章数量、可见总流量、认同流量、可见峰值流量四个主要指标,并提出认同潜力值、可见峰值流量比率两个指标。 本算法由上海交通大学大数据传播创新实验室综合多类资源提出,使用运筹学中的层次分析法(AHP)进行系数的确定,得到k_1=72.35%,k_2=19.32%,K_a=

8、75%,_1=87.5%。,案例分析,4.1,百度舆情研究院大数据中的“春运潮”变迁,“百度迁徙”发布春运全国8小时最热线路图,春运迁徙,40天,36亿人次,春运槽点: “12306”“高价盒饭” “车站服务”“安检”“堵车” “晚点、滞留”,4.1,案例一:百度舆情研究院大数据中的“春运潮”变迁,关注度0.3新闻指数0.3论坛指数0.2微博指数0.2微信指数 正面舆情比例0.7正面舆情指数0.3中性舆情指数 舆情压力指数=0.7 舆情事件个数+0.3 舆情关注度均值-正面舆情事件比例,百度舆情研究院大数据中的“春运潮”变迁,4.1,关注度0.3新闻指数0.3论坛指数0.2微博指数0.2微信指

9、数,百度舆情研究院大数据中的“春运潮”变迁,4.1,百度舆情研究院大数据中的“春运潮”变迁,正面舆情比例0.7正面舆情指数0.3中性舆情指数 舆情压力指数=0.7 舆情事件个数+0.3 舆情关注度均值-正面舆情事件比例,4.1,百度舆情研究院大数据中的“春运潮”变迁,正面舆情比例0.7正面舆情指数0.3中性舆情指数 舆情压力指数=0.7 舆情事件个数+0.3 舆情关注度均值-正面舆情事件比例,研究与反思,5.1,大数据视域下舆情研究的转向,5.2,大数据舆情能否代表社会民意,根据中国互联网络信息中心CNNIC第38次中国互联网络发展状况统计报告显示,截至2016年6月,中国网民已达到7.10亿

10、,超过总人口的1/2。农村网民占总网民的26.9%,达1.91亿,而中国农村人口将近8亿,网民占比较低。即使上网,发表意见的也是少数。 陈力丹在舆论学指出: 在一定范围内有接近1/3的人持某种意见,这种意见由于开始对全部人产生影响,故它已经从少数人的意见转变为舆论。在一定范围内有接近2/3的人持某种意见,这种意见已经可以统领全局,当然更是舆论,而且成为主导舆论。 P4 要注意,不能轻易把网上的意见视为舆论。网民占全国人1/3,网民在网上发表意见的人数,只占所有网民的2%,经常发表意见的人数更少。 P8 因此,网民大都属于沉默的大多数,通过技术手段抓取关键词呈现出的意见状况会出现代表性偏差,与符

11、合真实情况可能出现不一致。,5.2,大数据舆情能否代表社会民意,信息源头的污染 网民享有了表达意见的自由,但网络信息却并非态度、意见和情绪的直接和客观的反映。网络的虚拟性使得网络言论往往出现情绪化和极端化的现象。其次是大量网络水军的存在,会影响到对事实情况的判断。,5.2,大数据舆情能否代表社会民意,爱德华霍尔创建了高语境和低语境的概念。高语境是指对语境依赖程度较高的语言,如中文和日文。在中文传播环境中,语言信息呈现在语境之中,高度依附语境。 使用爬虫等技术手段抓取的网络信息是有噪声的,在进行回归分析与差异分析时,不能彻底摆脱高语境依赖,由此得出的分析结果并不能完整的解释其实际意义,进而也会干

12、扰舆情判断。,5.2,大数据舆情能否代表社会民意,大数据是原材料,算法是核心。大数据往往是TB甚至PB量级的,在舆情指数分析中的数据也只是大数据的冰山一角,并不是完全意义上的“大数据”。 在FiveThirtyEight美国大选数据分析预测中,Nate Silver曾在2008年成功预测50个州中的49个州的选举结果,2012年成功预测了50个州的结果。但在2016年的大选中,曾被称为神童的这些数据分析型政治记者走下了神坛。 数据并非万能的,它有盲点也会出错,用不同的算法可能会得到不同的结果。所以,在数据之外,对算法的合理性、科学性的考量需要不断改进。 因此,基于大数据数据分析的舆情分析相较于传统的舆情测量有其优势,但它的缺点也不能被忽视。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号