数据新闻概论第二章

上传人:suns****4568 文档编号:118768504 上传时间:2019-12-25 格式:PPT 页数:68 大小:9.10MB
返回 下载 相关 举报
数据新闻概论第二章_第1页
第1页 / 共68页
数据新闻概论第二章_第2页
第2页 / 共68页
数据新闻概论第二章_第3页
第3页 / 共68页
数据新闻概论第二章_第4页
第4页 / 共68页
数据新闻概论第二章_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《数据新闻概论第二章》由会员分享,可在线阅读,更多相关《数据新闻概论第二章(68页珍藏版)》请在金锄头文库上搜索。

1、 如何制作和传播数据新闻 第二章 第二章 如何制作和传播数据新闻 1.数据新闻的类型 2.数据新闻的生产流程 3.数据新闻的制作团队 数据新闻的类型 第一节 一、“大数据新闻”与“小数据新闻” (一)划分依据: 支撑报道的数据的性质 两类数据新闻的差别就在于两类报道中所处理的 数据对象是隶属于“大数据”的范畴还是“小数据”的 样本。 (二)大数据(big data)的三个基本特征: (1)海量数据(volume): 相比传统数据或小数据,大数据拥有庞大的数据量。 一般认为10TB100TB是成为大数据的门槛。 2012年互联网数据中心为大数据设立的标准中就确定数据体量 需超过100TB以上。

2、讨论:100TB的容量有多大? (二)大数据(big data)的三个基本特征: (2)类型多样(variety): 相比传统数据多以文本数据作为主要类型,大数据 的类型更为多元化 其包含了网络日志、图像数据、文件数据和各种 复杂的记录信息。 (3) 高速处理(velocity): 数据量的增长速度很快,需要处理的速度和响应的 时间越来越快。 大数据 (巨量数据集合(IT行业术语) 大数据(big data),指无法在一定时间范围内用 常规软件工具进行捕捉、管理和处理的数据集合,是需要 新处理模式才能具有更强的决策力、洞察发现力和流程优 化能力的海量、高增长率和多样化的信息资产。 大数据包括结

3、构化、半结构化和非结构化数据,非 结构化数据越来越成为数据的主要部分。 结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据 ) 非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、 图像和音频/视频信息等等。 一、“大数据新闻”与“小数据新闻” 小数据(传统数据)大数据 目标解释特定的问题或是针对特定的目标 考虑的是一个整体的目标,目标可能是 灵活的,并非具体的 存储位置存储于某一机构、某台电脑或某个单独的文件通常遍布于整个电子空间 数据结构与内容 高度结构化的数据,数据域被限制在一个单一 的学科或分支学科内,以统一的格式记录 包含各种非结构化

4、数据,这些资源的主 题可能跨越多个学科,或是与其他大数 据资源存在相关关系 数据准备 数据使用者为自己的使用目的所准备 涵盖许多人的数据准备,准备数据的人 未必是最终使用数据的人 数据生命周期较短常被永久性地存储 衡量内容可以通过标准的方法来解析和读取格式多元,需要不同的协议来解读 可重现性 如数据结论的准确性存在问题通常可以来重现大数据项目基本不可行 成本成本和代价有限项目如果失败,代价高昂 自省 通过数据在电子表格和数据库中的行和列来定 位 可通过一种称之为“自省” 的技术来实 现 分析一次性全部参与到分析通过分布式的方式进行分析 (三)小数据与大数据十个方面的区别 知识链接 在计算机编程

5、中,省是指这种能 :检查某些事物以确定它是什么、它知道什 么以及它能做什么。 大数据自省技术: 计算机技术,通过内部的一种机制可 以查询到数据的各种上下文。 (四)“大数据新闻” “大数据新闻”是指在报道中采用大数据量级的 数据作为分析对象或引用大数据研究成果的数据新闻。 数据量级巨大、类型多样。 选题类型:有很强社会影响力的事件。一般应用 于报道对象较为复杂,牵涉面广,需要采用庞大数量的 样本分析,而非小规模抽样样本的选题。 大数据新闻需投入大力人员,花费时间长,投入经费高。 此类作品较少。 大数据新闻作品典范:卫报如何报道英国骚乱? 2011年8月,伦敦大骚乱并迅 速蔓延至六大城市。 1.

6、报道目的:用科学的方法 帮助人们解读骚乱(发生原 因及如何应对) 2.报道团队:一百多名记 者、学者和研究人员。 3.资金支持:两个基金会。 4.作品完成时长:一年多 大数据新闻作品典范:卫报如何报道英国骚乱? 解读骚乱的报道历经了 两个研究阶段。 第一个阶段的成果发表于 2011年12月,集中在探寻骚乱产 生的原因上,报道团队先后采访 了六大城市中270位骚乱参与者。 第二个阶段主要基于对300 多名受骚乱波及的人的采访。 详细报道见: s/reading-the-riots 大数据新闻作品典范:卫报如何报道英国骚乱? 值得一提的是第一阶段中的另一项重要内容,报道团 队对260万条与骚乱相关

7、的Twitter数据进行了统计分析。 骚乱谣言如何在Twitter中传播数据报道对Twitter 的谣言数据的全体样本进行了研究,让用户看到了谣言生成、 扩散和传播的过程。 报道影响了英国政府对社交网络管理的公共政策,卫 报网站或得2012年度“数据新闻奖”。 大数据新闻作品典范:卫报如何报道英国骚乱? 作品所体现的大数据新闻的特点: 1.数据量庞大、类型多样 2.260万条Twitter信息 3.好几百人的深度访谈和问卷调查资料 4.仅参加骚乱者的采访录音材料就有130多万字。 成功因素: 1.科研机构的协助 2.媒体对整个报道的规划和全程投入。 3.基金会的资助。 (五)“小数据新闻” 与

8、“大数据新闻”不同,“小数据新闻”是指在 报道中采用小数据量级的数据作为分析对象或引用小数 据研究成果的数据新闻。 目前业界的数据新闻实践多以“小数据新闻”为主,其数据 来源较为单一,采用抽样样本,数据量级有限,数据的类型构成 简单,对数据处理技术的要求也相对较低。 小数据新闻投入成本低,操作时限短,技术门槛较低,更便 于在媒体操作和推广。 小数据新闻典范作品傻瓜的艺术品市场 作品对2008-2012年间,全球拍卖市场中 拍价最高的320件艺术品进行数据统计与 分析,展现了艺术品拍卖市场中诸多现象 和规制,意在让对艺术品市场完全外行的 人也能迅速读懂。 数据来源:已有的艺术品拍卖价格报告和艺术

9、品 市场报告。 启示:好的作品不一定基于大数据分析,关键是 作 者发现新闻选题价值的能力,以及数据分析和可视化呈 现的能力。 傻瓜的艺术市场 版块块 1.艺术,亿万富翁的癖好 2.毕加索:超级巨星 3.男性主导的行业 4.中国崛起 二、自我采集数据型和现有数据再利用型 (一)划分依据: 数据新闻中数据的来源。 (二) 自我采集数据型的数据新闻 指那些由报道者直接通过深度访谈、问卷调查、田 野调查等社会科学研究方法获取第一手资料,并将这些资 料量化为数据后进行处理,最后制作成的新闻报道。 此类报道中的数据是报道者收集的原始数据,是真正意义上 的第一手材料。 实践过程:报道者设立清晰的报道目标根据

10、设定的目标 确定调查范围和调查对象展开研究,收集数据。 报道者对数据进行分析就是为了解决报道目标中设立的一些 具体问题。 优点: 一是媒体采用自己采集的数据报道可以增强报道的 原创性和独家性,避免和其他媒体出现题材撞车现象; 二是自我采集的数据相比已有的数据而言,其从最 初的采集筹备到实施的过程都处于清晰的报道目标的指引 之下,因而数据的纯度较高,可被利用的价值更大,这可 以减少数据过滤的难度。 卫报对英国骚乱的报道就属于自我采集数据型,媒体和科 研机构合作耗时一年多,通过各种调查方法采集到关于骚乱的第一手 材料,并将之进行分析解读后公之于众,其根据扎实的数据而提出的 关于骚乱的观点打破了一些

11、人的成见,引发了全社会的广泛关注,媒 体也因此获得美誉。 (三) 现有数据再利用型的数据新闻 指报道者收集其他企业、科研机构、媒体或个人发 表的与报道主题相关的数据分析报告或新闻报道,按照自 我的报道意图对其中的数据进行新闻价值的再挖掘,将已 有数据按照报道的叙事逻辑进行分析重组后制作成的数据 新闻。 优点:可以依据公开的丰富的数据资源,避免数据 采集过程中可能遭遇的问题与麻烦,减少不必要的成本支 出,它特别适合一些中小型媒体或是初步尝试数据新闻实 践的媒体,可避免过度投入的风险。 应注意数据的真实、权威和可信,报道应标明数据 的出处和来源链接。 现有数据再利用型的数据新闻作品六十五年国人婚恋

12、观变迁 2014年是中华人民共和国成立 六十五周年,网易“数读”栏目于9 月26日推出了六十五年国人婚恋观 变迁史的报道。 该报道以可视化信息图表的方 式呈现,将信息图表设置为若干个色 块,每一个色块代表着婚恋观的一个 部分。具体包括择偶条件、最受欢 迎、性行为态度、平均婚龄、离婚 率、再婚占结婚总数比例等六个部 分。 该报道选题从小处着眼,通 过透视婚恋观念的变化,以具体的 数据展现人们从单一到多元、从压 抑到自由的观念变化,从而折射出 六十五年来中国社会的巨变。 数据来源比较笼统。 此类数据新闻的报道者需要 有清晰的思路和明确的报道角度, 带着选题找数据。 失宠的中国旅游业 讨论 如果一个

13、媒体将本媒体曾经的报道数字化,并建立相应 的数据库,那么当它使用这个数据库的已有数据进行数 据报道时,这种数据新闻应当属于哪类数据新闻呢? 三、以事件为选题的数据新闻与以话题为选题的数据新闻 (一)划分依据: 以选题性质为划分标准。 (二)以事件为选题的数据新闻 指将报道选题聚焦于某一新闻事件,对事件呈现出来 的具有新闻价值的数据进行解读和呈现的数据报道。 以事件为选题的数据新闻最常出现在重大新闻事件的报 道中。在这类事件中,数据报道可能是媒体精心制作的报道主 体,也可能是媒体对事件的整个专题报道中的一个有机组成部 分。 事件类型: 可预见的重大新闻事件一般多指会议、活动、庆典或赛 事,作为媒

14、体可以用较为充足的时间投入对这类事件选题的策 划中。 突发新闻事件。在此类数据新闻中,媒体不但可以将事 件主体的信息制作成数据报道,也可以将事件的背景材料进行 整合和可视化。 针对这类事件的数据新闻在增多,大量数据资源的整合 和运用为此类新闻报道增添了更多科学性 卫报英国骚乱报道案例中对网络谣言的报道就属于 此种类型的数据新闻。 案例:纽约时报如何报道马航MH370失联事件? 2014年3月8日,一架由马来西亚 飞往北京的航班MH370与地面失联,3月 24日马来西亚总理宣布该客机坠落。 纽约时报网站为此推出 了数据报道专题“寻找马航370” (The Search for Malaysia

15、Airlines Flight 370),以强大 的数据挖掘、分析和整合能力对该 航班可能的飞行路线、搜寻范围做 了解析和预测,并用可视化的方式 将这次事件中大众普遍关心的技术 问题以直观的形式呈现出来。 失联搜救中的统计数据分析 | 统计之都 (中 国统计学门户网站,免费统计学服务平台) http:/cos.name/2014/04/search.rescue.pl ane.statistical.data.analysis/ (三)以话题为选题的数据新闻 指将报道选题聚焦于某类新闻话题,围绕此话题收集数 据,并对之进行解读和呈现的数据报道。 这类数据新闻的选题有了更广阔的创意空间。编辑记者 可以根据最新发生的事件做出选题的推理和联想,或是根据一 些潜在的社会现象和问题做出思考,或是在已有的公开数据材 料中找出具有新闻价值的部分,并以此为话题进行数据报道, 甚至还可以是编辑记者自身或读者对某个话题感兴趣而收集数 据做报道。 特点: 前一种类型的数据新闻具有非常规性,因为事件本身 是否可以运用数据新闻的形态进行报道并不是确定的。 以话题为选题的数据新闻没有很强的时效要求,选题 更加灵活、多样,其关键在于编

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号