文档详情

《新媒体数据分析与应用》新媒体数据的收集

第***
实名认证
店铺
PPTX
42.18MB
约36页
文档ID:600132695
《新媒体数据分析与应用》新媒体数据的收集_第1页
1/36

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,数据是开展数据分析的前提,新媒体运营者只有收集到足够多的有价值的数据才能进一步建立数据分析模型,再通过分析数据发现数据背后隐藏的规律,从而得出有价值的分析结果来指导新媒体的运营本章将详细介绍收集新媒体数据的流程与方式,以及如何使用网络爬虫工具采集数据新媒体数据的收集,初识新媒体数据收集,2.1,目录,CONTENTS,使用网络爬虫工具采集数据,2.2,初识新媒体数据收集,2.1,数据收集,即根据数据分析的需要收集相关的数据,它是新媒体运营者开展数据分析的一个必要环节,也是做好数据分析的基本保障工作2.1.1,新媒体数据收集的基本流程,1,明确信息需求,(,1,)明确核心指标,(,2,)根据核心指标构建数据分析指标体系,(,3,)根据数据分析指标体系有针对性地采集数据,2,按需求采集数据,(,1,)运营者要整理出数据指标,(,2,)根据数据指标和数据分析目的采集数据,2.1.2,新媒体数据可用性的判断,数据来源,数据细节,数据真实性,的判断,检查数据记录和字段是否完整,数据完整性的判断,数据的时效性,数据的支持性,数据的全面性,数据价值性的判断,2.1.3,新媒体数据收集的方式,从新媒体账号后台获取数据,某公众号“昨日关键指标”分析,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,微热点(微舆情),热点分析,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,微热点(微舆情),“大数据报告”板块发布的热点解读报告,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,微热点(微舆情),分析工具,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,百度指数,关键词“直播带货”的搜索指数趋势,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,新榜,新视,指数榜单中“美妆”类视频号的日榜,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,新榜,新抖,抖音号搜索的相关数据,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,新榜,新快,新快直播电商下的“销售额排行”页面,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,新榜,新站,新站,UP,主搜索页面,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,飞瓜数据,飞瓜数据抖音版工作台,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,卡思数据,卡思数据“数据报告”板块,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,卡思数据,卡思数据哔哩哔哩平台版的“达人查找”页面,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,卡思数据,达人详情页,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,蝉妈妈,抖音商品销量榜,2.1.3,新媒体数据收集的方式,使用第三方数据分析工具收集数据,蝉妈妈,商品详情分析页,2.1.3,新媒体数据收集的方式,使用网络爬虫工具采集数据,八爪鱼采集器,八爪鱼采集器首页,2.1.3,新媒体数据收集的方式,使用网络爬虫工具采集数据,爬山虎采集器,爬山虎采集器的主界面,工具栏,任务列表,起始页,使用网络爬虫工具,采集数据,2.2,对于新媒体运营者来说,使用网络爬虫工具采集数据既简单又便捷。

下面以八爪鱼采集器为例,介绍使用网络爬虫工具采集数据的方法八爪鱼采集器提供了模板采集、自定义采集、云采集等多种采集模式,新媒体运营者可以根据自己的需求选择合适的采集模式来采集数据2.2.1,模板采集,模板采集就是使用由八爪鱼采集器提供的采集模板进行数据采集目前,八爪鱼提供的采集模板超过,200,个,涵盖各主流网站的采集场景模板采集模式简单易操作,新媒体运营者在采集数据时只需输入网址、关键词、页数等参数,就能快速获得目标网站的数据使用八爪鱼采集器中的模板采集模式采集数据的操作步骤如下2.2.2,自定义采集,新媒体运营者使用智能识别模式采集数据时,只需输入要采集数据的目标网址即可,八爪鱼采集器能够自动智能识别网页数据使用八爪鱼采集器智能识别模式采集数据的操作步骤如下使用智能识别模式采集数据,2.2.2,自定义采集,采集流程(也叫采集任务、采集规则)是指从特定网页上提取数据的一系列步骤自己手动配置采集流程,可以灵活应对各类采集场景,包括翻页、滚动、登录等由于每个网站的页面布局是不同的,因此采集流程不能通用通常来说,一个网站需要配置一个采集流程自己手动配置采集流程采集数据,采集流程,2.2.2,自定义采集,自己手动配置采集流程采集数据,单个数据的采集,以在京东商城商品详情页上采集商品数据为例,使用八爪鱼采集器手动配置采集流程进行单个数据采集的操作步骤如下。

2.2.2,自定义采集,自己手动配置采集流程采集数据,从列表进入详情页采集数据,头条号文章列表,文章详情页,2.2.2,自定义采集,自己手动配置采集流程采集数据,从列表进入详情页采集数据,下面以采集头条号文章的数据信息为例,介绍如何使用八爪鱼采集器自定义采集模式从列表进入详情页采集数据,操作步骤如下2.2.2,自定义采集,自己手动配置采集流程采集数据,多页数据的采集,单击“下一页”按钮实现翻页,2.2.2,自定义采集,自己手动配置采集流程采集数据,多页数据的采集,下面以在哔哩哔哩平台上按类目标签采集视频数据为例,介绍使用八爪鱼采集器采集通过单击“下一页”按钮实现翻页的网站的数据的方法,操作步骤如下2.2.3,云采集,云采集是指使用由八爪鱼采集器提供的云服务集群进行数据采集在云采集模式下,新媒体运营者可以实现,724,小时不间断采集数据新媒体运营者可以在本地计算机上完成采集流程的配置,测试采集流程没有问题以后,便可启动云采集,由八爪鱼采集器的云服务集群采集数据2.2.3,云采集,启动云采集,单击“启动云采集”按钮,2.2.3,云采集,启动云采集,单击“启动云采集”按钮,2.2.3,云采集,查看云采集状态,云采集任务状态,课后习题,1,新媒体数据可用性的判断包括哪些内容?,2,尝试使用八爪鱼采集器采集微博热搜榜数据;自己选择一个头条号,采集该头条号所发布的文章的数据。

下载提示
相似文档
正为您匹配相似的精品文档