《高德地图数据采集方法》由会员分享,可在线阅读,更多相关《高德地图数据采集方法(23页珍藏版)》请在金锄头文库上搜索。
1、八爪鱼云采集网络爬虫软件 高德地图数据采集方法本文介绍使用八爪鱼采集高德地图数据(以美食地址为例)的方法。采集网站:http:/ 创建循环翻页l 分页列表信息采集l Ajax设置步骤1:创建高德地图数据采集任务1)进入主界面,选择“自定义采集2) 将要采集的网站URL复制粘贴到输入框中,点击“保存网址”步骤2:文本输入1)鼠标移动到地址选择框,在右面的提示框中选择“点击该元素”然后鼠标选中输入框,在提示框中选择“输入文字”3) 在弹出的输入框中输入要采集的城市,这里以新乡为例,然后点击确定。鼠标点击新乡,并在输入框中选择“点击该元素”步骤3:创建翻页循环1) 移动鼠标,在右面拖入一个循环框,
2、如下图所示鼠标点击输入框,在右面提示框中选择“输入文字”,然后选择确定把输入文字的步骤拖入规则流程,在高级选项中选择执行前等待“2秒”,选择文本列表,并在列表中输入需要采集的品类,这里以菜系为例,如下图可输入“火锅”等。鼠标选中输入文本步骤,高级选项中勾选使用当前循环里的文本来填充输入框2) 鼠标点中搜索框,接着选择“循环点击每个元素”。3) 进入火锅店列表页后,鼠标移动到最后并选中翻页按钮,在右面的提示框中选择”循环点击的单个元素“3)之后选中火锅店的第一条链接,系统自动识别出其他的元素后,在右面的提示框中选择“选中全部”,以创建循环翻页。再选择“循环点击单个元素”步骤4:高德地图数据提取详
3、细信息1)进入列表详情页以后,选中店名, 然后在右面的提示框中选择“采集该元素文本”,同样操作,可以把地址、分类等信息采集下来。2)然后鼠标点中字段旁边的编辑标识,可以对提取字段的自定义命名,点中旁边的删除标识可以删除不需要的字段。鼠标选中返回,然后选择“点击该元素”步骤5:Ajax设置由于此网页涉及Ajax技术,我们需要进行一些高级选项的设置。选中“点击元素”步骤,打开“高级选项”,勾选“Ajax加载数据”,设置时间为“2秒”。每一个点击元素的高级选项都需要设置。Ajax设置完成之后,再重新启动本地采集,采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出这里我们选择excel作为导出为格式,数据导出后如下图相关采集教程:百度地图数据采集:http:/