2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架

上传人:m**** 文档编号:504223603 上传时间:2023-12-10 格式:DOCX 页数:6 大小:350.25KB
返回 下载 相关 举报
2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架_第1页
第1页 / 共6页
2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架_第2页
第2页 / 共6页
2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架_第3页
第3页 / 共6页
2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架_第4页
第4页 / 共6页
2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架》由会员分享,可在线阅读,更多相关《2022年高中信息技术基础知识综合复习优化集训13常用表格数据的处理大数据处理的基本思想与框架(6页珍藏版)》请在金锄头文库上搜索。

1、优化集训13常用表格数据的处理大数据处理的基本思想与框架1.数据处理的核心是,在数据分析、挖掘前通常先对数据进行。2.数据整理时一般采用、或来填充缺失值。3.下列软件中可用于数据统计分析的是(多选,填序号)SPSSExcelPhotoshopSASFlashMATLABGoldWaveRPythonJava4.Excel中对某工作表的C10单元格进行公式计算,下列可能是该单元格的计算公式的是()A.SUM(C2C9)B.=A10+C10C.AVERAGE(C2:C9)D.=MAX(C2:C9)5.下图为Excel中存储的“2012年主要城市入境游接待人数构成情况”的相关数据。请回答下列问题:(

2、1)B31单元格中存储了所有主要城市的外国人人数之和,C31:E31区域的值通过B31单元格自动填充得到,则B31单元格的公式为:(2)C32单元格中存储了所有主要城市香港同胞人数的总和在所有主要城市入境游接待人数之和中所占的百分比(%)数据,D32:E32区域的值通过C32单元格自动填充得到,则C32单元格的公式为:(3)需要分析“上海、北京、杭州三地港澳台游客构成情况”,以A2:A5,C2:E5为数据源创建图表,应选择以下(单选,填字母)选项的图(填写图表类型)。上海、北京、杭州三地港澳台游客构成情况A上海、北京、杭州三地港澳台游客构成情况B上海、北京、杭州三地港澳台游客构成情况C上海、北

3、京、杭州三地港澳台游客构成情况D(4)分析上题中图表可知澳门同胞最喜欢去(单选,填字母:A.上海/B.北京/C.杭州)旅游。最喜欢去上海旅游的是(单选,填字母:A.香港/B.澳门/C.台湾)同胞。6.下图为Excel中存储的“20012006部分国家年均PM10浓度统计表”的相关数据。请问答下列问题:(1)B40单元格中存储了当前工作表中所有国家2001年的平均值,C40:G40区域的值通过B40单元格自动填充得到,则B40单元格的公式为:(2)B41单元格中存储了当前工作表中所有国家2001年的最大值,C41:G41区域的值通过B41单元格自动填充得到,则B41单元格的公式为:(3)B42单

4、元格中存储了当前工作表中所有国家2001年的最小值,C42:G42区域的值通过B42单元格自动填充得到,则B42单元格的公式为:(4)H4单元格中存储了中国2006年PM10的浓度和表中所有国家平均值的差值,H5:H39区域的值通过H4单元格自动填充得到,则H4单元格的公式为:(5)需要分析“中、印、俄、巴四国年均PM10浓度对比情况”,以B15:H17,B40:H41为数据源创建下方图表。新兴经济体国家(中国、印度、俄罗斯联邦、巴西)年均PM10浓度对比图(20012006)上述图表类型为图。从图表可知,在新兴经济体国家中PM10年均浓度下降幅度最大的国家是。7.大数据处理采用思想:把复杂问

5、题分成两个或多个相似问题,求解子问题后,再用合适方法将其成求解整个问题的解法。8.大数据处理类型如下图所示,请在图中空白处填上相应的内容。9.是一个可运行于大规模计算机集群上的系统基础架构,适用于静态数据的批处理计算。10.HDFS的主要功能是将大规模海量数据以的形式、用多个副本保存在不同的存储节点中,并用进行管理。是一个的系统,适合部署在廉价的机器上(云盘、网盘的底层一般采用HDFS)。11.分布式数据库HBase建立在HDFS提供的底层存储基础上,采用的存储方式,主要用来存储数据和数据,可管理PB级的大数据。12.分布式并行计算模型是一种分布式并行编程模型,能够处理大规模数据集的,主要由(

6、映射)和(归纳)2个函数构成。13.流计算系统可以简单、高效、可靠地实现的获取、传输和存储,在与数据库、Hadoop、编程语言等整合后可开发出功能强大的应用。优化集训13常用表格数据的处理大数据处理的基本思想与框架1.数据整理2.平均值中间值概率统计值3.解析Photoshop是图像处理软件;Flash是二维动画制作软件;GoldWave是音频处理软件。4.D解析A.Excel中的区域用冒号分隔左上角单元格名和右下角单元格名;B.公式当中不能出现结果单元格自身;C.缺少标志公式计算的等号。5.(1)=SUM(B3:B30)(2)=C31/SUM($B31:$E31)* 100解析横向自动填充,

7、默认发生相对引用,被填充单元格的列号相对样板单元格发生改变,而公式中的分母B31与E31单元格不能变化,所以将分母B31与E31单元格的列号B与E加上$锁定不让它发生改变。(3)C柱形(4)CC6.(1)=AVERAGE(B4:B39)(2)=MAX(B4:B39)(3)=MIN(B4:B39)(4)=G4-G$40解析纵向自动填充,默认发生相对引用,被填充单元格的行号相对样板单元格发生改变,而公式中存储了平均值的G40单元格不能变化,所以将其行号40加上$锁定不让它发生改变。(5)折线印度7.分治组合8.静态流图9.Hadoop分布式10.分布式文件系统文件分布式系统高度容错性11.基于列非结构化半结构化12.并行运算MapReduce13.实时数据实时计算与分析1

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号