2022大数据技术知识考核试题与答案

举报
资源描述
大数据技术知识考核试题一、选择题1.大数据的本质是(单选题*A.洞察B.搜集C.联系D.挖掘V2.网络安全与信息化领导小组成立的时间是:()单选题*A.2015B.2012C.2013D.2014V3.智能健康手环的应用开发,体现了()的数据采集技术的应用。单选题*A.统计报表B.网络爬虫C.API 接口D.传感器V4.分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于()问题。单选题*A.关联规则挖掘VB.分类与回归C.聚类分析D.时序预测5.企业在面向客户制定运营策略和营销策略时,希望能针对不同客户推行不同策略,即希望对客户群体进行细分,这个问题属于()单选题*A.关联规则挖掘B.回归问题C.聚类分析,D.时序预测6.对本月股票走势进行预测,属 于()单选题*A.关联规则挖掘B.回归问题C.聚类分析D.时序预测V7.如果规则集R 中不存在两条规则被同一条记录触发,则称规则集R 中的规则为(1 单选题*A.无序规则B.穷举规则C.互斥规则VD.有序规则8.支撑大数据业务的基础是(单选题*A.数据科学B.数据应用C.数据硬件D.数据人才V9.以下关于Python用于数据分析的包,说法错误的是()单选题*A.seaborn是用于作统计图的包B.sklearn是用于进行机器学习的包C.Tensorflow是进行深度学习的包D.numpy是python环境自带的包,不需要用pip命令安装V10.以下关于数据分析平台,说法正确的是()单选题*A.Python常用的数据分析平台是Jupyter Notebook.B.Python环境下安装外来包的命令是installVC.Jupyter Notebook是一个交互式的数据分析平台。D.Jupyter Notebook是一个基于解释器的运行环境。11.以下不属于数据分析任务的是()单选题*A.用网络爬虫爬取数据B.用一个特定值将数据集中的缺失数据填充C.清理电脑里的垃圾数据VD.作图探索和选择合适的数据分析方法12.下列国家的大数据发展行动中,集中体现 重视基础、首 都 先 行 的 国 家 是(单选题*A.美国B.日本C.中国D.韩国V1 3.关于相关分析,以下说法错误的是()单选题*A.相关系数的取值在-1 至!+1 之间。B.相关系数取值为负数,表示两列数据之间不相关。VC.相关系数取值为0,表示两列数据之间不相关。D.可以用热图来表现数据集的相关系数矩阵。14.一般情况下,()越 高,说明有更多的正类样本被模型预测正确,模型的效果越好。单选题*A.查准率B.错误发现率C.召回率 True positive rate(TPR,Recall)VD.阴性预测值15.数据仓库的最终目的是(X 单选题*A.收集业务需求B.建立数学模型的需要C.改写各种算法的需要D.为用户和业务部门提供决策支持V1 6.数据挖掘常见的工具或算法,不包括(单选题*A.聚类B.分类C.排序VD.预测17.衡量某一关联规则有两个指标:关联规则的支持度(support)和(I 单选题*A.准确度B.精密度C.置信度VD.精确度18.()是均方误差的算术平方根。单选题*A.标准差(SD,Standard Deviation)B,平均绝对误差(MAE,Mean Absolute Error)C.均方根误差(RMSE,Root Mean Square Error)VD.均方误差(MSE,Mean Squared Error)19.在()关联规则中,只涉及数据的一个维度,即处理单个属性中的关系。单选题A.单维VB.多维C.单因素D.多因素20.云计算是对()技术的发展与运用 单选题*A.并行计算B.网络计算C.分布式计算D.三个选项都是V2 1.以下做法错误的是:()单选题*A.涉密存储介质淘汰、报废时,可以当作废品出售VB.从互联网上下载资料应采用单向导入方式以确保安全C.用于联接互联网的计算机,任何情况下不得处理涉密信息D.严禁在联接互联网计算机与内部计算机之间混用优盘等移动存储介质2 2.国务院办公厅是在()印发的 关于促进和规范健康医疗大数据应用发展的指导意见?单选题*A.2014年B.2015 年C.2013年D.2016 年V2 3.数据清洗的方法不包括(I 单选题*A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理,24.关于人工神经网络,以下说法错误的是()单选题*A.人工神经元是人工神经网络处理信息的基本单元。B.Relu是一种激活函数C.人工神经网络是解决聚类问题的算法。VD.BP算法是一种典型的人工神经网络算法。2 5.可以用来表示时间变化趋势的可视化手段是()单选题*A.折线图VB.饼图C.条形图D.马赛克图2 6.()是在没有给定划分类的情况下,根据信息相彳以度进行操作的一种方法,因此又称为无指导的学习。单选题*A.回归B.聚类VC.分类D.关联规则27.下列关于计算机存储容量单位的说法中,错误的是(X 单选题*A.1KB1MB=1);(2)列出最低薪金大于1500的各种工作。select DISTINCT JOBfrom emp e lwhere 1500 (select min(SAL)from emp e2where e2J0B=el.JOB);4、假定两个水平类似的班级(一班和二班)上同一门课,但是由于两个任课老师的评分标准不同,使得两个班成绩的均值和标准差都不一样。一班分数的均值和标准差分别为78.53和9.43,而二班的均值和标准差分别为70.19和7.00。那么得到90分的一班的张颖是不是比得到82分的二班的刘疏成绩更好呢?脖页的标准得分为(90-78.53)/9.43=1.22,而刘疏的标准得分为(82-70.19)/7=1.69。显然如果两个班级平均水平差不多,刘疏的成绩应该优于张颖的成绩。填空题*5、一批产品共10件,其 中7件正品,3件次品,每次从这批产品中任取T 牛,在下述三种情况下,分别求直至取得正品时所需次数的概率分别布。5、一批产品共10件,其 中7件正品,3件次品,每次从这批产品中任取一件,在下述三种情况下,分别求直至取得正品时所需次数的概率分别布。(1)每次取出的产品不再放回去;(2)每次取出的产品仍放回去;(3)每次取出一件次品后,总是另取T 牛正品放回到这批产品中。填空题*答案解析:解:(1)X的所有可能值为1,2,3,4。X的分布列为P(X=l)=7/10,P(X=2)=3/10 x7/9=7/30,P(X=3)=3/10 x2/9x7/8=7/120,p(X=4)=3/10 x 2/9 x 1/8=l/120o(2)X 的所有可能值为1,2,3,4。X 的分布列为P(X=k)=,k=l,2,3,(3)X 的所有可能值为1,2,3,4。X 的分布列为P(X=l)=7/10,P(X=2)=3/10 x8/10=6/25,P(X=3)=3/10 x 2/10 x 9/10=27/500,P(X=4)=3/10 x 2/10 x 1/10=3/500.
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号