《国家开放大学《统计学》形考任务1-4参考答案》由会员分享,可在线阅读,更多相关《国家开放大学《统计学》形考任务1-4参考答案(19页珍藏版)》请在金锄头文库上搜索。
1、国家开放大学统计学形考任务1-4参考答案统计学课程是国家开放大学数据科学与大数据技术专业(本科)公共基础课中的统设必修课。本课程4学分,72学时。课程编号:04694形考任务1一、单选题:(每题2分,共计20分)1.在某个或某些属性上的属性表现相同的诸多实体构成的集合称为()。A.同类实体B.异类实体C.总体D.同类集合2.不能自然地直接使用数字表示的属性称为()属性。A.数量属性B.质量属性C.水平属性D.特征属性3.属于总体边界清晰,个体不清晰的变量是()。A.一列车的煤炭B.滇金丝猴种群C.大兴安岭的树D.工业流水线的一批产品4.()是选择个体及采集个体属性值的途径。A.调查方法B.调查
2、工具C.调查准则D.调查程序5.从某生产线上每隔25分钟抽取5分钟的产品进行检验,这种抽样方式属于()A.简单随机抽样B.等距抽样C.整群抽样D.分层抽样6.抽样调查和重点调查都是非全面调查,二者的根本区别是()A.灵活程度不同B.组织方式不同C.作用不同D.抽取样本的方式不同7.按随机原则进行抽样的抽样称为()A.问卷设计B.调查C.抽样设计D.随机抽样8.统计学将由许多个小实体构成的同类实体看作集合,称之为()A.总体B.个体C.总量D.变量9.根据总体的形态,总体可以分为()A.时间总体和空间总体B.实在总体和想象总体C.时点总体和时期总体D.平面总体和线性总体10.统计工作过程由()两
3、个步骤构成。A.统计设计和统计实施B.统计实施和调查设计C.现场调查和调查设计D.统计设计和调查设计二、多选题:(每题2分,共计10分)11.按照信息科学和数据库理论,信息的构成要素主要包括()A.实体B.属性C.调查D.情况12.属性的基本类别包括()。A.数量属性B.质量属性C.水平属性D.特征属性13.下列属于总体边界清晰,个体边界不清晰的是()A.一艘石油巨轮的石油B.一列车的煤炭C.公园一片草地D.大兴安岭的树14.现场调查方法包括的方式有()A.访问B.观察C.实验D.测量15.按照调查的范围划分,调查分为()A.全面调查B.非全面调查C.概率调查D.非概率调查三、判断题:(每题2
4、分,共计20分)16.文字是一种数据。()17.特性可以独立存在,不依赖于观察者的主观视角。()18.信息构成要素中的实体,只能是通过普通感官直接感知的内容。()19.所谓组件构成实体不可缺少的一部分,是客观存在,不依赖于观察者的主观视角,一旦缺少了组件,实体便不完整。()20.数量属性与质量属性是属性的基本分类,也是最重要的分类。()21.统计学将由许多个小实体构成的同类实体看作集合,称之为总体;将构成总体的许多小实体看成集合的元素,特别的,如果小实体都不可再分则称为个体。()22.统计调查都是对样本中的个体进行的,故其结果可称之为个体数据,但统计调查的最终目标却是要获得总体数据所包含的信息
5、。()23.统计数据的获取过程包含调查和汇总两个阶段。()24.数据一般只包括文字、符号、数码、数字、数值等类型,个体信息量巨大的音频、视频、图像并不包括在内。()25.如在总体的每个层里独立进行抽样,则称为分层抽样。()四、简答题(每题10分,共计50分)26.简述分类变量与数值变量的根本区别。答:(1)数值变量的特点是可以自然地直接使用数字地表示其变量值;而分类变量的特点是并非自然地可直接使用数字表示其变量值。(2)数值变量的属性是可数还可序可加;分类变量的属性是可数不可序不可加。27.简述信息与数据的异同。举例说明有些信息不是数据。答:信息是客观世界在人们头脑中的反映,由实体和属性构成。
6、数据是人类有意搜集、记录、整理、保存的一些特殊类型的信息。数据一般是数值或可以数字化的特殊信息,例如文字、符号、数码、数字、数值等,而音频、视频、图像等也是信息,但是由于其不可数字化,通常并不包括在数据的范畴内。28.请分别指出下列描述中的实体与属性。1)汽车的颜色2)家庭的人口数3)国内生产总值最多的国家4)人的身高答:(1)汽车是实体颜色是属性(2)家庭是实体人口数是属性(3)国家是实体国内生产总值是属性(4)人是实体身高是属性29.统计调查的八要素有哪些?答:统计调查具有八个要素:调查主体、调查客体、调查内容(项目)、调查方法、调查工具、调查准则、调查程序、调查结果。30.简述抽样设计的
7、内容和抽样的一般步骤。答:抽样设计即选择部分个体进行信息采集,具体有两种思路:一种是根据已知的先验信息或知识选择有代表性的一个或一些个体称为非随机抽样;另一种是按所谓随机原则选择一些个体,即从总体中选择一些个体时不利用任何信息或没有任何信息可供利用,称为随机抽样。一般步骤包括:(1)先对个体先编制标识码再编制排序码。(2)确定与总体中的个体存在一一对应关系的标识码及排序码,形成的数据库文件,即抽样筐或抽样框。(3)根据研究内容,调查客体的特点,设计合适的抽样调查方法,抽样在抽样筐中进行。形考任务2一、单选题:(每题2分,共计30分)1.对一个变量而言,其()指的是全面调查获得的所有变量值(或组
8、)与其对应频率的一揽子表示。A.分布B.总体分布C.样本分布D.频数2.()指的是抽样调查获得的所有变量值(或组)与其对应频率的一揽子表示。A.分布B.总体分布C.样本分布D.联合总体分布3.以文字叙述方式表达简单变量的分布,一般用于变量值极少的场合(如性别)的分布的表达方法是()。A.语示法B.表示法C.图示法D.函数法4.以表格陈列的方式表达较复杂变量的分布,用于变量值较少的场合(如年龄段)的分布的表达方法是()。A.语示法B.表示法C.图示法D.函数法5.以图形方式表达复杂变量的分布的表达方法是()。A.语示法B.表示法C.图示法D.函数法6.()既可以反映较少类数也可以反映较多类数的分
9、类变量分布,甚至也能反映分组化的数值变量分布,居于优先选择地位。A.饼形图B.柱形图C.条形图D.直方图7.在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即占整个圆形面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。这样的图称为()。A.饼形图B.柱形图C.条形图D.直方图8.在所有总体分布特征中,最重要的分布特征是()。A.中位数B.众数C.标准差D.均值9.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。A.二者均为离散变量B.二者均为连续变量C.前者为连续变量,后者为离散变量D.前者为离散变量,后者为连续变
10、量10.总量指标数值大小()。A.随总体范围扩大而增大B.随总体范围扩大而减小C.随总体范围缩小而增大D.与总体范围大小无关11.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()A.小于100%B.大于100%C.等于100%D.小于或大于100%12.众数是()。A.出现次数最少的次数B.出现次数最少的标志值C.出现次数最多的变量值D.出现次数最多的频数13.在一组数据中,每个数据类型出现的次数称为()。A.参数B.频数C.众数D.组数14.集中趋势最主要的测度值是()。A.几何平均数B.算术平均数C.众数D.中位数15.以下分布中不属于离散型随机变量分布的是()。A.超几
11、何分布B.伯努利分布C.几何分布D.正态分布二、多选题:(每题2分,共计10分)16.分布的表达方法有()。A.语示法B.表示法C.图示法D.函数法17.分布图的主要形式包括()。A.饼形图B.柱形图C.条形图D.直方图18.均值的计算方式包括()。A.算术平均数B.加权平均数C.中位数D.方差19.可以反映数值变量离散程度分布特征的是()。A.中数B.四分位差C.偏度D.标准差20.以下分布中属于连续型随机变量分布的是()。A.超几何分布B.指数分布C.几何分布D.正态分布三、计算分析题(每题10分,共计60分)1.某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者
12、分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师(1)P(A)=4/12=1/3(2)P(B)=4/12=1/3(3)P(AB)=2/12=1/6(4)P(A+B)=P(A)+P(B) - P(AB)=1/3+1/3-1/6=1/22.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。解:求这种零件的次品率,等于计算“任取一个零件为次
13、品”(记为A)的概率。考虑逆事件“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:P(A)=(1-0.2)(1-0.1)(1-0.1)=0.648P(A)=1-P(A)=1-0.648=0.3523.已知参加某项考试的全部人员合格的占80,在合格人员中成绩优秀只占15。试求任一参考人员成绩优秀的概率。解:设A表示“合格”,B表示“优秀”。由于B=AB,于是P(B)=P(A)P(B|A)=0.8x0.15=0.124.某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80,第二发命中的可能性为50。求该选手两发都脱靶的概率。
14、解:设A=第1发命中。B=命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。P(B)=P(A)P(B|A)+P(A)P(B|A)=0.8x1+0.2x0.5=0.9脱靶的概率=1-0.9=0.15.已知某地区男子寿命超过55岁的概率为84,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少?解:设A=活到55岁,B=活到70岁。所求概率为:P(B|A)= P(AB)/P(A)= P(B)/P(A)=0.63/0.84=0.756.某班级共有25名学生,现在收集了所有学生的统计学考试成绩,数据如下:89,95,98,95,73,86,78,67,69,82,84,89,93,91,75,86,88,82,53,80,79,81,70,87,60试计算:(1)该班统计学成绩的均值、中位数和四分位数;(2)该班统计学成绩的总体方差、总体标准差。(3)请根据60分以下,60-70分,70-80分,80-90分,90分及以上的分组标准编制考试成绩的分布表解:(1)X=81.2 Me=82 QI=74或75 Q3=89(2)总体方差:119.92 总体标准差:10.95(3)分组标准编制考试成绩分布表成绩频数频率60分以下14¥60-70分312%70-80分520%8