一、名词解释1、 总休:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体,即研究对象 的某项指标的取值的集合或全体2、 统计量:统计量是统计理论中用来对数据进行分析、检验的变量3、 独立事件:在概率论里,说两个事件是独立的,是指在一次实验中,一个事件的发生不 会影响到另一个事件发生的概率4、 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件 称为小概率事件,一般将事件发生的概率在0.01以下或0.05以下的事件称为小概率事件5、 假设检验:是数理统计学中根据一定假设条件由样本推断总体的一种方法,用来判断样 本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成6、 样本:是观测或调查的一部分个体7、 参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值8、 对立事件:其中必有一个发生的两个互斥事件叫做对立事件9、 概率:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随 着n逐渐增大,频率nA/n逐渐稳定在某一数值p附近,则数值p称为事件A在该条件下发 生的概率,记做P(A)=po这个定义成为概率的统计定义。
10、 参数估计:根据从总体中抽取的随机样本,来估计总体分布中未知参数的过程二、填空1、 相关系数的取值范围是()的2、 用来说明回归方程代表性大小的统计分析指标是(估计标准误卜3、 试验设计的三大基本原则是(完全重复、随机化、区组化L4、在其他条件不变的情况下,样本容量和抽样误差的关系是样本容量越大,抽样误差(越5、 参数估计包括(点)估计和(区间)估计6、 假设检验首先要对总体提出假设,一般应作两个假设,一个是(检验假设),一个是(备 择假设b7、 统计上常用(回归)分析来研究呈因果关系的两个变量间的关系,用(相关)分析来研 究呈平行关系的两个变量间的关系8、 试验设计包括3个基本要素,即(受试对象、处理因素、试验效应b9、 在抽样调查时,抽样误差越小,用样本估计总体的可靠性就越(大)o10、 统计推断主要包括(假设检验)和(参数估计)两个方面11、 在频率的假设检验中,当np或M ( <30 )时,需进行连续性矫正三、选择题1、 统计分组时,在全距一定的情况下(B)0A、 组距越大,组数越多B、 组距越大,组数越少C、 组距大小与组数多少无关D、 组距大小与组数多少成正比2、 某选手打靶10次,有7次命中十环,占70% ,则此70%为(B bA、概率 B、频率 C、必然事件 D、随机事件3、 对于正态分布,标准差o的大小决定了曲线的“胖:“瘦”程度。
若越小,曲线越“瘦”,变量 越集中在(Bb4、 在平均数p左右二倍标准差范围内的变数个数约为变数总个数的(B LA、68.27% B、95.45% C、31.73% D、99.73%5、 平均数抽样误差的大小,用(D )的大小来衡量A、标准差S B、标准差o C、方差o2 D、标准误匕6、 抽样调查应遵循的原则是(C £A、准确性原则 B、可靠性原则C、随机性原则 D、灵活性原则7、 统计学上,表示两变异量间没有依存关系的情形,称为(C )A、正相关 B、负相关 C、零相关 D、反相关8、 为了区别,统计上规定凡是参数均用希腊字母表示,如总体平均数用符号(C)表示A、o B、x C、p D、S9、 正态分布密度曲线的“胖;“瘦”程度是由(A)大小决定的A、o B、p C、p+a D、p-a10、 (A)的大小表示了回归方程估测可靠程度的高低,或者说表示了回归直线拟合度的高 低A、决定系数 B、相关系数 C、回归系数 D、变异系数11、 连续性资料的整理与分组是采用:(A)A、组距式分组法 B、单顶式分组法 C、统计次数法 D、评分法12、 为了研究山羊毛色的遗传规律,用白色山羊与黑色山羊进行杂交,结果在260只杂交 子二代中,181只为白色,79只为黑色。
问是否符合孟德尔遗传分离定律该资料所用的 统计分析方法应为(D bA・t•检验C.卡方检验的独立性检验B.两因素的方差分析D.卡方检验的适合性检验13、四、判断题1、 在试验设计中,随机误差只能减少,而不可能完全消除V )2、 计数资料也称连续性变量资料,计量资料也称非连续性变量资料x )3、 事件A的发生与事件B的发生毫无关系,则事件A和事件B为互斥事件x)4、 作假设检验时,如果|u|>ua,应接受H0,否定HAo ( x )25、 力 检验中进行2xC ( c>3 )列联表的独立性检验时,不需要进行连续性矫正V )6、 在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量x )7、血型属于连续性变量x)8、两样本方差的同质性检验用u检验x )9、在遗传学上常用独立性检验来检验所得的结果是否符合性状分离规律x )10、正态分布密度曲线向左、向右无限延伸,以丫轴为渐近线x)11, 对于有限总体不必用统计推断方法x)12. 离均差平方和为最小x)13. 样本标准差s是总体标准差的无偏估计值x )14. 在假设检验中,对大样本(n>30 ),用u检验法,对小样本(n< 30 )用t检验。
x)2 2 廿215. 犷 检验时,当力时,否定H0,接受HA,说明差异达显著水平J)16. 回归系数b的符号与相关系数r的符号,可以相同也可以不同J )17. 体重属于非连续性变量x )18、泊松分布参数入等于Mo ( V)19、 rXc列联表的力检验的自由度为rc-k (x)20、 如有n个变数,其相乘积开n次方所得的方根,即为算术平均数x )21、 在进行区间估计时,a越小,则相应的置信区间越小x )五、问答题1、 什么是标准差,它的特性是什么?答:标准差是方差的算数平方根,意义在于反映一个数据集的离散程度标准差的特性 表现在四个方面:①标准差的大小受资料中每个观测值的影响,若观测值间变异大求得的标 准差也大,反之则小②在计算标准差时,在各观测值加上或减去一个常数,其数值不变 ③当每个观测值乘以或除以一个常数a ,则所得的标准差是原来标准差的a倍或1/a倍④ 在资料服从正态分布的条件下,资料中约有68.27%的观测值在平均数左右1倍标准差(士 S )范围内;约有95.45%的观测值在平均数左右2倍标准差(±2S )范围内;约有99.73% 的观测值在平均数左右3倍标准差(±3S )范围内。
2、 什么是次数分布表?制表的基本步骤有哪些?答:次数分布表指对于一组大小不同的数据划出等距的分组区间,然后将数据按其数值 大小列入各个相应的组别内的表制表步骤为:①计算全距②确定组距③划分组段④ 统计频数⑤确定频率与累计频率3、 正态分布曲线有哪些特点?o和p对正态分布曲线有何影响?答:正态分布具有以下特点:①正态分布曲线是以平均数p为峰值的曲线,当x=p时, f(x)取最大值:②正态分布是以p为中心向左右两侧对称的分布:③的绝对值越大,f(x)值就 越小,但f(x)永远不会等于0 ,所以正态分布以X轴为渐近线,X的取值区间为(・00 ,+00);④正态分布曲线完全由参数p和来决定;⑤正态分布曲线在x=M±a处各有一个拐点;⑥正态分布曲线与X轴所围成的全部面积必定等于1o正态分布具有两个参数p和p确定正态分布曲线在x轴上的中心位置,M减小,曲 线左移,p增大,曲线右移;定正态分布曲线的展开程度,o越小,曲线展开程度越小, 曲线越陡高,越大,曲线展开程度越大,曲线越矮宽4、 什么是频率及概率?概率的基本性质是什么?答:在相同的条件下,进行了 n次试验,在这n次试验中,事件A发生的次数m称为 事件A发生的频数。
当重复试验的次数n逐渐增大时,频率fn(A)呈现岀稳定性,逐渐稳定 于某个常数,这个常数就是事件A的概率概率的基本性质有:①非负性:OSP(A)G ;② 规范性:必然事件发生的概率为1 ,不可能事件发生的概率为0;③可加性:当事件A与B 互斥时,P ( AuB)=P(A)+P(B)o5、 试简述统计推断答:统计推断是由样本的信息和假定模型对总体做出以概率形式表述的推断,它又可以 分为两类问题,即参数估计和假设检验参数估计分为点估计和区间估计两类点估计是依据样本估计总体分布中所含的未知参 数或未知参数的函数通常它们是总体的某个特征值,如数学期望、方差和相关系数等区 间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总 体分布的未知参数或参数的函数的真值所在范围的估计假设检验的基本思想是小概率反证法思想先提出假设,再用适当的统计方法确定假设 成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成 立假设检验的基本步骤为:①对样本所属总体提出假设(包括Ho和Ha);②确定显著水平 a;③选定统计方法,由样本观察值按相应的公式计算出统计量的大小,④根据统计量的大小及其分布确定检验假设成立的可能性P的大小;⑤将算得的概率与a相比较,根据小概率 事件实际不可能性原理作出是接受还是否定Ho的推断。