数理统计1.2版－金锄头文库

资源描述

《数理统计1.2版》由会员分享，可在线阅读，更多相关《数理统计1.2版（29页珍藏版）》请在金锄头文库上搜索。

1、数理统计1.2版参考试题一、填空题1.设总体为样本，样本均值及样本方差分别为，设则统计量 t(n-1) 。2.设 F(1,n) 。3.设总体X的均值为，为样本，当a=：时，E达到最小值。4. 设总体为样本，： 5.设总体X的均值和方差分别为a, b , 样本均值及样本方差分别为，则 E (S 2 )=：。6. 设总体X 服从参数为的泊松分布，1.9，2，2，2.1， 2.5为样本，则的矩估计值为 2.1 。7. 设总体为样本，若为的无偏估计，则 c = 8. 设总体为样本，则的矩估计量为：，极大似然估计量为：。9. 设总体为样本，未知，2 已知，为使的置信度为1的置信区间长度不超过L，则需

2、抽取的样本的容量n至少为：。10. 设总体为样本，、2 未知，则2的置信度为1的置信区间为。11设X服从二维正态分布，其中令Y，则Y的分布为N(A, AAT ) (要求写出分布的参数)12. 设总体X在区间上服从均匀分布，则的矩估计 -1/2 ； 1/12n 。13. 设是来自正态总体的样本，均未知，. 则的置信度为的置信区间为：；若为已知常数，则检验假设（已知），的拒绝域为：14设X服从维正态分布，X的样本，则的最小方差无偏估计量；服从：分布。15设（X1，Xn）为来自正态总体的一个样本,已知。对给定的检验水平为，检验假设，（已知）的统计量为：拒绝域为：。16某试验的极差分析结果如下表（设

3、指标越大越好）：表1 因素水平表因素水平ABCDE130020200甲80232030250乙100表2 极差分析数据表列号试验号A1B23C4D5E67数据yi(产率)1111111183.42111222284.03122112287.34122221184.85212121287.36212212188.07221122192.38221211290.4j339.5342.7350.1350.3348.4351.6348.5T=j358.0354.8347.4347.2349.1345.9349.0697.5Rj18.512.12.73.10.75.70.5Sj42.78118.3010

4、.9111.2010.0614.0610.031ST=63.347则（1）较好工艺条件应为：。（2）方差分析中总离差平方和的自由度为：7。（3）上表中的第三列表示：。17为了估计山上积雪溶化后对河流下游灌溉的影响，在山上建立观测站，测得连续10年的观测数据如下表（见表3）。表3 最大积雪深度与灌溉面积的10年观测数据年份最大积雪深度x(米)灌溉面积y(千亩)计算值残差di197115.228.6231.04817.96434.7229.913-1.313197210.419.3108.16372.49200.7221.211-1.911197321.240.5449.441640.25

5、858.6040.790-0.290197418.635.6345.961267.36662.1636.077-0.477197526.448.9696.962391.211290.9650.218-1.318197623.445.0547.562025.001053.0044.7790.221197713.529.2182.25852.64394.2026.8312.369197816.734.1278.891162.81569.4732.6321.468197924.046.7576.002180.891120.8045.8670.833198019.137.4364.811398.767

6、14.3436.9830.417188.5365.33781.0714109.377298.97则y关于x的线性回归模型为：二、简述题1.检验的显著性水平及检验的p值。小概率事件的值记为，称为显著性水平，它是指检验犯第一类错误的概率（即弃真错误的概率）检验的P值是指统计量落入某个区域内的概率，这里“某个区域”是个拒绝域。2.参数的点估计的类型、方法、评价方法。（1）点估计（2）区间估计参数的点估计的方法：a、矩估计法。基本思想：由于样本来源于总体，样本矩在一定程度上反映了总体矩，而且由大数定律可知，样本矩依概率收敛于总体矩。因此，只要总体X的k阶原点矩存在，就可以用样本矩作为相应总体矩的估计

7、量，用样本矩的函数作为总体矩的函数的估计量。b、极大似然估计法。基本思想：设总体分布的函数形式已知，但有未知参数，可以取很多值，有的一切可能取值中选一个使样本观测值出现的概率为最大的值作为的估计值，记为，并称为的极在似然估计值。这种求估计值的方法称为极大似然估计法。参数的点估计的评价方法：（1）无偏性（2）有效性（3）一致性3.假设检验的思想、推理依据及参数假设检验的步骤。假设检验的思想来源于人们对一批样品做检验时，由于样本多或检测成本高，因而无法逐一检验，只是抽样检测指标X，得到一样本，,。通过检验要从这个样本推断总体均值是否为人们的要求，也即当在总体分布已知，只是参数未知时，需要引入假设检

8、验，其最后都可归结为“看图说话”的问题，其一般步骤为：以双边假设为例，其首先应提出原假设H及对立假设H，有H： H：；其次，确定检验统计量，其应包含待检验参数，不包含任何未知参数；最后确定检验拒绝域，一般按照P拒绝H/ H为真确定4.方差分析的目的及思想（结合单因素）。方差分析的目的，也就是在试验中针对其中的某一个因素是否起显著性作用而进行的假设检验，其对应由水平与试验而形成的试验表格。它是通过构造相应的组内差与组间差来作比较，从而得知因素的显著性作用大小。5.简述正交实验设计中的数据分析方法正交实验设计中的数据分析方法常用的有极差分析法和方差分析法极差分析法：直观、简单，但过于粗糙方差分析法

9、：能提供更详细的有关结论，但计算量稍大。6主成分分析。将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。在实际课题中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个课题的某些信息，主成分分析是对于原先提出的所有变量，建立尽可能少的新变量，使得这些新变量是两两不相关的，而且这些新变量在反映课题的信息方面尽可能保持原有的信息。7.典型相关分析。典型相关分析是简单相关、多重相关的推广；或者说简单相关系数、复相关系数是典型相关系数的特例。典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。8.贝叶斯判别法。

10、如果对多个总体得判别考虑的不是建立判别式，而是计算新给样品属于各总体的条件概率P（l / x），l1，2，k，比较这k个概率的大小，然后将新样品判归为来自概率最大的总体，这种判别法成为Bayes判别法。它的基本思想是假定对所研究的对象已有一定认识，常用先验概率来描述这种认识。设有k个总体，它们的先验概率分别为q，q，q(它们可以由经验给出也可以估出)，各总体的密度函数分别为f(x)，f(x)，f(x)(离散情况下是概率函数)，在观测到一个样本x的情况下，可用著名的Bayes公式计算来自第g总体的后验概率：并且当P（h / x）=P(g / x)时，则判X来自第h总体。9.聚类，分类。分类：用已

11、知类别的样本训练集来设计分类器聚类（集群）：事先不知样本的类别，而利用样本的先验知识来构造分类器10.线性回归分析的主要内容及应用中注意的问题。回归分析是研究自变量位一般变量，因变量为随机变量时两者之间的相关关系的统计分析方法。设随机变量Y（因变量）与自变量x存在着相关关系，为了研究这种关系，作为一种近似转而去研究Y的数学期望E(y)=u(x)与x的确定关系即函数关系这里u(x)叫Y关于x的回归函数。回归分析分为线性分析和非线性回归。线性回归分为一元线性回归和多元线性回归。一元线性回归是研究u(x)为x的线性函数u(x)=a+bx的情况，一元线性回归模型为：对于一个线性回归步骤：首先，确定一元

12、线性回归模型，线性回归的模型为: ；其次，模型的参数估计，用最小二乘法求出回归模型中的参数，并对线性假设进行检验；再次，线性关系的显著性检验；然后，预测，即Y对x的依赖关系的一个估计。对给定的x值，用回归方程确定Y的值。给定x取值有一个置信度的范围，即置信区间，称为预报区间；最后，解决控制问题。多元线性回归要建立回归模型，然后用最小二乘法解得模型的参数，然后对模型进行分析和运用。实际中的回归函数往往是比较复杂的非线性函数,下面仅对某些可化成线性回归的非线性回归问题作些初步的探讨. 实际中,自变量与因变量之间未必总有线性相关关系,.再某些情况下,可以通过对自变量和因变量的变量代换法把一个非线性相

13、关关系转换成线性的相关关系,然后用线性回归的方法来处理。应注意的问题：实际中Y与很多因素有关，如果将它们都取作自变量必然会导致所有的回归方程很庞大，有些自变量对Y的影响很小，如果将这些自变量剔除，不但可以使回归方程较为简洁，便于应用，且能明确哪些因素的改变对Y有显著的影响，从而使人们对事物有进一步的认识。11.系统聚类法的算法思想及步骤。答：算法思想：（1）首先将每个样品各视为一类，定义类与类之间的距离将距离最短的两类合并为一个新类（2）再计算新类与其它类之间的距离，将距离最短的两类再合并为一个新类。如此下去，直到所有样品全部合并为一个大类为止，最后再根据事先给定的分类临界值，确定分类，一般步

14、骤如下：1）计算样品两两之间的距离；2）将每个样品各作为一类；3）将距离最近的两类合并为一个新类；4）若类的个数等于1，则转步骤5）；否则转步骤3）；5）画聚类图；6）根据给定的分类临界值，确定最终分类结果。12.如何看待多元统计方法在实际数据处理中的作用与地位。答：多元统计分析方法在实际数据处理中有着重要的作用。它不仅可以通过样本观察值对总体进行参数估计和假设检验，还可以通过相应的方法达到数据化简，分类和研究变量间或依赖关系的目的，并能预测变量间关系，提出检验假设等目的。目前在医学、教育学、社会学、地质学、考古学、环境保护等各领域有极其广泛的作用。三、计算及证明题1.设总体X的概率密度为，其中0是未知参数，0是已知常数，为样

展开阅读全文