信息分析与数据挖掘统计

上传人:新** 文档编号:490821657 上传时间:2023-05-28 格式:DOC 页数:7 大小:239KB
返回 下载 相关 举报
信息分析与数据挖掘统计_第1页
第1页 / 共7页
信息分析与数据挖掘统计_第2页
第2页 / 共7页
信息分析与数据挖掘统计_第3页
第3页 / 共7页
信息分析与数据挖掘统计_第4页
第4页 / 共7页
信息分析与数据挖掘统计_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《信息分析与数据挖掘统计》由会员分享,可在线阅读,更多相关《信息分析与数据挖掘统计(7页珍藏版)》请在金锄头文库上搜索。

1、第一节 样本及抽样分布1. 基本概念1-1 总体、个体与样本所研究对象的某项数量指标的值的全体称为总体。总体中的每个元素称为个体。为推断总体性质,从总体中抽取一部分个体进行观察,被抽出的部分个体,称做总体的一个样本。样本的抽取有多种方法,其中采用重复简单随机抽样所得的样本称为简单随机样本,若样本容量为,则可记为,并记为样本观测值或样本值。1-2 总体分布、样本分布、抽样分布总体分布即总体服从的分布,样本分布是指某个给定样本所服从的分布。比如,设一个有限总体为则总体服从如下分布律135若从中抽取一个容量为3的简单随机样本,比如1,3,3,则得到一个样本分布律:13抽样分布是指统计量的分布。所谓统

2、计量,是指样本的一个不含未知参数的函数。比如即为两个最常见的统计量。考察一个容量为2的简单随机样本,样本观测值及对应的样本均值有如下可能性:样本值样本均值样本值样本均值样本值样本均值Aa:111Ca:111Ea:312Ab:111Cb:111Eb:312Ac:111Cc:111Ec:312Ad:132Cd:132Ed:333Ae:132Ce:132Ee:333Af:153Cf:153Ef:354Ba:111Da:312Fa:513Bb:111Db:312Fb:513Bc:111Dc:312Fc:513Bd:132Dd:333Fd:534Be:132De:333Fe:534Bf:153Df:35

3、4Ff:555显然,样本均值服从如下分布:12345 随着样本容量的增加:样本均值接近总体均值的概率增强;概率直方图趋向单峰对称。2. 中心极限定理不论总体服从何种分布,当样本容量趋向无穷时,样本均值分布趋向于一个正态分布。3. 常用抽样分布3-1 卡方分布 A. 卡方分布定义:如果,且相互独立,则。B. 卡方分布性质:非负,有偏性,期望等于其自由度,可加性。 C. 一个抽样分布:设总体,为其一个样本,则 D. 总体方差的无偏估计:。3-2 学生分布 A. 学生分布定义:如果,且与相互独立,则。B. 学生分布性质:概率密度函数关于原点对称;随自由度增加,渐进正态性。 C. 一个抽样分布:如果,

4、为其一个容量为的样本的均值,则3-3 F分布 A. F分布定义:设,且与相互独立,则。B. 一个抽样分布:设,且与分别是来自两个总体的容量各为与的样本之方差,则第二节 参数估计1. 点估计1-1 估计量:用以估计总体未知参数的统计量。1-2 点估计主要内容A. 总体均值估计B. 总体方差估计1-3 点估计基本方法A. 矩估计法B. 最大似然估计法1-4 估计量的评选标准A. 无偏性:用以估计参数的估计量存在期望,且期望值等于。B. 有效性:设与都是参数的无偏估计量,若前者方差小于后者,即,则称较有效。 C一致性:设为参数的估计量,若随着样本容量的增大,即当时,依概率收敛至。2. 区间估计2-1 总体均值的估计量A. Z统计量B. t统计量2-2 上分位点2-3 总体均值的区间估计A. B. C.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号