第四章数据的概括性度量;第六、七章抽样推断与参数估计

上传人:飞*** 文档编号:51648513 上传时间:2018-08-15 格式:PPT 页数:46 大小:1.08MB
返回 下载 相关 举报
第四章数据的概括性度量;第六、七章抽样推断与参数估计_第1页
第1页 / 共46页
第四章数据的概括性度量;第六、七章抽样推断与参数估计_第2页
第2页 / 共46页
第四章数据的概括性度量;第六、七章抽样推断与参数估计_第3页
第3页 / 共46页
第四章数据的概括性度量;第六、七章抽样推断与参数估计_第4页
第4页 / 共46页
第四章数据的概括性度量;第六、七章抽样推断与参数估计_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《第四章数据的概括性度量;第六、七章抽样推断与参数估计》由会员分享,可在线阅读,更多相关《第四章数据的概括性度量;第六、七章抽样推断与参数估计(46页珍藏版)》请在金锄头文库上搜索。

1、应用统计学课程安排第一章 导论第二章 统计数据的搜集与整理第三章 数字的概括性度量(数据的描述性统计分析)第四章 统计量与抽样分布第五章 参数估计第六章 假设检验课程安排第七章 列联分析第八章 方差分析与试验设计第九章 一元线性回归第十章 多元线性回归第十一章 时间序列分析第十二章 指数第四章 数据的概括性度量(数据的描述统计分析)集中趋势离散程度分布的形状数据分布特征众数中位数、分位数平均数异众比率四分位差极差平均差方差、标准差标准分值(z值)离散系数偏态系数峰态系数集中趋势离散程度分布的形状数据分布特征众数中位数、分位数平均数异众比率四分位差极差平均差方差、标准差标准分值(z值)离散系数偏

2、态系数峰态系数SPSS绘制的直方图 茎叶图和箱线图 解读茎叶图l茎叶图既给出数据大 致的分布情况也给出 原始数据的值。l从茎叶图可以看出数 据是否对称、数据集 中情况(众数、中位 数)、数据的离散情 况、是否有一些值远 离其他的数等。l茎叶图不适合于数据 量大的情况SPSS图形:箱线图l箱线图形象的展示连续变量的分布情况l箱线图通过5数反映连续数据分布情况(Me,QL,QU,Max,Min)l如何看箱线图 (1)通过箱线图对连续变量进行描述 (2)发现异常值(离群点) (3)如何应用箱线图对不同类别的数据进行比较 SPSS操作: GraphsBoxplot GraphsInteractive

3、Boxplot描述性统计表3-3 统计 成绩的描述统计 指标NValid35Missing 0Mean(均值值)75.51Median(中位数)78.00Mode(众数)65aStd. Deviation(标标准差)12.615Variance (方差)159.139Skewness(偏态态系数)-.771Std. Error of Skewness.398Kurtosis(峰度系数).816Std. Error of Kurtosis.778Range(极差)59Minimum(最小值值)38Maximum(最大值值)97Sum(合计值计值 )2643 Percentiles(百分位数)25

4、68.0050 78.0075 85.00a Multiple modes exist. The smallest value is shownl在Excel中三个四分位 数的位置分别是 (n+3)/4,(n+1)/2, (3n+1)/4。l在主流教科书中的三 个四分位数的位置分 别是(n+1)/4, (n+1)/2,(3n+3)/4。l我们教材上的公式为 n/4,(n+1)/2,3n/4 。解读茎叶图l茎叶图既给出数据大 致的分布情况也给出 原始数据的值。l从茎叶图可以看出数 据是否对称、数据的 离散情况、是否有一 些值远离其他的数、 数据集中情况等l茎叶图不适合于数据 量大的情况SPSS图

5、形GraphsGraphs菜单菜单 SPSS图形功能概述l两种图形方法 (1)常规方法(Graphs-Bar) (2)交互图(Graphs-Interactive-Bar)l图形的种类SPSS图形:条形图条形图: 用宽度相同的 条形的高低或者长短来 表示各指标数值的大小SPSS操作: GraphsBar GraphsInteractive BarSPSS图形:饼图饼图: 用圆内扇形的面积 来表示数据值的大小。 多用于反映各部分占总体 的构成情况 SPSS操作: GraphsPie GraphsInteractive PieSPSS图形:箱线图l箱线图形象的展示连续变量的分布情况l箱线图通过5数

6、反映连续数据分布情况l如何看箱线图 (1)通过箱线图对连续变量进行描述 (2)发现异常值 (3)如何应用箱线图对不同类别的数据进行比较SPSS操作: GraphsBoxplot GraphsInteractive BoxplotSPSS图形:时序图时序图:在平面坐标上 用折线表示数量变化规 律的统计图。 特点是直观显示事物的 发展趋势SPSS操作: Graphssequence GraphsInteractive sequence 第六、七章 抽样推断与参数估计u一、抽样基本知识u二、抽样分布u三、抽样估计(参数估计)一、抽样基本知识1、概念回顾2、抽样方法3、抽样误差概念 回 顾n统计推断

7、(statistical inference):从数据得到对现实 世界的结论的过程。n抽样推断:从所研究的总体全部元素(单位)中抽取一部 分元素(单位)进行调查,并利用样本统计量对总体某些 性质或数量特征进行推断的过程。n估计 (estimation)和假设检验(hypothesis testing)是 统计推断的重要内容。由样本数据对总体参数进行估 计,即:总体参数 描述总体数量特征的指标。总体是惟一的,所以参数也是惟一的。样本统计量 描述样本数量特征的指标,由样本计算而得。由于样本是随机的,所以样本统计量是随机变量。总体参数样本统计量样本统计量公式总体平均数样本平均数总体成数样本成数总体方

8、差样本方差总体标准差样本标准差NEXT抽 样 方 法u概率抽样(随机抽样):按随机的原则,从总体 抽出样本。每一个总体单位有一定的可能性被抽中 。简单随机抽样:完全随机地抽选样本,使得每一个样 本都有相同的机会(概率)被抽中。对于有限总体的简单随机抽样又可分为重复抽样与 不重复抽样。分层抽样 整群抽样 等距抽样u非概率抽样(非随机抽样):不遵循随机原则, 而是按照人们的主观愿望抽选样本。重点调查 典型调查 配额抽样 方便抽样重复抽样:抽一个容量为 的样本时,每次抽出一个单位进行登记。再放回下总体中继续下次抽选 ,直至抽够个样本点 为止。 特点是:每个总体单位可能被重复抽中;有 个可能的样本 ;

9、每个总体单位被抽中的可能性为 。不重复抽样:抽一个容量为 的样本时,每次抽出一个单位进行登记。不再放回总体 中,继续进行次抽选,直至抽够 个样本点为止。特点是:每个总体单位不可能被重复抽中; 不考虑顺序的情况下,有 个可能的样本 ;每个总体单位被抽中的可能性为1/ 。 NEXT抽 样 误 差l抽样误差抽样调查所得结果与总体真实数值之间差异l登记性误差观察、测量、计算的差错,造假等l代表性误差样本结构与总体结构不一致,样本不能完 全代表总体l系统性误差非随机因素引起样本估计量系统性偏差l随机误差(偶然性误差)遵循随机原则抽样,但仍然 存在样本结构不足以代表总体结构引起的样本估计量与总 体参数之间

10、的代表性误差登记性误差代表性误差抽样误差 系统性误差随机误差另一种粗略分类非抽样误差在统计调查中,由于主客观原因而引起的诸如测量、登录、计算等误差。该误差可以避免。抽样误差在抽样调查中由于抽样的随机性而产生的样本指标对总体指标的代表性误差。样本虽然是总体的缩影,但是还不足以完全代表总体,从而产生了误差。抽样误差是随机抽样固有的,可以 计算并加以控制,但不可以避免。NEXT抽 样 误 差u实际抽样误差某具体样本估计值 与总体参 数 的真实值之间的离差( ) u抽样平均误差 是以 为分布中心的,即所 有可能的样本估计值分布在总体参数周围。常 用样本估计量平均差或标准差表示,反映了所 有可能样本估计

11、值与总体参数的平均差异程度 (即所有可能样本的实际抽样误差的一般水平 )u抽样极限误差一定概率下抽样误差的可能范 围(也称允许误差) 抽样极限误差是一定概率下抽样误差的可能范围(也称允许误差) 。可以表述为不等式 。 表述为在一定概率下可认为样本估计量 与相应的总 体参数 的误差的绝对值不超过 。p抽样极限误差是抽样误差的可能范围,而不是完全肯 定的范围,这一可能范围的大小是与估计的可靠程度 大小密切联系的。若要提高估计的置信度,则会增大 允许误差,从而降低了估计精度;若要缩小允许误差 ,提高估计的精度,则会降低估计的置信度。p两者之间的具体联系可根据样本统计量的抽样分布来 确定。(可参考教材

12、第178页图)二、抽样分布每个随机变量都有其概率分布。样本统计量是随样本不同 而不同的随机变量,其每个可能取值都有一定的概率,从 而形成它的概率分布。抽样分布(sampling distribution):样本统计量的所有可能取值及其取值概率所形成的概率分布。(我们一般主要讨论可 重复的简单随机抽样)某个样本统计量(如均值、比例、方差等)的抽样分布:从理论上说就是在重复选取容量为n的样本时,由每一个样 本计算出的该统计量数值的相对频数分布或概率分布。 对于抽样分布,同样可以计算其均值或标准差等数字特征 来反映该分布的中心和离散趋势。抽样分布 u意义:抽样分布反映样本指标的分布特征,是抽样推断的

13、重要依据。根据样本分布的规律,可以揭示样本指标与总体指标之间的关系,估计抽样误差,并说明抽样推断的可靠程度。u从总体中抽取全部可能样本来构造统计量的抽样分布,只是理论上说明问题的需要,实际上不可行。寻求抽样分布的方法主要有精确方法和大样本方法两种,从而抽样分布就有两类:精确分布和渐进分布。寻求抽样分布的定理v定理:当总体服从正态分布N (,2 )时,来自该总体的 所有容量为n 的样本的均值 也服从正态分布, 的数学 期望为,方差为2/n。即 N(,2 /n)。z中心极限定理:设从均值为,方差为2的一个任意总体 中抽取容量为n 的样本,当n充分大时(一般, 就可 以用中心极限定理了),样本均值的

14、抽样分布近似服从 均值为、方差为2/n的正态分布。即有: 和 。也即有, 。定理设总体服从正态分布 ,从总体中 随机抽取容量为 的样本 。样本平均数 服从正态分布 。 在重复抽样条件下:均值为 ,方差为 。 进而有 ; 在不重复抽样条件下:均值为 ,方差为 NEXT用途:估计总体的均值。NEXT用途:对总体的均值进行推断时,若总体方差未知,这就意味着,统计量 中含有未知的参数,如果我们用样本的修正方差代换总体 的方差,则上式变为:( ) t(n - 1)统计量t 不服从标准正态分布,而服从 t t 分布分布 。在总体方差 未知时,推断总体均值,需考虑 t 统计量。t 分布应用:总体方差未知时推

15、断总体均值t分布应用:两个总体均值之差的分布定理:若 和 是分别来自正 态总体 和 的样本,且相互独立 ,则其中服从自由度 为的 分布。F分布应用:两个总体方差之比的分布定理:设若 和 分别是来自正态总体 和 的样本,且相互独立。样本修正方差分别为 则 服从第一自由度为 和第二自由度为 的F分布。 X2分布应用:样本方差的抽样分布 要用样本方差s2去推断总体的方差2,必须知道样本方差的分布。设总体服从正态分布XN(, 2 ), X1,X2, Xn为来自该正态总体的样本,统计证明比值 的 抽样分布为自由度是(n-1)的 分布,即: 三、抽样估计(参数估计)v抽样估计根据样本提供的信息对总体的某些特征进 行估计或推断。v估计量设设 是总体分布中一个要估计的参数的话,是总体分布中一个要估计的参数的话,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号