体育统计学PPT课件

上传人:公**** 文档编号:569191799 上传时间:2024-07-28 格式:PPT 页数:282 大小:3.56MB
返回 下载 相关 举报
体育统计学PPT课件_第1页
第1页 / 共282页
体育统计学PPT课件_第2页
第2页 / 共282页
体育统计学PPT课件_第3页
第3页 / 共282页
体育统计学PPT课件_第4页
第4页 / 共282页
体育统计学PPT课件_第5页
第5页 / 共282页
点击查看更多>>
资源描述

《体育统计学PPT课件》由会员分享,可在线阅读,更多相关《体育统计学PPT课件(282页珍藏版)》请在金锄头文库上搜索。

1、大学体育统计学大学体育统计学第一章第一章绪论绪论1第一节第一节第一节第一节 体育统计及其研究对象体育统计及其研究对象体育统计及其研究对象体育统计及其研究对象统计的作用统计的作用客观事物的特征客观事物的特征质的特征质的特征质的特征质的特征量的特征量的特征量的特征量的特征统计活动统计活动统计活动统计活动研究2统计的分类(从性质上)统计的分类(从性质上)(一)(一)描述性统计描述性统计 对事物的特征与状态进行数量描述对事物的特征与状态进行数量描述 身高身高=226cm=226cm体重体重=141kg=141kg百米速度百米速度=15s=15s投篮命中率投篮命中率=52%=52% 3(二)(二)推断性

2、统计推断性统计通过样本数量特征估计推断总体特征通过样本数量特征估计推断总体特征总体总体总体总体抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值 X X = 14.6= 14.6秒秒抽样总体平均成绩是14.6秒吗4体育统计的概念体育统计的概念体育统计体育统计体育统计体育统计是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科。属于方法论学科范畴。理解:理解:理解:理解:1:用普遍的方法研究特殊领域的问题。2:无论描述统计还是推断统计,都服务于对随机现象规律性的研究。5统计工作的基本过程统计工作的基本过程统计资料的搜集统计资料的搜集统计资料的搜集统计资料的搜集

3、统计资料的整理统计资料的整理统计资料的整理统计资料的整理统计资料的分析统计资料的分析统计资料的分析统计资料的分析6统计资料的搜集:(基础环节)根据研究设计的要求获取有关数据资料。统计资料的整理:(中间环节)按照分析的要求对数据资料进行审核和分类。统计资料的分析:(决定性阶段)按照研究目的对整理后的数据进行统计学处理。 统计工作的基本过程统计工作的基本过程7体育统计的研究对象及其特征体育统计的研究对象及其特征研究对象:(1)体育领域里的各种可量化的随机现象。(2)非体育领域里对体育发展有关的各种随机现象。研研究究范范围围逐逐渐渐扩扩大大了了!8体育统计研究对象的特征体育统计研究对象的特征运动性特

4、征:反映运动能力心理能力等方面的数量指标是具有 运动性特征的。(1,与运动有关;2,是动态的)综合性特征:兼有自然科学和社会科学的综合属性。客观性特征:数据来源于客观事物本身,是对客观事物的反映。9第二节第二节体育统计在体育活动中的作用体育统计在体育活动中的作用是体育教育科研活动的基础是体育教育科研活动的基础有助于训练工作的科学化有助于训练工作的科学化能帮助研究者制定研究设计能帮助研究者制定研究设计能帮助研究者有效地获取文献资料能帮助研究者有效地获取文献资料10总体与个体总体与个体总体与个体总体与个体1,总体的概念:根据统计研究的具体研究目的而确定的同质对象的全体。2,个体的概念:组成总体的每

5、个基本单位。3,总体的分类:第三节第三节体育统计中的若干基本概念体育统计中的若干基本概念总体总体总体总体现存总体现存总体现存总体现存总体假想总体假想总体假想总体假想总体有限总体有限总体有限总体有限总体无限总体无限总体无限总体无限总体11有限总体:基本研究单位的边界是明晰的,并且基本研究单位的数量是有限的总体。无限总体:基本研究单位的数量是无限多个的总体。12样本样本样本样本1,样本的概念:根据研究需要与可能,从总体中抽取的部 分研究对象所形成的子集为样本。2,样本的分类:随机样本和非随机样本样本样本样本样本随机样本随机样本随机样本随机样本非随机样本非随机样本非随机样本非随机样本采用随机抽样方法

6、获得的样本采用随机抽样方法获得的样本采用随机抽样方法获得的样本采用随机抽样方法获得的样本研究者根据研究需要,制定某些研究者根据研究需要,制定某些研究者根据研究需要,制定某些研究者根据研究需要,制定某些条件获得的带非随机性质的样本条件获得的带非随机性质的样本条件获得的带非随机性质的样本条件获得的带非随机性质的样本13必然事件和随机事件必然事件和随机事件必然事件和随机事件必然事件和随机事件1 1,必然事件:在确定的条件范围内,必然发生,必然事件:在确定的条件范围内,必然发生 (或不发生)的事件。(或不发生)的事件。 (具备可预言性)(具备可预言性)2 2,随机事件:在一定的实验条件下,有可能发生,

7、也,随机事件:在一定的实验条件下,有可能发生,也有可能不发生的事件。有可能不发生的事件。(具备不可预言性,只能猜)(具备不可预言性,只能猜)随机变量随机变量随机变量随机变量1 1,随机变量:随机事件的数量表现。,随机变量:随机事件的数量表现。随机变量随机变量随机变量随机变量连续型随机变量连续型随机变量连续型随机变量连续型随机变量离散型随机变量离散型随机变量离散型随机变量离散型随机变量至少理论上至少理论上可以穷举可以穷举不能穷举14总体参数和样本统计量总体参数和样本统计量1 1,总体参数:反映总体数量特征的指标。,总体参数:反映总体数量特征的指标。2 2,样本统计量:反映样本数量特征的指标。,样

8、本统计量:反映样本数量特征的指标。概率概率概率概率1 1,古典概率:适用于总体明晰的情况下。,古典概率:适用于总体明晰的情况下。2 2:统计概率:适用于总体状况不明的情况下。:统计概率:适用于总体状况不明的情况下。15补充内容:补充内容:连加和的缩写式连加和的缩写式 在高等数学中,采用连加求和缩写式形式来表示连加求和数,它的一般形式为: 其中:连加求和号 变量(一组观测数据)在 中, i 是下标,n 是上标 , i 、n 表示连加求和的界限,即从通项公式具体分解的第一项开始相加一直到第n项为止。各具体项根据 i 的取值不同而有所不同,i 取1为第一项,取“n”为第n项。16体育中常用的连加求和

9、运算: 为了避免符号过于复杂,今后凡在求和范围可以看清的为了避免符号过于复杂,今后凡在求和范围可以看清的条件下,通常将条件下,通常将号上下标省略不写,简记为号上下标省略不写,简记为 补充内容:连加和的缩写式17课堂练习:展开连加和缩写式课堂练习:展开连加和缩写式18体育统计学体育统计学第二章第二章统计资料的收集与整理统计资料的收集与整理19 收集资料的基本要求收集资料的基本要求1:资料的准确性 2:资料的齐同性 3:资料的随机性 收集资料的基本方法收集资料的基本方法1:日常积累 2:全面普查 3:专题研究第一节第一节第一节第一节 统计资料的收集统计资料的收集统计资料的收集统计资料的收集20几种

10、常用的抽样方法几种常用的抽样方法简单随机抽样(完全随机抽样)简单随机抽样(完全随机抽样)抽取特点:1:不分组,不分类,不排队地抽取; 2:总体中每个个体都有被抽中的机会; 3:总体中每个个体被抽中的机会是均等的。抽取方法:1:抽签法 2:随机数表法(见随机数表)该方法的优点:样本代表性好该方法的缺点:总体含量大时,编号困难。工作量大。21几种常用的抽样方法几种常用的抽样方法分层抽样分层抽样分层抽样分层抽样抽取步骤方法:1:按属性特征分成若干类型、部分或层;2:在类型、部分或层中按照比例进行简单随机抽样。分层的需注意的问题:1:层间必须有清晰的界面;(类间差异大,类内差异小)2:必须知道各类型中

11、的个体数目和比例;3:层的数目不宜太多,但也不要极少。分层抽样的优点:1:能够提高样本代表性,又不至于给调查工作带来麻烦,在代表性和工作量之间做出了平衡;2:适用于总体情况复杂、个体数目较多的情况。22分层抽样范例分层抽样范例某大学体育系大一新生总体人数合计900人田径350人篮球200人足球150人网球100人体操80人游泳20人分层田径35人篮球20人足球15人网球10人体操8人游泳2人按照10%比例简单随机抽样研究样本含量为90人按照学生专按照学生专项属性分层项属性分层继续下一步继续下一步继续下一步继续下一步的研究过程的研究过程的研究过程的研究过程23几种常用的抽样方法几种常用的抽样方法

12、整群抽样整群抽样整群抽样整群抽样整群抽样的特点:区别于简单随机抽样和分层抽样,抽样的单位不再是总体中的个体,是总体中的划分出来的群。划分群应注意的问题: 群间差异要小,群内差异要大。讨论: 调查广东省初中毕业生体质达标的情况。如何抽样?24第二节第二节统计资料的整理统计资料的整理 资料的审核资料的审核1:初审简单排误2:逻辑检查专业知识、常识,指标关系间排误3:复核按比例抽样复核25频数整理频数整理频数分布表的制作频数分布表的制作26频数分布表的编制频数分布表的编制(实例)(实例)【 例例例例 】 某某某某 小小小小学学学学 五五五五 年年年年 级级级级 学学学学生生生生 跳跳跳跳 绳绳绳绳

13、成成成成 绩绩绩绩如如如如下下下下(单单单单位位位位:个个个个/ /分分分分钟钟钟钟)。对对对对 数数数数 据据据据 进进进进 行行行行分组。分组。分组。分组。 117122124129139107117130122125117122124129139107117130122125108131125117122133126122118108108131125117122133126122118108110118123126133134127123118112110118123126133134127123118112112134127123119113120123127135112134127

14、12311911312012312713513711412012812411513912812412113711412012812411513912812412127分组方法分组方法28单变量值分组单变量值分组1. 将一个变量值作为一组2. 适合于离散变量3. 适合于变量值较少的情况29单变量值分组表单变量值分组表30组距分组组距分组将变量值的一个区间作为一组适合于连续变量适合于变量值较多的情况必须遵循“不重不漏”的原则可采用等距分组,也可采用不等距分组31组距分组的步骤(等距分组)组距分组的步骤(等距分组)1.1.求全距(极差)求全距(极差)R R:R R R R最大值最小值最大值最小值最大

15、值最小值最大值最小值2.2.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。在在实实际际分分组组时时,可可以以按按 Sturges Sturges 提提出出的的经经验验公公式式来来确确定定组组数数K K3.3.确确确确定定定定组组组组距距距距I I I I:组组组组距距距距(Class(ClassWidth)Width)是是是是一一一一个个个个组组组组的的的的上上上上限限限限与与与与下下下下限限限限之之之之差差差差,可可可可根根根根据据据据全全全全部部部部数数数数据据据据的的的的最最最最大大大大值值值值和和和和最最最最小小小小

16、值值值值及及及及所所所所分分分分的的的的组组组组数数数数来来来来确确确确定定定定,即即即即:组距组距组距组距( (最大值最大值最大值最大值最小值)最小值)最小值)最小值)组数组数组数组数 (k k)4.4.确确确确定定定定组组组组限限限限 (组组组组限限限限:是是是是指指指指每每每每组组组组的的的的起起起起点点点点值值值值与与与与终终终终点值)点值)点值)点值)325.5.根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表根据分组整理成频数分布表 填填填填写写写写组组组组限限限限 按按按按照照照照从从从从上上上上到到到到下下下下、从从从从小小小小到到到到大大大大的的的的顺

17、顺顺顺序序序序填写,只写下限,不写上限填写,只写下限,不写上限填写,只写下限,不写上限填写,只写下限,不写上限 划划划划记记记记 将将将将数数数数据据据据逐逐逐逐个个个个划划划划记记记记到到到到相相相相应应应应的的的的组组组组中中中中,五五五五个个个个为一组为一组为一组为一组 计算:频数(计算:频数(计算:频数(计算:频数(f f);频率;组中值);频率;组中值);频率;组中值);频率;组中值( 组中值该组下限组中值该组下限组中值该组下限组中值该组下限 组距组距组距组距22)33组距分组涉及的几个概念组距分组涉及的几个概念1.下下限:限:一个组的最小值一个组的最小值2.上上限:限:一个组的最大

18、值一个组的最大值3.组组距:距:上限与下限之差上限与下限之差4.组中值:组中值:下限与上限之间的中点值下限与上限之间的中点值34课课课课堂堂堂堂练练练练习习习习1171221241291391071171301221251171221241291391071171301221251081311251171221331261221181081081311251171221331261221181081101181231261331341271231181121101181231261331341271231181121121341271231191131201231271351121341271

19、23119113120123127135137114120128124115139128124121137114120128124115139128124121【 例例例例 】 某某某某 小小小小学学学学 五五五五 年年年年 级级级级 学学学学生生生生 跳跳跳跳 绳绳绳绳 成成成成 绩绩绩绩如如如如下下下下(单单单单位位位位:个个个个/ /分分分分钟钟钟钟)。对对对对 数数数数 据据据据 进进进进 行行行行分组。分组。分组。分组。 1.求全距(极差)求全距(极差)R:RR最大值(最大值(最大值(最大值(XmaxXmax) 139139最小值(最小值(最小值(最小值(XminXmin) 1071

20、0732322. 2.确定组数确定组数:3.确定组距:确定组距:组距组距组距组距( (最大值最大值最大值最大值139-139-最小值最小值最小值最小值107107)组数组数组数组数7 7551+1.70/0.306.6677354.确定组限:确定组限:第一组下限(第一组下限(第一组下限(第一组下限(L L L L1 1 1 1)最小值()最小值()最小值()最小值(X X X Xminminminmin) 组距(组距(组距(组距(I I I I)/2/2/2/2 107 107 107 107 5 /2 5 /2 5 /2 5 /2 104.5105104.5105104.5105104.51

21、05 其他组组限的确定:其他组组限的确定:其他组组限的确定:其他组组限的确定:从第一组开始,每一组的下限从第一组开始,每一组的下限从第一组开始,每一组的下限从第一组开始,每一组的下限加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组加上组距,就得到该组的上限,此上限又是下一组的下限,于是就形成了一列的下限,于是就形成了一列的下限,于是就形成了一列的下限,于是就形成了一列左闭右开的半开区间左闭右开的半开区间左闭右开的半开区间左闭右开的半开区间5.根据分组整理成频数分布表:根据分组整理成频数分布表:根据分组整理成频数

22、分布表:根据分组整理成频数分布表:(略,参照书(略,参照书(略,参照书(略,参照书P P P P17171717-P-P-P-P18181818)36需要说明的几个问题需要说明的几个问题关于组数的确定:关于组数的确定:关于组数的确定:关于组数的确定: 1 1:可以依据已有的成熟的:可以依据已有的成熟的专业经验来确定;专业经验来确定; 2 2:可参考前苏联专家制定:可参考前苏联专家制定的参考表(如右表)确定:的参考表(如右表)确定: 关于图形的绘制:关于图形的绘制:关于图形的绘制:关于图形的绘制:可以绘制直观的图形来方可以绘制直观的图形来方便了解数据的信息。便了解数据的信息。较常使用的图形形式有

23、多较常使用的图形形式有多边形图和直方图等。边形图和直方图等。图形中,一般图形中,一般横坐标横坐标代表代表组限组限,纵坐标纵坐标代表代表频数频数。37作业作业1.1.每人准备一本固定的作业本。每人准备一本固定的作业本。每人准备一本固定的作业本。每人准备一本固定的作业本。2.2.教材教材教材教材P P1919第二章习题第第二章习题第第二章习题第第二章习题第4 4题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。题,按照步骤与格式制作频数分布表及其直方图。38体育统计学体育统计学第三章第三章样本特征数样本特征数39第一

24、节第一节 集中位置量数集中位置量数集中趋势集中趋势集中趋势集中趋势 ( (位置位置位置位置) )离中趋势离中趋势离中趋势离中趋势 ( (分散程度分散程度分散程度分散程度) )偏态和峰度偏态和峰度偏态和峰度偏态和峰度(形状)(形状)(形状)(形状)40数据的分布特征及其测量指标数据的分布特征及其测量指标数据特征及其测量指标数据特征及其测量指标分布状况分布状况集中趋势集中趋势离散程度离散程度方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差平均差平均差平均差平均差平均差平均差峰峰峰峰峰峰度度度度度度绝对差绝对差绝对差绝对差绝对差绝对差全距全距全距全距全距全距偏偏偏偏偏偏态态态

25、态态态几何平均数几何平均数几何平均数几何平均数几何平均数几何平均数众数众数众数众数众数众数中位数中位数中位数中位数中位数中位数算术平均数算术平均数算术平均数算术平均数算术平均数算术平均数41集中趋势集中趋势(Centraltendency)1. 1.一组数据向其中心值靠拢的倾向和程度一组数据向其中心值靠拢的倾向和程度2. 2.测度集中趋势就是寻找数据一般水平的代表值或测度集中趋势就是寻找数据一般水平的代表值或中心值中心值3. 3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4. 4.低层次数据的集中趋势指标值适用于高层次的测低层次数据的集中趋势指标值适用于高层次的测

26、量数据,反过来,高层次数据的集中趋势指标值量数据,反过来,高层次数据的集中趋势指标值并不适用于低层次的测量数据并不适用于低层次的测量数据5. 5.选用哪一个测度值来反映数据的集中趋势,要根选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定据所掌握的数据的类型来确定42中位数中位数(Median)中位数,又称中数,中点数。中位数,又称中数,中点数。 符号符号Md (Median)Md (Median),定义:是指位于一组数据中较大一半与定义:是指位于一组数据中较大一半与较小一半中间位置的那个数。较小一半中间位置的那个数。Md50%50%43中中位位数数(Median)特征:此数

27、可能是数据中的某一个,也可能根本特征:此数可能是数据中的某一个,也可能根本不是原有的数据。不受极端值的影响不是原有的数据。不受极端值的影响计算方法:将数据依大小次序排列,若数据个数计算方法:将数据依大小次序排列,若数据个数为奇数,则取数列中间的那个数为中数;若数据为奇数,则取数列中间的那个数为中数;若数据个数为偶数,则取中间两个数的平均数为中数。个数为偶数,则取中间两个数的平均数为中数。44概念:样本观测值在频数分布表中频数最多的那一组概念:样本观测值在频数分布表中频数最多的那一组的组中值。的组中值。( (分组数据的众数,属于引申概念)分组数据的众数,属于引申概念)原始概念:众数,符号原始概念

28、:众数,符号MoMo,它指在一组数中出现次数,它指在一组数中出现次数最多的那个数。计算方法是直接找到出现次数最多的最多的那个数。计算方法是直接找到出现次数最多的那个数。那个数。众数具有不唯一性。例如:众数具有不唯一性。例如:众数众数(Mode)无众数无众数无众数无众数原始数据原始数据原始数据原始数据: 10 5 9 12 6 8: 10 5 9 12 6 8: 10 5 9 12 6 8: 10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据原始数据原始数据: 6 5 9 8 5 5: 6 5 9 8 5 5: 6 5 9 8 5 5: 6 5 9 8 5 5多于一个众数

29、多于一个众数多于一个众数多于一个众数原始数据原始数据原始数据原始数据: 25 28 28 36 42 42: 25 28 28 36 42 42: 25 28 28 36 42 42: 25 28 28 36 42 4245分组数据中众数的计算分组数据中众数的计算频数最多的那一组的组中值。频数最多的那一组的组中值。如书如书P21-P22:P21-P22:练习:找找众数,利用上次所做的作业。练习:找找众数,利用上次所做的作业。46几何平均数几何平均数概念:样本观测值的连乘积,并以样本观测值概念:样本观测值的连乘积,并以样本观测值的总数作为次数,开方所得的数据。的总数作为次数,开方所得的数据。主要

30、适用于一组数据中有少量数据偏大或偏小,主要适用于一组数据中有少量数据偏大或偏小,数据分布呈偏态。数据分布呈偏态。计算公式:计算公式:举例说明:举例说明:1 1,2 2,3 3,4 4,8 8,1616,4242,108108见教材见教材P22,P22,例题例题3.43.447算术平均数算术平均数算术平均数简称为平均数或均值,符号为算术平均数简称为平均数或均值,符号为M M(MeanMean)总体算术平均数:希腊字母总体算术平均数:希腊字母 ( (音:音:miu)miu)样本算术平均数:英文字母样本算术平均数:英文字母 ( (音:音:X bar)X bar)。算术平均数是由所有数据之和除以数据个

31、数所得的算术平均数是由所有数据之和除以数据个数所得的商数,用公式表示为:商数,用公式表示为:48算术平均数在应用上有如下特点算术平均数在应用上有如下特点:算术平均数是一个良好的集中量数,具有反应灵敏、确定严密、简明易解、计算简单、适合进一步演算和较小受抽样变化的影响等优点。算术平均数易受极端数据的影响,这是因为平均数反应灵敏,每个数据的或大或小的变化都会影响到最终结果。49第二节:离中趋势量数第二节:离中趋势量数1. 1.数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征数据分布的另一个重要特征2. 2.离中趋势的各指标值是对数据离散程度所作的描述离中趋势的各指标值是对数

32、据离散程度所作的描述离中趋势的各指标值是对数据离散程度所作的描述离中趋势的各指标值是对数据离散程度所作的描述3. 3.反反反反映映映映各各各各变变变变量量量量值值值值远远远远离离离离其其其其中中中中心心心心值值值值的的的的程程程程度度度度,因因因因此此此此也也也也称称称称为为为为离离离离中趋势中趋势中趋势中趋势4. 4.从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值的代表程度5. 5.不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程

33、度测度值不同类型的数据有不同的离散程度测度值50 全全距距(极极差差,两两极极差差)概念:一组数据最大值与最小值之差。公式: R R最最最最大大大大值值值值(X Xmma ax x) 最最最最小小小小值值值值(X Xmmi in n)特征与缺陷:1:能够了解数据的范围(区域,区间)。2:只考虑极值,容易受到异常数据的影响,属于粗略的指标值,精细程度不够。51绝绝对对差差与与平平均均差差绝对差:平均差;52方方差差和和标标准准差差1 1:是离散程度的测量指标值之一,最常用。:是离散程度的测量指标值之一,最常用。2 2:能反映数据的分布。:能反映数据的分布。3 3:能反映各变量值与均值的平均差异。

34、:能反映各变量值与均值的平均差异。4 4:根据总体数据计算的,称为总体方差或标准差;:根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差。根据样本数据计算的,称为样本方差或标准差。4 6 8 10 124 6 8 10 12X = X = 8.38.353总总体体方方差差和和标标准准差差的的计计算算公公式式总体方差的计算公式总体方差的计算公式总体方差的计算公式总体方差的计算公式总体标准差的计算公式总体标准差的计算公式总体标准差的计算公式总体标准差的计算公式54样样本本方方差差和和标标准准差差样本方差的计算公式样本方差的计算公式样本方差的计算公式样本方差的计算公式

35、样本标准差的计算公式样本标准差的计算公式样本标准差的计算公式样本标准差的计算公式55自由度自由度(degree of freedom)(degree of freedom)1.一组数据中可以自由取值的数据的个数一组数据中可以自由取值的数据的个数2.当当样样本本数数据据的的个个数数为为n 时时,若若样样本本均均值值 x 确确定定后后,只只有有n-1个个数数据据可可以以自自由由取取值值,其其中中必必有有一一个个数数据据则则不能自由取值不能自由取值3.例例如如,样样本本有有3个个数数值值,即即x1=2,x2=4,x3=9,则则 x =5。当当 x=5确确定定后后,x1,x2和和x3有有两两个个数数据

36、据可可以以自自由由取取值值,另另一一个个则则不不能能自自由由取取值值,比比如如x1=6,x2=7,那么,那么x3则必然取则必然取2,而不能取其他值,而不能取其他值4.样样本本方方差差用用自自由由度度去去除除,其其原原因因可可从从多多方方面面来来解解释释,从从实实际际应应用用角角度度看看,在在抽抽样样估估计计中中,当当用用样样本本方方差差去估计总体方差去估计总体方差2时,它是时,它是2的无偏估计量的无偏估计量56 平均数与标准差在体育中的应用平均数与标准差在体育中的应用平均数与标准差在决策中的直接应用。平均数与标准差在决策中的直接应用。变异系数在稳定性研究中的应用。变异系数在稳定性研究中的应用。

37、 法在原始数据逻辑审核中的应用。法在原始数据逻辑审核中的应用。57 平平均均数数与与标标准准差差在在决决策策中中的的直直接接应应用用例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加例题:教练员要从两名标枪运动员中决定一人参加比赛,如何作出决策?比赛,如何作出决策?比赛,如何作出决策?比赛,如何作出决策?队员甲:队员甲:40.50;41.26;40.44;39.62;40.1242.10;39.84;40.18;38.70;39.54队员乙:队员乙:40.48;42.88;40.50;39.50;38.00;43

38、.32;38.72;41.82;36.84;40.24简单应用平局数与标准差进行数据决策的步骤:简单应用平局数与标准差进行数据决策的步骤:1:确定样本数据的全域。:确定样本数据的全域。2:确定样本数据的平均水平。:确定样本数据的平均水平。3:确定样本数据的离散程度。:确定样本数据的离散程度。4:根据专业专项应用要求采取相应不同决策。:根据专业专项应用要求采取相应不同决策。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。注意:决策前提是认同所取得的数据是真实客观有效的。58 变变异异系系数数在在

39、稳稳定定性性研研究究中中的的应应用用 例题:某运动员主项为例题:某运动员主项为例题:某运动员主项为例题:某运动员主项为100m100m跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,跑,兼项为跳远,在竞技期内,其主、兼项目测试结果如下:其主、兼项目测试结果如下:其主、兼项目测试结果如下:其主、兼项目测试结果如下:100m100m:ssss跳远:跳远:跳远:跳远:mmmm试比较该运动员主项、兼项成绩的稳定性。试比较该运动员主项、兼项成绩的稳定性。试比较该运动员主项、兼项成绩的稳定性。试比较该运动员主项、兼项成绩的稳定性。 (试比较该运动员(试比较该运动员(试比

40、较该运动员(试比较该运动员100m100m跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)跑、跳远两成绩的离散程度。)解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。解答:二者的指标单位不同且性质不同,不能够直接进行比较。依据变异系数的概念特征,可以计算依据变异系数的概念特征,可以计算依据变异系数的概念特征,可以计算依据变异系数的概念特征,可以计算CVCV进行比较:进行比较:进行比较:进行比较:由于该运动员由于该运动员由于该运动员由于该运动

41、员100m100m跑的跑的跑的跑的CVCV 跳远的跳远的跳远的跳远的CVCV,故该运动员的,故该运动员的,故该运动员的,故该运动员的100m100m跑跑跑跑的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。的成绩比跳远成绩稳定。(或说(或说(或说(或说100m100m跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)跑成绩的离散程度小于跳远成绩)59 例题:随机抽取某市例题:随机抽取某市例题:随机抽取某市例题:随机抽取某市300300名初中男生的身高,经检验基名初中男生的身高,经检验基名初中男生的身高,经检验基名初中男生的身高,经检验基本

42、服从正态分布,并得出本服从正态分布,并得出本服从正态分布,并得出本服从正态分布,并得出cmcm,cmcm,在这在这在这在这300300名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为名学生中,有三人的身高原始数据为cmcm,cmcm,cmcm。试用。试用。试用。试用法检查法检查法检查法检查这三个数据是否为可疑数据。这三个数据是否为可疑数据。这三个数据是否为可疑数据。这三个数据是否为可疑数据。 法进行原始数据逻辑审核的步骤:法进行原始数据逻辑审核的步骤:法进行原始数据逻辑审核的步骤:法进行原始数据逻辑审核的步骤:1 1:求:求:求:求的下限和上限。

43、的下限和上限。的下限和上限。的下限和上限。2 2:数据检验,看数据是否存在:数据检验,看数据是否存在:数据检验,看数据是否存在:数据检验,看数据是否存在 下限,上限下限,上限下限,上限下限,上限 区间之内。区间之内。区间之内。区间之内。3 3:作出初步判定:作出初步判定:作出初步判定:作出初步判定aa:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;:在区间之内,可以初步认定数据正常;bb:在区间之外,需要进一步审核数据的准确性。:在区间之外,需要进一步审核数据的准确性。:在区间之外,需要进一步审核数据的准确性。:在区间之外,需要进一步

44、审核数据的准确性。法在原始数据逻辑审核中的应用法在原始数据逻辑审核中的应用60作业作业1.1.计算教材计算教材计算教材计算教材P P1919第二章习题第第二章习题第第二章习题第第二章习题第4 4题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。题中样本数据的所有集中量数指标和离散量数指标。2.2.教材教材教材教材P P3939第三章习题第第三章习题第第三章习题第第三章习题第2 2题。题。题。题。3.3.自习教材第三章与第四章未讲到的内容。自习教材第三章与第四章未讲到的内容。自习教材第三章与第四章未讲到的内容

45、。自习教材第三章与第四章未讲到的内容。61体育统计学体育统计学第五章第五章 正态分布正态分布62 正态分布的概念与性质正态分布的概念与性质100100个样本数据的频率分布直方图个样本数据的频率分布直方图63200200个样本数据的频率分布直方图个样本数据的频率分布直方图64总体密度曲线总体密度曲线无穷多个样本数据的频率分布直方图无穷多个样本数据的频率分布直方图6566正态分布的重要性正态分布的重要性1.1.描述连续型随机变量的最重要的分布描述连续型随机变量的最重要的分布2.2.可用于近似连续型的离散变量的分布可用于近似连续型的离散变量的分布3.3.经典统计推断的基础经典统计推断的基础x xf

46、f ( (x x) )67概率密度函数概率密度函数f(x):随机变量:随机变量X 的频数的频数 :总体方差:总体方差 =3.14159;e=2.71828x =随机变量的取值随机变量的取值(- x02.正态曲线的最高点在均值,它也是分布的中位数和众数3.正态分布是一簇分布,每一特定正态分布通过均值和标准差来区分。决定曲线的位置,称为位位位位置置置置参参参参数数数数;决定曲线的形状,称为形状参数形状参数形状参数形状参数。4.曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交5.正态曲线下的总面积等于1,即概率值等于16.随机变量的概率由曲线下的面积给出69 和和 对对

47、正态曲线的影响正态曲线的影响xf(x)CAB70正正态态分分布布的的概概率率概率是曲线下的概率是曲线下的概率是曲线下的概率是曲线下的面积面积面积面积 !a ab bx xf f( (x x) )71标准正态分布标准正态分布 任何一个一般的正态分布,可通过下面的线性变换任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布转化为标准正态分布 标准正态分布的概率密度函数标准正态分布的概率密度函数标准正态分布的概率密度函数标准正态分布的概率密度函数72x 一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布一般正态分布 u标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标

48、准正态分布 标准正态分布标准正态分布73标准正态分布的重要性标准正态分布的重要性一般正态分布的不同取决于均值一般正态分布的不同取决于均值 和标准差和标准差 计算概率时计算概率时 ,每一个一般正态分布都需要有自己的,每一个一般正态分布都需要有自己的正态概率分布表,这种表格是无穷多的。正态概率分布表,这种表格是无穷多的。若能将一般正态分布转化为标准正态分布,计算概率若能将一般正态分布转化为标准正态分布,计算概率时就只需查一张表(标准正态分布表)就可以了。时就只需查一张表(标准正态分布表)就可以了。741.1.先将一个先将一个一般一般正态分布转换为正态分布转换为标准标准正态分布正态分布2.2.计算概

49、率时计算概率时,查标准正态概率分布表,查标准正态概率分布表3.3.对于负的对于负的 x x ,可由,可由 (-(-x x) )- - x x 得到得到4.4.对于标准正态分布,即对于标准正态分布,即X X N N(0,1(0,12 2) ),有,有P P ( (a a X X b b) ) b b a a P P (|X| (|X| a a) ) 2 2 a a 1 15.5.对于对于一般一般正态分布,即正态分布,即X X N N( ( , , 2 2) ),有,有标准正态分布表的使用标准正态分布表的使用75 标标准准化化的的例例子子A A(5 5,1 10 02 2)x 55 一般正态分布一

50、般正态分布一般正态分布一般正态分布一般正态分布一般正态分布6.2 u标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布 0.12.0478.0478.0478P P(5(5 X X 6.2)6.2)76 标标准准化化的的例例子子B B(5 5,1 10 02 2)一般正态分布一般正态分布一般正态分布一般正态分布.1664.1664.1664.0832.0832.0832.0832标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布标准正态分布P P(2.9(2.9 X X 7.1)7.1)77正正态态分分布布(实实例例)【例例例例】设设U U N N(0(0,1

51、12 2) ),求以下概率值:,求以下概率值: (1)(1)P P( (U U1.5)2)2); (3)(3)P P(-1(-1U U 3)3) ; (4)(4)P P(|(|U U| | 2)2)解解解解:(1)(1)P P( (U U1.5)=2)=1-2)=1-P P( (U U 2)=1-0.9973=0.02272)=1-0.9973=0.0227(3)(3)P P(-1(-1U U 3)=3)=P P( (U U 3)-3)-P P( (U U-1)-1)=(3)-(3)-(-1)=(-1)=(3)1-(3)1-(1)(1)=0.9987-(1-0.8413)=0.8354=0.9

52、987-(1-0.8413)=0.8354(4)(4)P P(|(|U U| | 2)=2)=P P(-2(-2 U U 2)=2)=(2)-(2)-(-2)(-2)=(2)-1-(2)-1-(2)=2(2)=2(2)-1=0.9545(2)-1=0.954578 正正态态分分布布(实实例例)【例例例例】设设X X N N(5(5,3 32 2) ),求以下概率值,求以下概率值(1)(1)P P( (X X 10)10); (2)(2)P P(2(2X X 1010) )解解解解: (1)(1)(2)(2)79正正态态分分布布(实实例例)【例】【例】【例】【例】设设XN(1,4),求),求P

53、(0X1.6)解:解:XN(1,4)XN(1,22)故,故, = 1, = 1, = 2 = 2 P P (0X1.6)80正态分布理论在体育中的应用正态分布理论在体育中的应用主要应用方面:制定考核标准制定离差评价表进行人数估算在综合评价中统一 变量单位81应应用用正正态态分分布布理理论论制制定定考考核核标标准准制制制制定定定定考考考考核核核核标标标标准准准准的的的的步步步步骤骤骤骤:1:制作正态曲线的分布草图。2:计算出从 到 ui值所围成的面积概率。3:查表求得各等级的ui值。4:求得各等级标准的原始成绩xi值。举举举举例例例例说说说说明明明明(如如如如书书书书本本本本例例例例5 5. .

54、1 1)82应应用用正正态态分分布布理理论论制制定定离离差差评评价价表表制定离差评价表的步骤:制定离差评价表的步骤:制定离差评价表的步骤:制定离差评价表的步骤:1:根据指标总数画好框表。2:将各个指标的平均数填入0标准差等级线与各个指标纵线的交叉处。3:计算1标准差,2标准差,3标准差的对应指标数值,并填入各级标准差等级线与各个指标纵线的交叉处。特别要注意计量的方向性(如:田径中田赛与径赛的计分区别)特别要注意计量的方向性(如:田径中田赛与径赛的计分区别)。4:依据指标成绩基础值和指标变化值画出不同时期的变化图线。5:注意离差等级的划分标准合理制定。(参考标准有两种)(参考标准有两种)举例说明

55、(如书本例举例说明(如书本例举例说明(如书本例举例说明(如书本例5.25.2)83应应用用正正态态分分布布理理论论进进行行人人数数估估算算应用正态分布理论进行人数估算的步骤应用正态分布理论进行人数估算的步骤应用正态分布理论进行人数估算的步骤应用正态分布理论进行人数估算的步骤:1:作正态分布曲线的草图,以确定估计范围。2:求各个区间的ui 值。3:查表找到所估计范围的面积概率。4:计算估计范围的人数。举例说明(如书本例举例说明(如书本例举例说明(如书本例举例说明(如书本例5.35.3)84在在综综合合评评价价中中统统一一变变量量单单位位 U U分法:分法:分法:分法:就是依据距离平均数有多少个标

56、准差的距离来确定分数的方法。如果距离平均数在正方向有2个标准差的距离,则记为U分分为2分。在负方向有2个标准差距离,则记为U分分为-2分。直接用u值来评分。 Z Z分法:分法:分法:分法:是通过U分转换成更加符合实际运用情况的分数计量方法。可以转换为百分计分法,公式为: 累计计分法累计计分法累计计分法累计计分法:用于符合正态分布的前提下不等距升分不等距升分的方法之一。其公式为: 百分位数法:百分位数法:百分位数法:百分位数法:用于不符合正态分布不符合正态分布的条件下使用变换分数的变量标准化法。其公式见教材P99(5.15)。85作业作业1.P491.P49第三章课后习题第第三章课后习题第第三章

57、课后习题第第三章课后习题第7 7 7 7题。题。题。题。2.P992.P99第五章课后习题第第五章课后习题第第五章课后习题第第五章课后习题第2 2 2 2题。题。题。题。3.P1003.P100第五章课后习题第第五章课后习题第第五章课后习题第第五章课后习题第3 3 3 3题。题。题。题。4.P1004.P100第五章课后习题第第五章课后习题第第五章课后习题第第五章课后习题第5 5 5 5题。题。题。题。86体育统计学体育统计学第六章第六章 统计推断统计推断 (假设检验)(假设检验)87关于误差的说明关于误差的说明1 1:随机误差:随机误差偶然因素造成,不可避免,无法消除偶然因素造成,不可避免,

58、无法消除2 2:系统误差:系统误差实验条件和研究方法造成的,可以改善实验条件和研究方法造成的,可以改善3 3:抽样误差:抽样误差抽出的样本统计量之间或样本统计量与总体参数抽出的样本统计量之间或样本统计量与总体参数之间的偏差,主要由于个体间差异造成的,样本含量之间的偏差,主要由于个体间差异造成的,样本含量增大时,抽样误差会有减少的趋势增大时,抽样误差会有减少的趋势4 4:人为误差(过失错误):人为误差(过失错误)人为过失错误造成的统计数据的失真性。人为过失错误造成的统计数据的失真性。统计处理中最关心的是系统误差和抽样误差。统计处理中最关心的是系统误差和抽样误差。第第一一节节 参参数数估估计计88

59、第第一一节节 参参数数估估计计关于关于“标准误标准误”的概念的概念表示样本均数(或样本率)与总体均数表示样本均数(或样本率)与总体均数(或总体率)之间偏差程度的标准差。(或总体率)之间偏差程度的标准差。均数标准误的计算公式:均数标准误的计算公式:89第第一一节节 参参数数估估计计均数标准误的计算公式:均数标准误的计算公式:90第第一一节节 参参数数估估计计点估计与区间估计点估计与区间估计点点估估计计选定适当的样本统计量作为参数的估计量。选定适当的样本统计量作为参数的估计量。区间估计区间估计以变量的概率分布规律来确定未知参数以变量的概率分布规律来确定未知参数值的可能范围。值的可能范围。置信概率置

60、信概率在区间估计中,预选规定的概率。在区间估计中,预选规定的概率。置信区间置信区间在区间估计中,按照预选规定的概率确在区间估计中,按照预选规定的概率确定下来的区间范围。定下来的区间范围。91置置信信区区间间的的计计算算一:总体均数的置信区间一:总体均数的置信区间1:大样本含量(:大样本含量(n45),可以认定符合正态分),可以认定符合正态分布,根据正态分布原理,用布,根据正态分布原理,用u分计算。分计算。2:小样本含量(:小样本含量(n45),不符合正态分布,只),不符合正态分布,只能根据能根据t分布原理,用分布原理,用t分计算。分计算。二:总体率的置信区间二:总体率的置信区间样本含量必须足够

61、大(如:样本含量必须足够大(如:n100)p的抽样分布逼近正态分布,用的抽样分布逼近正态分布,用u分计算。分计算。计算公式:教材计算公式:教材P108-109.92假设检验的基本思想及步骤假设检验的基本思想及步骤假设检验的基本思想及步骤假设检验的基本思想及步骤 主要学习目标主要学习目标主要学习目标主要学习目标 :假设检验的基本知识假设检验的基本知识u 检验检验t 检验检验卡方检验(不讲)卡方检验(不讲)93什么是假设?什么是假设?假设是假设是对总体参数的一种看法对总体参数的一种看法总体参数包括总体参数包括总体均值总体均值、比例比例、方差方差等等分析分析之前之前必需要有合理的陈述必需要有合理的陈

62、述我认为:蛙跳训练能够促我认为:蛙跳训练能够促我认为:蛙跳训练能够促我认为:蛙跳训练能够促进进进进100m100m跑成绩的提高!跑成绩的提高!跑成绩的提高!跑成绩的提高!94什么是假设检验?什么是假设检验?根据研究目的,对样本所属总体的特征根据研究目的,对样本所属总体的特征提出提出一个假设一个假设,然后,然后根据样本资料所提供的信息根据样本资料所提供的信息,对这个假设作出拒绝或者不拒绝的判断,这对这个假设作出拒绝或者不拒绝的判断,这一过程成为假设检验。一过程成为假设检验。概念核心:概念核心:事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否

63、成立然后利用样本信息来判断原假设是否成立95假设检验的基本思想假设检验的基本思想.因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假因此我们拒绝假设设设设设设 =173cm=173cm=173cm.我们假设这个是我们假设这个是我们假设这个是我们假设这个是我们假设这个是我们假设这个是总体的真实均值总体的真实均值总体的真实均值总体的真实均值总体的真实均值总体的真实均值样本均值样本均值样本均值样本均值样本均值样本均值 =173cm=173cm抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个是我们抽这个是我们抽样得出的某个样得出的某个样本均值样本均值 .150

64、15015096总体总体总体总体假设检验的过程假设检验的过程(提出假设(提出假设抽取样本抽取样本作出决策)作出决策)抽取随机样本抽取随机样本抽取随机样本抽取随机样本均值均值均值均值 X X =15.6=15.6秒秒秒秒初三男生初三男生100M100M平平均成绩是均成绩是13.613.6秒秒提出假设提出假设提出假设提出假设拒绝假设拒绝假设!别无选择别无选择.作出决策作出决策作出决策作出决策97假设检验中的小概率原理假设检验中的小概率原理什么是小概率?什么是小概率?1. 在在一一次次试试验验中中,一一个个几几乎乎不不可可能能发发生生的的事事件件发发生的概率生的概率2. 在在一一次次试试验验中中小小

65、概概率率事事件件一一旦旦发发生生,我我们们就就有有理由拒绝原假设理由拒绝原假设3. 小概率由研究者事先确定(与置信区间相关小概率由研究者事先确定(与置信区间相关)98抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H HH000值值值临界值临界值临界值临界值临界值临界值 /2/2 /2 /2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域1-1-1- 置信水平置信水平置信水平置信水平置信水平置信水平99假设检验的基本步骤假设检验的基本步骤(1)根据实际情况建立原假设)根据实际情况建立原假设H H0 0 ,备择假设,备择假设H H1 1(2)选择并计算检

66、验统计量的取值)选择并计算检验统计量的取值(3)确定显著性水平)确定显著性水平,查表得出相应的临界值,查表得出相应的临界值(4)把实值与临界值进行比较,作出统计判断)把实值与临界值进行比较,作出统计判断100 什么检验统计量?什么检验统计量?1.用于假设检验问题的统计量用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑选择统计量的方法与参数估计相同,需考虑是大样本还是小样本是大样本还是小样本总体方差已知还是未知总体方差已知还是未知3.检验统计量的基本形式为检验统计量的基本形式为确定适当的检验统计量确定适当的检验统计量101提出原假设提出原假设H H0 0 和备择假设和备择假设H

67、 H1 1 什么是原假设?什么是原假设?(NullHypothesis)1. 待检验的假设,又称“0假设、虚无假设”。2. 如果错误地作出决策会导致一系列后果。3. 总是有等号 , 或 4. 表示为 H0 H0 : 某一数值0 例如, H0 : 1.73(米)102提出原假设提出原假设H H0 0和备择假设和备择假设H H1 1 什么是备择假设?什么是备择假设?(AlternativeHypothesis)1. 与原假设对立的假设2. 总是有不等号: , 或 3. 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: F ,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素(A

68、)对观察值有显著影响若F F ,则不能拒绝原假设H0,表明所检验的因素(A)对观察值没有显著影响177单因素方差分析表单因素方差分析表( (基本结构基本结构) )MSE178单因素方差分析单因素方差分析(一个例子)(一个例子)【例例】为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了6家,航空公司抽取5家、家电制造业抽取了5家,然后记录了一年中消费者对总共23家服务企业投诉的次数,结果如表9.7。试分析这四个行业的服务质量是否有显著差异?(0.05)179单因素方差分析单因素方差分析(一个例子)(一个例子)1

69、80单因素方差分析单因素方差分析(计算结果)(计算结果)解:设四个行业被投诉次数的均值分别为,1、2、3、4,则需要检验如下假设H0: 1 = 2 = 3 = 4 (四个行业的服务质量无显著差异) H1: 1 ,2 ,3,4不全相等 (有显著差异)Excel输出的结果如下结论:拒绝结论:拒绝H0。四个行业的服务质量有显著差异四个行业的服务质量有显著差异181方差分析中的多重比较方差分析中的多重比较(作用)(作用)1.多重比较是通过对总体均值之间的配对比较来进一步检验到底哪些均值之间存在差异2.多重比较方法有多种,这里介绍Fisher提出的最最小小显显著著差差异异方法,简写为LSD,该方法可用于

70、判断到底哪些均值之间有差异3.LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的182方差分析中的多重比较方差分析中的多重比较(步骤)(步骤)1.提出假设H0: i = j (第i个总体的均值等于第j个总体的均值)H1: i j (第i个总体的均值不等于第j个总体的均值)2.检验的统计量为3.若若|t| t,拒绝,拒绝H0;若若|t|t,不能拒绝,不能拒绝H0183方差分析中的多重比较方差分析中的多重比较(基于统计量(基于统计量 x xi i- - x xj j的的LSDLSD方法)方法)1.通过判断样本均值之差的大小来检验H02.检验的统计量为

71、:xi xj3.检验的步骤为 提出假设H0: i = j (第i个总体的均值等于第j个总体的均值)H1: i j (第i个总体的均值不等于第j个总体的均值)计算LSD若若| xi- xj| LSD,拒绝,拒绝H0,若若| xi- xj|2.096颜色颜色1与颜色与颜色2的销售量的销售量有有显著差异显著差异| x1- x3|=|27.3-26.4|=0.92.096颜色颜色1与颜色与颜色4的销售量的销售量有有显著差异显著差异| x2- x3|=|29.5-26.4|=3.12.096颜色颜色2与颜色与颜色3的销售量的销售量有有显著差异显著差异| x2- x4|=|29.5-31.4|=1.92.

72、096颜色颜色3与颜色与颜色4的销售量的销售量有有显著差异显著差异186体育统计学体育统计学第八章第八章 相关分析相关分析187变量间的关系变量间的关系(函数关系)(函数关系)1.是一一对应的确定关系是一一对应的确定关系2.设设有有两两个个变变量量x 和和y ,变变量量y 随随变变量量x 一一起起变变化化,并并完完全全依依赖赖于于x ,当当变变量量x 取取某某个个数数值值时时, y 依依确确定定的的关关系系取取相相应应的的值值,则则称称y 是是x 的的函函数数,记记为为y=f (x),其其中中x 称称为为自自变变量量,y 称称为为因因变变量量3.各观测点落在一条线上各观测点落在一条线上x xy

73、 y188函数关系的例子函数关系的例子圆的面积圆的面积圆的面积圆的面积(S)(S)与半径之间的关系可表示为:与半径之间的关系可表示为:与半径之间的关系可表示为:与半径之间的关系可表示为: S S = R R2 2 某某某某种种种种商商商商品品品品的的的的销销销销售售售售额额额额( (y y) )与与与与销销销销售售售售量量量量( (x x) )之之之之间间间间的的的的关关关关系可表示为:系可表示为:系可表示为:系可表示为: y y =p p x x ( (p p 为单价为单价为单价为单价) )变量间的关系变量间的关系(函数关系)(函数关系)189变量间的关系变量间的关系(相关关系)(相关关系)

74、1.变变量量间间关关系系不不能能用用函函数数关关系系精确表达精确表达2.一一个个变变量量的的取取值值不不能能由由另另一个变量一个变量唯一确定唯一确定3.当当变变量量x 取取某某个个值值时时,变变量量y 的取值可能有几个的取值可能有几个4.各观测点分布在直线周围各观测点分布在直线周围x xy y190相关关系的例子相关关系的例子父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系家庭收入状况家庭收入状况(y)与体育消费与体育消费(x)之间的关系之间的关系体育用品销售额体育用品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程

75、度(x)之间的关系之间的关系变量间的关系变量间的关系(相关关系)(相关关系)191相关关系的类型相关关系的类型相关关系相关关系非线性相关非线性相关线性相关线性相关正正相相关关正正相相关关负负相相关关负负相相关关完全相关完全相关不相关不相关192相关关系的图示相关关系的图示不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相

76、关完全正线性相关完全正线性相关完全正线性相关完全正线性相关193相关系数相关系数1.对变量之间关系密切程度的度量对变量之间关系密切程度的度量2.对对两两个个变变量量之之间间线线性性相相关关程程度度的的度度量量称称为为简简单相关系数或积差相关系数。单相关系数或积差相关系数。3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称称为总体相关系数,记为为总体相关系数,记为 4.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关关系数,记为系数,记为r194简单相关系数简单相关系数(积差相关系数)(积差相关系数)样本相关系数的计算公式样本相关系数的计算公式或

77、化简为195相关系数取值及其意义相关系数取值及其意义1.r的取值范围是的取值范围是-1,12.|r|=1,为完全相关,为完全相关r =1,为完全正相关,为完全正相关r =-1,为完全负正相关,为完全负正相关3.r =0,不存在线性相关,不存在线性相关4.-1 r 0,为负相关,为负相关5.0t,拒绝,拒绝H0若若tt,接受,接受H02001.若若IrI大大于于表表上上的的 =5%相相应应的的值值,且且小小于于表表上上 1%相相应应的的值值,称称变变量量x与与y之之间间有有显显著著的的线性关系线性关系2.若若IrI大大于于表表上上 =1%相相应应的的值值,称称变变量量x与与y之之间有间有十分(非

78、常)显著的十分(非常)显著的线性关系线性关系3.若若IrI小小于于表表上上 =5%相相应应的的值值,称称变变量量x与与y之之间间没有明显的线性关系没有明显的线性关系相关系数的显著性检验相关系数的显著性检验201相关系数的显著性检验(实例)相关系数的显著性检验(实例)以例以例8.1为例:对其相关系数进行检验为例:对其相关系数进行检验解:解:第一步:提出假设:第一步:提出假设:H0: ;H1: 0第二步:计算检验统计量:第二步:计算检验统计量:202相关系数的显著性检验(实例)相关系数的显著性检验(实例)第三步:确定显著性水平第三步:确定显著性水平 ,并作出决策,并作出决策203体育统计学体育统计

79、学第九章第九章 回归分析回归分析(一元线性回归)(一元线性回归)204什么是回归分析?什么是回归分析?(内容)(内容)1.从一组样本数据出发,确定变量之间的数学关系式2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度205回归分析与相关分析的区别回归分析与相关分析的区别1.相关分析中,变量x变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化2.相关分析中所涉及的变量x

80、 和y 都是随机变量;回归分析中,因变量y 是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制206回归模型的类型回归模型的类型一个自变量一个自变量两个及两个以上自变量两个及两个以上自变量回归模型回归模型多元回归多元回归一元回归一元回归线性线性回归回归非线性非线性回归回归线性线性回归回归非线性非线性回归回归207回归模型与回归方回归模型与回归方程程208回归模型回归模型1.回答“变量之间是什么样的关系?”2.方程中运用1个数字的因变量(响应变量)被预测

81、的变量1个或多个数字的或分类的自变量(解释变量)用于预测的变量3.主要用于预测和估计209一元线性回归模型一元线性回归模型(概念要点)(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量y 与自变量x 之间为线性关系时称为一元线性回归2.对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系3.描述因变量y 如何依赖于自变量x 和误差项的方程称为回归模型210一元线性回归模型一元线性回归模型(概念要点)(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为 y = + + x + + 模型中,y 是x 的线性函数(部分)加上误差项线性部分反映了由于x 的变化而引起的y 的

82、变化误差项是随机变量反映了除x 和y 之间的线性关系之外的随机因素对y 的影响是不能由x 和y 之间的线性关系所解释的变异性0和1称为模型的参数211一元线性回归模型一元线性回归模型(基本假定)(基本假定)1.误差项是一个期望值为0的随机变量,即E()=0。对于一个给定的x 值,y 的期望值为E(y )= 0+ 1x2.对于所有的x 值,的方差2都相同3.误差项是一个服从正态分布的随机变量,且相互独立。即N(0,2)独立性意味着对于一个特定的x 值,它所对应的与其他x 值所对应的不相关对于一个特定的x 值,它所对应的y 值与其他x 所对应的y 值也不相关212回归方程回归方程(概念要点)(概念

83、要点)1.描述y 的平均值或期望值如何依赖于x 的方程称为回归方程回归方程2.简单线性回归方程的形式如下3. E(y )= 0+ 1x方程的图示是一条直线,因此也称为直线回归方程方程的图示是一条直线,因此也称为直线回归方程 0 0是是回回归归直直线线在在 y y 轴轴上上的的截截距距,是是当当 x x=0=0时时 y y 的的期期望值望值 1 1是是直直线线的的斜斜率率,称称为为回回归归系系数数,表表示示当当 x x 每每变变动动一个单位时,一个单位时,y y 的平均变动值的平均变动值213估计估计( (经验经验) )的回归的回归方程方程3.简单线性回归中估计的回归方程为简单线性回归中估计的回

84、归方程为其其中中: 是是估估计计的的回回归归直直线线在在 y y 轴轴上上的的截截距距, 是是直直线线的的斜斜率率,它它表表示示对对于于一一个个给给定定的的 x x 的的值值,是是 y y 的的估估计计值,也表示值,也表示 x x 每变动一个单位时,每变动一个单位时, y y 的平均变动值的平均变动值 2.用用样样本本统统计计量量 和和 代代替替回回归归方方程程中中的的未未知知参参数数和和,就得到了,就得到了估计的回归方程估计的回归方程1.总总体体回回归归参参数数 和和 是是未未知知的的,必必需需利利用用样样本本数数据去估计据去估计214参数参数 0和和 1的最的最小二乘估计小二乘估计215最

85、小二乘法最小二乘法(概念要点)(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即2.用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小216最小二乘法最小二乘法(图示)(图示)x xy y( (x xnn, ,y yn n) )( (x x11, ,y y1 1) )( (x x22, ,y y2 2) )( (x xi i, ,y yi i) )e ei i=y yi i- -y yi i217最小二乘法最小二乘法( 和和的计算公式的计算公式)根据最小二乘法的要求,可得求解和 的标准方程如下218估计方程的求法估计方程的求法(实例)

86、(实例)【例例】根据例10.1中的数据,配合人均消费金额对人均国民收入的回归方程 根据和的求解公式得219估计估计( (经验经验) )方程方程人均消费金额对人均国民收入的回归方程为y = 54.22286+ 0.52638x 220估计方程的求法估计方程的求法(Excel的输出结果)的输出结果)221回归方程的显著性回归方程的显著性检验检验222离差平方和的分解离差平方和的分解1.因变量y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量x 的取值不同造成的除x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响2.对一个具体的观测值来说,变差的大小可以通过该实际

87、观测值与其均值之差来表示223离差平方和的分解离差平方和的分解(图示)(图示)x xy yy y 离差分解图离差分解图224离差平方和的分解离差平方和的分解(三个平方和的关系)(三个平方和的关系)2.两端平方后求和有1.从图上看有SST = SSR + SSE总变差平方和总变差平方和(SSTSST)回归平方和回归平方和(SSRSSR)残差平方和残差平方和(SSESSE)225离差平方和的分解离差平方和的分解(三个平方和的意义)(三个平方和的意义)1.总平方和总平方和(SST)反映因变量的n 个观察值与其均值的总离差2.回归平方和回归平方和(SSR)反映自变量x 的变化对因变量y 取值变化的影响

88、,或者说,是由于x 与y 之间的线性关系引起的y 的取值变化,也称为可解释的平方和3.残差平方和残差平方和(SSE)反映除x 以外的其他因素对y 取值的影响,也称为不可解释的平方和或剩余平方和226样本决定系数样本决定系数(判定系数(判定系数r2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度3.取值范围在0,1之间4.r21,说明回归方程拟合的越好;r20,说明回归方程拟合的越差5.判定系数等于相关系数的平方,即r2(r)2227回归方程的显著性检验回归方程的显著性检验(线性关系的检验线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著2.具体方法是将回归离差平方和(S

89、SR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,两个变量之间存在线性关系如果不显著,两个变量之间不存在线性关系228回归方程的显著性检验回归方程的显著性检验(检验检验的步骤)的步骤)1.提出假设H0:线性关系不显著2.计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F4.作出决策:若FF,拒绝H0;若F t t,拒绝,拒绝H H0 0; t t =65.0758t t=2.201=2.201,拒拒绝绝H H0 0,表表明明人人均均收收入入与人均消费之间有线性关系与人均消费之间有线性关系对前例的回归系数进行显著性检验

90、(0.05)236回归系数的显著性检验回归系数的显著性检验(Excel输出的结果)输出的结果)237预测及应用预测及应用238利用回归方程进行估计和预测利用回归方程进行估计和预测1.根据自变量 x 的取值估计或预测因变量 y的取值2.估计或预测的类型点估计y 的平均值的点估计y 的个别值的点估计区间估计y 的平均值的置信区间估计y 的个别值的预测区间估计239利用回归方程进行估计和预测利用回归方程进行估计和预测(点估计)(点估计)2.点估计值有n ny y 的平均值的点估计的平均值的点估计n ny y 的个别值的点估计的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的

91、,但在区间估计中则不同1.对于自变量x 的一个给定值x0,根据回归方程得到因变量y 的一个估计值240利用回归方程进行估计和预测利用回归方程进行估计和预测(点估计)(点估计) y 的平均值的点估计的平均值的点估计1.利用估计的回归方程,对于自变量x 的一个给定值x0 ,求出因变量y的平均值的一个估计值E(y0),就是平均值的点估计2.在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得241利用回归方程进行估计和预测利用回归方程进行估计和预测(点估计)(点估计) y 的个别值的点估计的个别值的点估计1.利用估计的回归

92、方程,对于自变量x 的一个给定值x0 ,求出因变量y的一个个别值的估计值,就是个别值的点估计2.比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得242利用回归方程进行估计和预测利用回归方程进行估计和预测(区间估计)(区间估计)1.点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计2.对于自变量x 的一个给定值x0,根据回归方程得到因变量y 的一个估计区间3.区间估计有两种类型置信区间估计预测区间估计243利用回归方程进行估计和预测利用回归方程进行估计和预测(置信区间估计)(置信区间估计)

93、 y 的平均值的的平均值的置信区间置信区间估计估计1.利用估计的回归方程,对于自变量x 的一个给定值x0 ,求出因变量y的平均值E(y0)的估计区间,这一估计区间称为置信区间置信区间2.E(y0)在1-置信水平下的置信区间为式式中中:S Sy y为为估估计标准误差计标准误差244利用回归方程进行估计和预测利用回归方程进行估计和预测(置信区间估计(置信区间估计:算例)算例)【例】【例】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间解:根据前面的计算结果712.57,Sy=14.95,t(13-2)2.201,n=13置信区间为712.57712.57 10.26510

94、.265人人 均均 消消 费费 金金 额额 95%95%的的 置置 信信 区区 间间 为为 702.305702.305元元 722.835722.835元之间元之间245利用回归方程进行估计和预测利用回归方程进行估计和预测(预测区间估计)(预测区间估计) y 的个别值的的个别值的预测区间预测区间估计估计1.利用估计的回归方程,对于自变量x 的一个给定值x0 ,求出因变量y的一个个别值的估计区间,这一区间称为预测区间预测区间2.y0在1-置信水平下的预测区间为注意!注意!246利用回归方程进行估计和预测利用回归方程进行估计和预测(置预测区间估计(置预测区间估计:算例)算例)【例例】根据前例,求

95、出1990年人均国民收入为1250.7元时,人均消费金额的95%的预测区间解:根据前面的计算结果有712.57,Sy=14.95,t(13-2)2.201,n=13置信区间为712.57712.57 34.46934.469人人均均消消费费金金额额95%95%的的预预测测区区间间为为678.101678.101元元 747.039747.039元之间元之间247影响区间宽度的因素影响区间宽度的因素1.置信水平(1-)区间宽度随置信水平的增大而增大2.数据的离散程度(s)区间宽度随离散程度的增大而增大3.样本容量区间宽度随样本容量的增大而减小4.用于预测的xp与x的差异程度区间宽度随xp与x 的

96、差异程度的增大而增大248置信区间置信区间、预测区间预测区间、回归方程回归方程xp pyx x预测上限置信上限预测下限置信下限249第三节 多元线性回归一一. 多元线性回归模型多元线性回归模型二.回归参数的估计回归参数的估计三.回归方程的显著性检验回归方程的显著性检验四.回归系数的显著性检验回归系数的显著性检验五.多元线性回归的预测多元线性回归的预测250多元线性回归模型多元线性回归模型251多元线性回归模型多元线性回归模型(概念要点)(概念要点)1.一个因变量与两个及两个以上自变量之间的回归2.描述因变量y 如何依赖于自变量x1 , x2 , xp 和误差项的方程称为多元线性回归模型多元线性

97、回归模型3.涉及p 个自变量的多元线性回归模型可表示为 0 0 , , , p p是参数是参数 是被称为误差项的随机变量是被称为误差项的随机变量 y y 是是x x1,1,,x x2 2 , ,x xp p 的线性函数加上误差项的线性函数加上误差项 说说明明了了包包含含在在y y里里面面但但不不能能被被p p个个自自变变量量的的线线性关系所解释的变异性性关系所解释的变异性252多元线性回归模型多元线性回归模型(概念要点)(概念要点)对于n 组实际观察数据(yi;xi1,,xi2,xip),(i=1,2,n),多元线性回归模型可表示为y1 = + + x11+ + x12 + + + px1p

98、+ + y2= + + x21 + + x22 + + + px2p + + yn= + + xn1 + + xn2 + + + pxnp + + n 253多元线性回归模型多元线性回归模型(基本假定)(基本假定)1.自变量x1,x2,xp是确定性变量,不是随机变量2.随机误差项的期望值为0,且方差2都相同3.误差项是一个服从正态分布的随机变量,即N(0,2),且相互独立254多元线性回归方程多元线性回归方程(概念要点)(概念要点)1.描述y 的平均值或期望值如何依赖于x1,x1 ,xp的方程称为多多元元线线性性回归方程回归方程2.多元线性回归方程的形式为3. E(y )= 0+ 1x1 +

99、2x2 + pxp , , p p称为偏回归系数称为偏回归系数 i i 表表示示假假定定其其他他变变量量不不变变,当当 x xi i 每每变变动一个单位时,动一个单位时,y y 的平均平均变动值的平均平均变动值255多元线性回归方方程的直观解释多元线性回归方方程的直观解释二元线性回归模型二元线性回归模型二元线性回归模型二元线性回归模型( (观察到的观察到的y y) )回归面回归面 0 0 i ix x1 1y yx x2 2( (x x1 1, ,x x2 2) )256多元线性回归的估计多元线性回归的估计( (经验经验) )方程方程1.总体回归参数是未知的,利用样本数据去估计2.用用样样本本

100、统统计计量量 代代替替回回归归方方程程中中的的 未知参数未知参数 即得到估计的回归方程即得到估计的回归方程 是是 估计值估计值 是是 y y 的估计值的估计值257参数的最小二乘估参数的最小二乘估计计258参数的最小二乘法参数的最小二乘法(要点)(要点)2.根根据据最最小小二二乘乘法法的的要要求求,可可得得求求解解各各回回归归参参数数 的标准方程如下的标准方程如下1.使使因因变变量量的的观观察察值值与与估估计计值值之之间间的的离离差差平平方方和和达到最小来求得达到最小来求得 。即。即259回归方程的显著性回归方程的显著性检验检验260多重样本决定系数多重样本决定系数(多重判定系数(多重判定系数

101、R2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度反映回归直线的拟合程度3.取值范围在取值范围在 0,10,1之间之间4. R R221 1,说明回归方程拟合的越好;,说明回归方程拟合的越好; R R2 20 0,说明,说明回归方程拟合的越差回归方程拟合的越差5.等于多重相关系数的平方,即等于多重相关系数的平方,即R R2 2=(=(R R) )2 2261修正的多重样本决定系数修正的多重样本决定系数(修正的多重判定系数(修正的多重判定系数R2)1.由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正R2的值2.用n表

102、示观察值的数目,p表示自变量的数目,修正的多元判定系数的计算公式可表示为262回归方程的显著性检验回归方程的显著性检验(线性关系的检验线性关系的检验)1.检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总总体体的的显显著性著性检验2.检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应应用用F 检检验验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系263回归方程的显著性检验回归方程的显著性检验(步骤)(步骤)1.提出假设H0:12p=0线性关系不显著H1:1,2,p至少有一个不等于0

103、2.2.计算检验统计量计算检验统计量F F3.3.确定显著性水平确定显著性水平 和分子自由度和分子自由度p p、分母自由度、分母自由度n-n-p p-1-1找出临界值找出临界值F F 4.4.作出决策:若作出决策:若F F F F ,拒绝,拒绝H H0 0;若若F F F F ,接受,接受H H0 0264回归系数的显著性检验回归系数的显著性检验(要点)(要点)1.如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量 xi 对因变量 y 的影响是否显著2.对每一个自变量都要单独进行检验3.应用 t 检验4.在多元线性回归中,回归方程的显著性检验不再等价于

104、回归系数的显著性检验265回归系数的显著性检验回归系数的显著性检验(步骤)(步骤)1.提出假设H0: i = 0 (自变量 xi与因变量y 没有线性关系) H1: i 0 (自变量 xi与因变量y有线性关系) 2.计算检验的统计量 t3. 确定显著性水平,并进行决策 t tt t,拒绝,拒绝H H0 0; t t F F0.050.05(2,7)=4.74(2,7)=4.74,回归方程显著,回归方程显著4. 4. 回归系数的显著性检验回归系数的显著性检验2. 2.t t=9.35489.3548t t=0.3646=0.3646,; t t 22=4.79624.7962t t=2.3646=

105、2.3646;两个回归系数均显著两个回归系数均显著一个含有四个变量的回归269第三节 可化为线性回归的 曲线回归一.基本概念基本概念二.非线性模型及其线性化方法非线性模型及其线性化方法270非线性回归非线性回归1.因变量 y 与 x 之间不是线性关系2.可通过变量代换转换成线性关系3.用最小二乘法求出参数的估计值4.并非所有的非线性模型都可以化为线性模型271几种常见的非线性模型几种常见的非线性模型 指数函数2.线性化方法两端取对数得:两端取对数得:lnlny y = ln= ln + + x x令:令:y y =ln=lny y,则有,则有y y =lnln + + x x1.基本形式:3.

106、图像 272几种常见的非线性模型几种常见的非线性模型 幂函数2.线性化方法两端取对数得:两端取对数得:lglgy y =lg=lg + lglg x x令:令:y y =lg=lgy y,x x =lg=lgx x,则,则y y =lglg + x x 1.基本形式:3.图像00 1 1 1 1 = 1= 1-1-1 0 0 -1 -1 =-1 =-1 273几种常见的非线性模型几种常见的非线性模型 双曲线函数2.线性化方法令:令:y y =1/=1/y y,x x =1/=1/x x, ,则有则有y y = + + x x 1.基本形式:3.图像 0 0 0274几种常见的非线性模型几种常见

107、的非线性模型 对数函数2.线性化方法x x =lg=lgx x , ,则有则有y y = + + x x 1.基本形式:3.图像 0 0 0 0 275几种常见的非线性模型几种常见的非线性模型 S 型曲线2.线性化方法令:令:y y =1/=1/y y,x x =e=e- -x x, ,则有则有y y = + + x x 1.基本形式:3.图像276非线性回归非线性回归(实例)(实例) 【例例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。277非线性回归非线性回归(实例)(实例)生产率与废品率的散点图278非线性回归非线性回归(实例)(实例)1.用线性模型:y =01x+

108、 ,有2. y = 2.671+0.0018x2.用指数模型:y = x ,有3. y =4.05(1.0002)x3.比较4.直线的残差平方和5.3371指数模型的残差平方和6.11。直线模型略好于指数模型279本章小结本章小结1.相关系数与相关分析相关系数与相关分析2.一元线性回归模型、回归方程与估计的回归方程一元线性回归模型、回归方程与估计的回归方程3.多元线性回归模型、回归方程与估计的回归方程多元线性回归模型、回归方程与估计的回归方程4.回归方程与回归系数的显著性检验回归方程与回归系数的显著性检验5.非线性回归的线性化非线性回归的线性化5.用用Excel进行回归分析进行回归分析280thank you281个人观点供参考,欢迎讨论

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号