统计学-主编:费宇石磊.ppt

上传人:ni****g 文档编号:567683501 上传时间:2024-07-22 格式:PPT 页数:77 大小:893.50KB
返回 下载 相关 举报
统计学-主编:费宇石磊.ppt_第1页
第1页 / 共77页
统计学-主编:费宇石磊.ppt_第2页
第2页 / 共77页
统计学-主编:费宇石磊.ppt_第3页
第3页 / 共77页
统计学-主编:费宇石磊.ppt_第4页
第4页 / 共77页
统计学-主编:费宇石磊.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《统计学-主编:费宇石磊.ppt》由会员分享,可在线阅读,更多相关《统计学-主编:费宇石磊.ppt(77页珍藏版)》请在金锄头文库上搜索。

1、2024/7/22统计学第1章绪论1-1统计学统计学主编:费宇,石磊主编:费宇,石磊2024/7/22统计学第1章绪论1-2第第1章章绪论绪论F1.1统计数据与统计学统计数据与统计学F1.2统计学的历史统计学的历史F1.3统计学的分类统计学的分类F1.4统计学基本概念统计学基本概念F1.5常用分布常用分布F1.6正态总体的抽样分布正态总体的抽样分布2024/7/22统计学第1章绪论1-3【引例引例1.0】统计数据统计数据F统计数据,往往是一个统计数据,往往是一个“出新闻出新闻”的地方。的地方。20102010年年1 1月月1919日,在国家统计局的网站首页的头条,人们看见了日,在国家统计局的网

2、站首页的头条,人们看见了“期待期待已久已久”的的“20092009年全国房地产市场运行情况年全国房地产市场运行情况”统计报告。统计报告。F按照统计局公布的这份报告:按照统计局公布的这份报告:20092009年年1212月份,全国月份,全国7070个大个大中城市房屋销售价格仅仅只同比上涨了中城市房屋销售价格仅仅只同比上涨了7.8%7.8%。特别是城市。特别是城市居民最关心的新建住房销售价格,同比上涨(也就是一年居民最关心的新建住房销售价格,同比上涨(也就是一年的涨幅)一成都不到,只有的涨幅)一成都不到,只有9.1%9.1%(仅仅比国家统计局公布(仅仅比国家统计局公布的的20082008年涨幅高了

3、年涨幅高了2 2个百分点);二手住房的销售价格,个百分点);二手住房的销售价格,更是只比上年同期更是只比上年同期“慢慢涨了慢慢涨了”6.8%6.8%。F就连一些一线大城市,国家统计局的公布的就连一些一线大城市,国家统计局的公布的20092009年一年的年一年的房价涨幅,同样也房价涨幅,同样也“适度而温和适度而温和”,绝不,绝不“吓人吓人”:房价:房价“最热最热”的北京,它的房屋销售价格,一年也就上涨了的北京,它的房屋销售价格,一年也就上涨了9.2 %9.2 %,天津为,天津为8.7%8.7%,上海、广州和深圳,分别也就,上海、广州和深圳,分别也就7.4%7.4%、8.7%8.7%和和18.9%

4、18.9%。按照这份。按照这份“官方的权威统计官方的权威统计”,在这全国,在这全国7070个大中城市中,房价涨幅一年超过个大中城市中,房价涨幅一年超过10%10%的,仅仅只有六的,仅仅只有六七个城市左右,很多城市的房价涨幅连七个城市左右,很多城市的房价涨幅连5%5%都不到。都不到。2024/7/22统计学第1章绪论1-4【引例引例1.0】统计数据统计数据F但是作为全国最大房地产专业门户网站之一的搜房网,但是作为全国最大房地产专业门户网站之一的搜房网,20092009年曾发布了一个号称年曾发布了一个号称“老百姓自己的房价榜老百姓自己的房价榜”。他们。他们通过对南京市的楼盘和各区域房价的全面统计和

5、加权分析,通过对南京市的楼盘和各区域房价的全面统计和加权分析,得出得出20092009年年1010月份该市商品房住宅价格比月份该市商品房住宅价格比20092009年年初的年年初的1 1月份上涨月份上涨34.18%34.18%,环比也较上月全市上涨,环比也较上月全市上涨6.34%6.34%。而与此。而与此同时,国家统计局网站上公布的同比涨幅仅为同时,国家统计局网站上公布的同比涨幅仅为4.3%4.3%,环比,环比也只有也只有2.4%2.4%。另外,据国务院发展研究中心宏观经济研究。另外,据国务院发展研究中心宏观经济研究部的一次报告计算,部的一次报告计算,20092009年全国住宅销售的房价涨幅已经

6、年全国住宅销售的房价涨幅已经高达高达27.28%27.28%,整整超过了国家统计局公布的,整整超过了国家统计局公布的“新建住房销新建住房销售价格售价格”涨幅的两倍。涨幅的两倍。F各种房价涨幅数据再一次各种房价涨幅数据再一次“打架打架” 引发了引发了“强烈的热议强烈的热议”。那么,如何判断现实中的诸多统计数据的合理性,要。那么,如何判断现实中的诸多统计数据的合理性,要求我们对统计数据和统计学的基本原理具有一定的认识。求我们对统计数据和统计学的基本原理具有一定的认识。(资料来源:(资料来源:FTFT中文网:中文网:http:/ are three kinds of lies: lies, damn

7、ed lies, and statistics.”统计是一把统计是一把“双刃剑双刃剑”2024/7/22统计学第1章绪论1-61.1统计数据与统计学统计数据与统计学F1.1.1 统计数据统计数据F在在日日生生活活中中(新新闻闻、消消息息和和报报道道中中)我我们们会会碰碰到到各各式式各各样样的的统统计计数数据据,只只有有正正确确理理解解这这些些统统计计数数据据,才才能能真真正正读读懂懂这这些些新新闻闻、消息和报道。消息和报道。F统计数据与我们的日常生活息息相关统计数据与我们的日常生活息息相关 2024/7/22统计学第1章绪论1-7【例例1.1】F据中国国家统计局网公布的消息,据中国国家统计局网

8、公布的消息,2010年年2月份,居民消费价格同比上涨月份,居民消费价格同比上涨2.7%,涨幅,涨幅比上月扩大比上月扩大1.2个百分点。其中,城市同比个百分点。其中,城市同比上涨上涨2.6%,农村上涨,农村上涨2.9%;食品价格上涨;食品价格上涨6.2%,非食品价格上涨,非食品价格上涨1.0%;消费品价格;消费品价格上涨上涨3.0%,服务项目价格上涨,服务项目价格上涨1.7%。2024/7/22统计学第1章绪论1-8问题问题F“居民消费价格同比上涨居民消费价格同比上涨2.7%”确切的含义确切的含义是什么?是什么?2024/7/22统计学第1章绪论1-9【例例1.2】中国网中国网()F2009年年

9、10月月28日消息,国家统计局上海调查总队日消息,国家统计局上海调查总队近期对近期对1000户城市居民家庭开展了一项有关消费户城市居民家庭开展了一项有关消费意向和消费观念的专题调查。调查结果显示,以意向和消费观念的专题调查。调查结果显示,以下领域存在较大消费潜力:首先是住房消费。调下领域存在较大消费潜力:首先是住房消费。调查中,在问及购房意向时,有查中,在问及购房意向时,有2.9%的家庭表示年的家庭表示年内打算购房,另有内打算购房,另有9.6%表示在三年内有购房意向。表示在三年内有购房意向。而抽样调查显示,而抽样调查显示,2008年只有年只有1.1%的城市居民家的城市居民家庭实际购房。在有购房

10、意向的被访家庭中,有庭实际购房。在有购房意向的被访家庭中,有46.4%表示是结婚用房,表示是结婚用房,49.6%表示为改善居住表示为改善居住条件。作为投资或其他用途的比重很小,只占条件。作为投资或其他用途的比重很小,只占4%。可见,对房价的稳定预期和刚性需求的持续增长,可见,对房价的稳定预期和刚性需求的持续增长,仍将有力支撑上海房地产市场的需求量。仍将有力支撑上海房地产市场的需求量。2024/7/22统计学第1章绪论1-10问题问题F“有有2.9%的家庭表示年内打算购房,另有的家庭表示年内打算购房,另有9.6%表示在三年内有购房意向表示在三年内有购房意向”这两个数这两个数字的可靠性怎样?字的可

11、靠性怎样?2024/7/22统计学第1章绪论1-11【例例1.3】北京日报北京日报F2009年年1月月12日报道,日报道,2008年中国民生问题调查:食品年中国民生问题调查:食品安全状况最令人担忧安全状况最令人担忧,调查中对城乡居民询问了人身、,调查中对城乡居民询问了人身、个人和家庭财产、个人信息隐私、交通、劳动、医疗、食个人和家庭财产、个人信息隐私、交通、劳动、医疗、食品等品等7个方面的安全感,结果发现在上述个方面的安全感,结果发现在上述7个方面平均有个方面平均有74.6%的人表示的人表示“很安全很安全”或或“比较安全比较安全”。其中人身方。其中人身方面的安全感最高面的安全感最高(很安全和比

12、较安全合计很安全和比较安全合计83.2%),而食品,而食品和交通方面的安全感最低,分别只有和交通方面的安全感最低,分别只有65.3%和和65.7%,认,认为不安全的人达为不安全的人达30%以上。特别值得提及的是,在以上。特别值得提及的是,在2006年年和和2008年的两次调查中,食品安全状况都在各类安全感中年的两次调查中,食品安全状况都在各类安全感中排在倒数第一,这说明公众对食品卫生和安全有着长期的排在倒数第一,这说明公众对食品卫生和安全有着长期的担忧。调查的时间:担忧。调查的时间:2008年年5月至月至9月,月,调查样本:此项调查样本:此项全国抽样调查覆盖全国全国抽样调查覆盖全国28个省市区

13、的个省市区的134个县个县(市、区市、区)、251个乡个乡(镇、街道镇、街道)和和523个村个村(居委会居委会),共成功入户访问,共成功入户访问了了7139位年龄在位年龄在18至至69岁的居民,调查误差小于岁的居民,调查误差小于2%,符,符合统计推论的科学要求。合统计推论的科学要求。2024/7/22统计学第1章绪论1-12问题问题F“共成功入户访问了共成功入户访问了7139位年龄在位年龄在18至至69岁的居民,调查误差小于岁的居民,调查误差小于2%,符合统计推,符合统计推论的科学要求。论的科学要求。”这里这里“调查误差小于调查误差小于2%”是什么意思?是什么意思?2024/7/22统计学第1

14、章绪论1-13【例例1.4】F2008年美国发表的两项大型临床试验结果显示,年美国发表的两项大型临床试验结果显示,维生素及其它抗氧化剂丝毫无助于预防前列腺癌。维生素及其它抗氧化剂丝毫无助于预防前列腺癌。美国医学会杂志美国医学会杂志在网络版上公布了这一结果:在网络版上公布了这一结果:第一项研究是迄今进行过的规模最大的癌症预防第一项研究是迄今进行过的规模最大的癌症预防对照试验之一,有对照试验之一,有3.55万名中年男性参加,服用万名中年男性参加,服用维生素维生素E、硒或安慰剂的时间超过、硒或安慰剂的时间超过5年。第二项试年。第二项试验历时验历时8年,观察了维生素年,观察了维生素C和和E对近对近1.

15、5万名男性万名男性的影响。两项研究均显示,无论是对前列腺癌,的影响。两项研究均显示,无论是对前列腺癌,还是所有种类的癌症,这些补充剂都没有预防效还是所有种类的癌症,这些补充剂都没有预防效果。果。2024/7/22统计学第1章绪论1-14问题问题F“维生素及其它抗氧化剂丝毫无助于预防前维生素及其它抗氧化剂丝毫无助于预防前列腺癌。列腺癌。”这个结论是如何得到的?这个这个结论是如何得到的?这个结论可靠吗?结论可靠吗?2024/7/22统计学第1章绪论1-151.1.2 统计学统计学F什么是统计学?什么是统计学?F一般的教科书:统计学是研究如何有效地一般的教科书:统计学是研究如何有效地收集数据、整理数

16、据、分析数据,并根据收集数据、整理数据、分析数据,并根据数据作出推断的一门方法论科学。数据作出推断的一门方法论科学。F不列颠百科全书不列颠百科全书的定义:统计是的定义:统计是“收收集和分析数据的科学集和分析数据的科学(science)和艺术和艺术(art)”。2024/7/22统计学第1章绪论1-16回顾问题回顾问题F例例1.1中中“居民消费价格同比上涨居民消费价格同比上涨2.7%”确切的含确切的含义是什么?义是什么?第第9章章F例例1.2中中“有有2.9%的家庭表示年内打算购房,另有的家庭表示年内打算购房,另有9.6%表示在三年内有购房意向表示在三年内有购房意向”这两个数字的可这两个数字的可

17、靠性怎样?靠性怎样?第第3章章F例例1.3中中“调查误差小于调查误差小于2%”是如何估算出来的?是如何估算出来的?第第8章章F例例1.4“维生素及其它抗氧化剂丝毫无助于预防前维生素及其它抗氧化剂丝毫无助于预防前列腺癌。列腺癌。”这个结论是如何得到的?这个结论是如何得到的?第第4章章2024/7/22统计学第1章绪论1-171.2统计学的历史统计学的历史F统计活动的历史非常悠久统计活动的历史非常悠久F统计学的历史却不算很长统计学的历史却不算很长F统计学两个主要来源:统计学两个主要来源:17世纪德国的国势世纪德国的国势学和学和17世纪英国的政治算术。世纪英国的政治算术。2024/7/22统计学第1

18、章绪论1-18国势学国势学F以国家政治社会情况作为研究对象,运用以国家政治社会情况作为研究对象,运用对比的方法来研究各国实力的强弱。对比的方法来研究各国实力的强弱。F国势学派的主要代表人物:康令国势学派的主要代表人物:康令(H.Conring)和阿亨瓦尔和阿亨瓦尔(G.Achenwall)2024/7/22统计学第1章绪论1-19政治算术政治算术F创始人:英国的配第(创始人:英国的配第(W.Petty)F他在他在1690年出版的年出版的政治算术政治算术一书中以一书中以数字资料为基础,采用数量分析方法研究数字资料为基础,采用数量分析方法研究政治问题,第一次提出统计方法并利用统政治问题,第一次提出

19、统计方法并利用统计方法分析数字资料。计方法分析数字资料。2024/7/22统计学第1章绪论1-20统计学与概率论结合统计学与概率论结合F从从18世纪开始统计学与概率论结合,概率世纪开始统计学与概率论结合,概率论为统计学的进一步发展奠定了坚实的数论为统计学的进一步发展奠定了坚实的数理基础,促进了统计学理论和实践的繁荣理基础,促进了统计学理论和实践的繁荣昌盛。昌盛。F到到19世纪末已经形成了古典统计学(描述世纪末已经形成了古典统计学(描述统计学)的主要框架。统计学)的主要框架。2024/7/22统计学第1章绪论1-21统计学发展迅速统计学发展迅速F20世纪:统计学渗透到社会学、生物学、经济学世纪:

20、统计学渗透到社会学、生物学、经济学等领域。等领域。F哥塞特(哥塞特(W.S.Gosset)1908年以年以Student为笔名为笔名在在生物计量学生物计量学杂志上发表论文杂志上发表论文均值的或然均值的或然误差误差,提出了著名的,提出了著名的t统计量,开创了小样本理统计量,开创了小样本理论先河;论先河;F费雪(费雪(R.A.Fisher)对)对t分布、分布、分布和分布和F分布加分布加以综合研究,提出了方差分析方法和最大似然估以综合研究,提出了方差分析方法和最大似然估计方法,大大促进了推断统计学的发展;计方法,大大促进了推断统计学的发展;2024/7/22统计学第1章绪论1-22统计学发展迅速统计

21、学发展迅速F奈曼(奈曼(J.Neyman)和皮尔逊)和皮尔逊(E.S.Pearson)提出了系统的统计假设检)提出了系统的统计假设检验理论,并对区间估计做出了系统发展,验理论,并对区间估计做出了系统发展,瓦尔德(瓦尔德(A.Wald)提出序贯分析法和统计)提出序贯分析法和统计决策函数理论,进一步丰富了现代统计学决策函数理论,进一步丰富了现代统计学的理论,形成了现代统计学,即推断统计的理论,形成了现代统计学,即推断统计学的框架。学的框架。2024/7/22统计学第1章绪论1-231.3统计学的分类统计学的分类F从统计学的研究内容和方法上分类从统计学的研究内容和方法上分类F描述统计(描述统计(de

22、scriptivestatistics):用数):用数字和图表等方法对数据进行总结和展示,字和图表等方法对数据进行总结和展示,揭示数据的基本特征,为进一步的统计推揭示数据的基本特征,为进一步的统计推断作准备。断作准备。F推断统计(推断统计(inferentialstatistics):根据):根据样本数据对总体进行估计、预测和推断,样本数据对总体进行估计、预测和推断,这是现代统计学的核心内容。这是现代统计学的核心内容。2024/7/22统计学第1章绪论1-24【例例1.5】中国经济增长中国经济增长2008-20092024/7/22统计学第1章绪论1-25【例例1.6】“三驾马车三驾马车”F【

23、根据国家统计局最新的数据显示,在拉根据国家统计局最新的数据显示,在拉动动2009年年GDP增长的增长的“三驾马车三驾马车”中,最中,最终消费对经济增长的贡献率为终消费对经济增长的贡献率为52.5%,拉动,拉动GDP增长增长4.6个百分点,投资对经济增长的个百分点,投资对经济增长的贡献率为贡献率为92.3%,拉动,拉动GDP增长增长8个百分点。个百分点。而国外需求,即而国外需求,即“净出口净出口”,对经济增长,对经济增长的贡献率为负的贡献率为负44.8%,下拉,下拉GDP增长负增长负3.9个百分点。个百分点。2024/7/22统计学第1章绪论1-26【例例1.7】全球最佳全球最佳CEOF全球最佳

24、全球最佳CEO中介绍道,如果根据全中介绍道,如果根据全球各顶尖首席执行官整个任期内的股东投球各顶尖首席执行官整个任期内的股东投资回报率和市值变化来排序,那么分析资回报率和市值变化来排序,那么分析1995年至年至2009年间年间1109位首席执行官后可位首席执行官后可以发现,拥有以发现,拥有MBA学位的平均表现要好于学位的平均表现要好于那些没有的。那些没有的。2024/7/22统计学第1章绪论1-27【例例1.8】零点研究咨询集团零点研究咨询集团F零点研究咨询集团、北汽福田汽车股份有限公司、零点研究咨询集团、北汽福田汽车股份有限公司、新浪汽车联合发布的新浪汽车联合发布的2009福田指数中国居民生

25、福田指数中国居民生活机动性指数研究报告活机动性指数研究报告指出:在参与调查的指出:在参与调查的7个个城市中,北京居民上下班或上下学拥堵经济成本城市中,北京居民上下班或上下学拥堵经济成本为为335.6元元/月,处在各城市之首。其次是广州和月,处在各城市之首。其次是广州和上海,拥堵经济成本分别为上海,拥堵经济成本分别为265.9元元/月和月和253.6元元/月,低于北京。同时,北京居民上下班时间花费月,低于北京。同时,北京居民上下班时间花费也居高位,道路畅通时平均花费时间也居高位,道路畅通时平均花费时间40.1分钟,分钟,而道路拥堵时则达到而道路拥堵时则达到62.3分钟。分钟。2024/7/22统

26、计学第1章绪论1-281.4统计学基本概念统计学基本概念F四个最基本的概念:随机变量、总体、样四个最基本的概念:随机变量、总体、样本和统计量。本和统计量。2024/7/22统计学第1章绪论1-291.4.1随机变量及其分布随机变量及其分布F随机变量(随机变量(randomvariable)是定义在样本空)是定义在样本空间上的实值函数间上的实值函数X=X(),它随样本点,它随样本点的变化而的变化而变化,它用来描述随机试验的结果。变化,它用来描述随机试验的结果。F如果一个随机变量只能取有限个或可列个值,则如果一个随机变量只能取有限个或可列个值,则称它为离散型随机变量(称它为离散型随机变量(disc

27、reterandomvariable););F如果一个随机变量的可能取值充满数轴上的一个如果一个随机变量的可能取值充满数轴上的一个区间,则称它为连续型随机变量(区间,则称它为连续型随机变量(continuousrandomvariable)。)。2024/7/22统计学第1章绪论1-30几个例子几个例子F【例例1.9】抛一颗六面均匀的骰子,观察出现的点抛一颗六面均匀的骰子,观察出现的点数,则出现的点数数,则出现的点数X是一个随机变量。是一个随机变量。F【例例1.10】调查调查100个顾客,考察顾客对某个品牌个顾客,考察顾客对某个品牌笔记本电脑的偏好,记录喜欢这个品牌笔记本电笔记本电脑的偏好,记

28、录喜欢这个品牌笔记本电脑的人数脑的人数X,则,则X是一个随机变量。是一个随机变量。F【例例1.11】为了检验某电子产品的质量,检测它为了检验某电子产品的质量,检测它的使用寿命(以分钟记),则产品的使用寿命的使用寿命(以分钟记),则产品的使用寿命X是是一个随机变量。一个随机变量。F【例例1.12】从一大批产品中随机抽取若干个产品,从一大批产品中随机抽取若干个产品,考察次品率考察次品率X,则,则X是一个随机变量。是一个随机变量。2024/7/22统计学第1章绪论1-31分布函数分布函数F描述随机变量分布的重要工具,可以用来描述随机变量分布的重要工具,可以用来描述离散型和连续型随机变量。描述离散型和

29、连续型随机变量。F定义定义1.1设设X是一个随机变量,对任意实数是一个随机变量,对任意实数x,称,称FF(x)=P(Xx)(1.1)F为随机变量为随机变量X的分布函数(的分布函数(distributionfunction),称),称X服从服从F(x),简记为,简记为XF(x)。2024/7/22统计学第1章绪论1-32概率密度函数概率密度函数F定义定义1.2设随机变量设随机变量X的分布函数是的分布函数是F(x),如果存在一个非负函数如果存在一个非负函数f(x),使得对任意实,使得对任意实数数x,有,有F(1.2)F则称则称f(x)是连续型随机变量是连续型随机变量X的概率密度函的概率密度函数(数

30、(probabilitydensityfunction),简),简称为密度函数。称为密度函数。2024/7/22统计学第1章绪论1-331.4.2总体和总体分布总体和总体分布F什么是总体?什么是总体?F研究对象的全体就称为总体研究对象的全体就称为总体(population)或或母体,总体中的元素称为个体。母体,总体中的元素称为个体。F如果总体包含的个体的数目是有限的,则如果总体包含的个体的数目是有限的,则称之为有限总体;称之为有限总体;F如果总体包含的个体的数目是无限的,就如果总体包含的个体的数目是无限的,就称之为无限总体。称之为无限总体。2024/7/22统计学第1章绪论1-34总体是随机变

31、量总体是随机变量F【例例1.13】一批电子元件共一批电子元件共10万个,研究万个,研究这批电子元件的平均使用寿命,则该批电这批电子元件的平均使用寿命,则该批电子元件的全部使用寿命就构成一个总体,子元件的全部使用寿命就构成一个总体,而每个电子元件的使用寿命就是个体。而每个电子元件的使用寿命就是个体。F【例例1.14】考察某大学一年级新生的身高考察某大学一年级新生的身高情况,则全体新生的身高就构成一个总体,情况,则全体新生的身高就构成一个总体,而其中每个学生的身高就是个体。而其中每个学生的身高就是个体。2024/7/22统计学第1章绪论1-351.4.3样本和样本分布样本和样本分布F样本样本:从总

32、体中取出的部分个体构成的集合从总体中取出的部分个体构成的集合.F样本容量:样本中的个体数目。样本容量:样本中的个体数目。F抽样抽样(sampling):取得样本的过程。:取得样本的过程。F常用抽样方法:简单随机抽样、分层抽样常用抽样方法:简单随机抽样、分层抽样、整群抽样、等距抽样等、整群抽样、等距抽样等第第8章。章。2024/7/22统计学第1章绪论1-36简单随机样本简单随机样本F我们讨论的样本都是指简单随机抽样得到我们讨论的样本都是指简单随机抽样得到的简单随机样本的简单随机样本(simplerandomsample),简称为样本,简称为样本(sample)。F记记(x1,xn)为样本容量为

33、为样本容量为n的样本,其中的样本,其中x1,xn是相互独立的与总体是相互独立的与总体X同分布的同分布的n个个随机变量;随机变量;(x1,xn)的观测值称为样本值,的观测值称为样本值,仍记作仍记作(x1,xn)。2024/7/22统计学第1章绪论1-37样本联合分布函数样本联合分布函数F对于简单随机样本,若总体对于简单随机样本,若总体X的分布函数为的分布函数为F(x),则样本,则样本(x1,xn)的联合分布函数为的联合分布函数为2024/7/22统计学第1章绪论1-38样本联合概率密度函数样本联合概率密度函数F若总体若总体X的概率密度函数为的概率密度函数为f(x),则样本,则样本(x1,xn)的

34、联合概率密度函数为的联合概率密度函数为2024/7/22统计学第1章绪论1-39样本联合概率函数样本联合概率函数F若总体若总体X是离散型随机变量,其概率函数为是离散型随机变量,其概率函数为p(x)=P(X=x),则样本,则样本(x1,xn)的联合概率的联合概率函数为函数为2024/7/22统计学第1章绪论1-401.4.4统计量统计量F抽样获得样本后,根据样本信息推断总体抽样获得样本后,根据样本信息推断总体时,通常需要对样本信息进行加工整理,时,通常需要对样本信息进行加工整理,针对不同的问题构造适当的样本函数,这针对不同的问题构造适当的样本函数,这种用来推断总体的样本函数称为统计量种用来推断总

35、体的样本函数称为统计量(statistic)。)。F统计量是用作统计推断的量,所以统计量统计量是用作统计推断的量,所以统计量不能含有未知参数。不能含有未知参数。2024/7/22统计学第1章绪论1-411.样本均值样本均值F称为样本均值称为样本均值(samplemean);它是总体;它是总体期望期望的无偏估计。的无偏估计。2024/7/22统计学第1章绪论1-422.样本方差样本方差F称为样本方差称为样本方差(samplevariance),其算术,其算术平方根称为样本标准差平方根称为样本标准差(samplestandarddevication)。2024/7/22统计学第1章绪论1-43修正

36、样本方差修正样本方差F称为修正样本方差。称为修正样本方差。F因为修正样本方差是总体方差的无偏估计,因为修正样本方差是总体方差的无偏估计,在实际中,修正样本方差比样本方差更常在实际中,修正样本方差比样本方差更常用,今后提到样本方差通常是指修正样本用,今后提到样本方差通常是指修正样本方差。方差。2024/7/22统计学第1章绪论1-443.样本矩样本矩F称为样本称为样本k阶原点矩和样本阶原点矩和样本k阶中心矩;阶中心矩;F样本矩可以用来估计总体矩,从而获得相样本矩可以用来估计总体矩,从而获得相应的矩估计。应的矩估计。2024/7/22统计学第1章绪论1-454.次序统计量次序统计量F将样本按由小到

37、大排列得到的有序样本将样本按由小到大排列得到的有序样本(x(1),x(n)称为样本的次序统计量(称为样本的次序统计量(orderstatistic),其中,),其中,x(i)为样本的第为样本的第i个次序个次序统计量;统计量;x(1)称为样本的最小次序统计量,称为样本的最小次序统计量,x(n)称为样本的最大次序统计量。称为样本的最大次序统计量。2024/7/22统计学第1章绪论1-465.样本中位数和样本极差样本中位数和样本极差F设设(x(1),x(n)为有序样本,则样本中位数为有序样本,则样本中位数Me(median)定义为定义为2024/7/22统计学第1章绪论1-47样本极差样本极差F样本

38、极差样本极差(range)定义为定义为:R=x(n)-x(1)F它是反映样本值分散程度的量,可以用于它是反映样本值分散程度的量,可以用于推断总体的标准差。推断总体的标准差。2024/7/22统计学第1章绪论1-486.经验分布函数经验分布函数F设设(x(1),x(n)为来自于总体的有序样本,为来自于总体的有序样本,对任意实数对任意实数x,称,称(1.8)是经验分布函数是经验分布函数2024/7/22统计学第1章绪论1-491.5常用分布常用分布F统计量的概率分布称为抽样分布统计量的概率分布称为抽样分布(samplingdistribution),经典的统计),经典的统计推断大多是基于正态分布以

39、及正态变量构推断大多是基于正态分布以及正态变量构造的三个著名分布(造的三个著名分布(分布、分布、t分布和分布和F分分布)布)F下面介绍这四分布和两个离散型分布(二下面介绍这四分布和两个离散型分布(二项分布和泊松分布)的定义及主要性质。项分布和泊松分布)的定义及主要性质。2024/7/22统计学第1章绪论1-501.5.1正态分布正态分布F定义定义1.3如果随机变量如果随机变量X的密度函数为的密度函数为F则称则称X服从参数为服从参数为和和2的正态分布的正态分布(normaldistribution),记为,记为XN(,2),其中其中和和(0)都是常数。都是常数。2024/7/22统计学第1章绪论

40、1-51图图1.1正态分布密度函数的曲线正态分布密度函数的曲线2024/7/22统计学第1章绪论1-52图图1.2正态分布正态分布N(,1),N(,22)和和N(,32)的密度曲线的密度曲线2024/7/22统计学第1章绪论1-53图图1.3标准正态分布的密度曲线标准正态分布的密度曲线2024/7/22统计学第1章绪论1-54正态分布的性质正态分布的性质F性质性质1.1若若XN(,2),则,则E(X)=,Var(X)=2,F性质性质1.2若若XN(,2),则,则F即任何一个一般的正态分布都可以经过简即任何一个一般的正态分布都可以经过简单的线性变换转化为标准正态分布。单的线性变换转化为标准正态分

41、布。2024/7/22统计学第1章绪论1-55标准正态分布的分位数标准正态分布的分位数F对于标准正态分布随机变量对于标准正态分布随机变量X,对给定,对给定,称满足称满足P(XZ)=的是标准正态分布的分的是标准正态分布的分位数。位数。F分位数可以从附表分位数可以从附表1里查到,比如里查到,比如=0.025,查附表查附表1可得可得Z=1.96。2024/7/22统计学第1章绪论1-561.5.2分布分布2024/7/22统计学第1章绪论1-57卡方分布的性质卡方分布的性质2024/7/22统计学第1章绪论1-58图图1.4卡方分布的密度函数卡方分布的密度函数2024/7/22统计学第1章绪论1-5

42、91.5.3t分布分布2024/7/22统计学第1章绪论1-60t分布的性质分布的性质2024/7/22统计学第1章绪论1-61图图1.5t(n)分布与分布与标准正态标准正态N(0,1)的密度函数的密度函数2024/7/22统计学第1章绪论1-621.5.4F分布分布2024/7/22统计学第1章绪论1-63F分布的性质分布的性质2024/7/22统计学第1章绪论1-64图图1.6F(m,n)分布的密度函数分布的密度函数2024/7/22统计学第1章绪论1-651.5.5二项分布二项分布2024/7/22统计学第1章绪论1-661.5.6泊松分布泊松分布2024/7/22统计学第1章绪论1-6

43、71.6正态总体的抽样分布正态总体的抽样分布2024/7/22统计学第1章绪论1-682024/7/22统计学第1章绪论1-692024/7/22统计学第1章绪论1-702024/7/22统计学第1章绪论1-711.7统计软件统计软件SPSS简介简介F常用统计软件常用统计软件FSAS,S-Plus,Minitab,R等。等。FEviews,MATLAB,Excel也可以完成很也可以完成很多统计计算和分析。多统计计算和分析。F“师傅领进门,修行靠个人师傅领进门,修行靠个人”2024/7/22统计学第1章绪论1-72本章小结本章小结F本章介绍了统计学的定义和分类,回顾了统计学的发展历本章介绍了统计

44、学的定义和分类,回顾了统计学的发展历史,介绍了随机变量、总体、样本和统计量这四个基本概史,介绍了随机变量、总体、样本和统计量这四个基本概念,介绍了统计学中使用广泛的六个分布:正态分布、卡念,介绍了统计学中使用广泛的六个分布:正态分布、卡方分布、方分布、t t分布、分布、F F分布、二项分布和泊松分布,给出了正分布、二项分布和泊松分布,给出了正态总体下的抽样分布,最后介绍了统计软件态总体下的抽样分布,最后介绍了统计软件SPSSSPSS的特点。的特点。F统计学是一门研究如何有效地收集数据、整理数据、分析统计学是一门研究如何有效地收集数据、整理数据、分析数据,并根据数据作出推断的方法论科学,分为描述

45、统计数据,并根据数据作出推断的方法论科学,分为描述统计学和推断统计学两个部分,其中推断统计是现代统计的核学和推断统计学两个部分,其中推断统计是现代统计的核心内容;正态分布、心内容;正态分布、 分布、分布、t t分布、分布、F F分布、二项分布分布、二项分布和泊松分布是统计学中六个重要分布,利用样本信息(统和泊松分布是统计学中六个重要分布,利用样本信息(统计量)推断总体时经常会用到这六个分布。计量)推断总体时经常会用到这六个分布。2024/7/22统计学第1章绪论1-73本章小结本章小结F正态分布是钟形对称的分布,它的中心取决于参正态分布是钟形对称的分布,它的中心取决于参数数,而分布的离散程度取

46、决于参数,而分布的离散程度取决于参数的大小;的大小; t t分布的形状很像正态分布,但分布的形状很像正态分布,但“尾部尾部”比正态分比正态分布更厚一些;卡方分布和布更厚一些;卡方分布和F F分布都是只取非负值的分布都是只取非负值的偏态分布;二项分布和泊松分布是应用广泛的两偏态分布;二项分布和泊松分布是应用广泛的两个离散型分布。个离散型分布。FSPSSSPSS是一种常见的功能齐全、操作简单的统计软是一种常见的功能齐全、操作简单的统计软件,本书采用件,本书采用SPSS16.0SPSS16.0完成相应的统计计算。完成相应的统计计算。 2024/7/22统计学第1章绪论1-74案例:新型农村养老保险问

47、题案例:新型农村养老保险问题F零点研究咨询集团零点研究咨询集团2009年发布的年发布的2009年年零点中国公共服务公众评价指数报告零点中国公共服务公众评价指数报告中中关于新型农村养老保险的调查,针对广大关于新型农村养老保险的调查,针对广大农村居民对新农保的认知度、参保意愿、农村居民对新农保的认知度、参保意愿、评价程度等问题进行了分析。评价程度等问题进行了分析。2024/7/22统计学第1章绪论1-75资料来源:零点咨询研究集团资料来源:零点咨询研究集团2009年秋季三期居民生活调查报告年秋季三期居民生活调查报告2024/7/22统计学第1章绪论1-76资料来源:零点咨询研究集团资料来源:零点咨询研究集团2009年零点中国公共服务公众评价指数报告年零点中国公共服务公众评价指数报告2024/7/22统计学第1章绪论1-77讨论讨论F1.1.根据以上资料,你认为农村居民中优先根据以上资料,你认为农村居民中优先选择的缴费标准是多少?选择的缴费标准是多少?F2.2.根据资料,你认为农村居民不愿意参加根据资料,你认为农村居民不愿意参加新农保的主要因素是什么?调查中体现了新农保的主要因素是什么?调查中体现了哪几方面的原因?哪几方面的原因?

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号