统计学分析题

上传人:M****1 文档编号:569797468 上传时间:2024-07-31 格式:PPT 页数:55 大小:1,007KB
返回 下载 相关 举报
统计学分析题_第1页
第1页 / 共55页
统计学分析题_第2页
第2页 / 共55页
统计学分析题_第3页
第3页 / 共55页
统计学分析题_第4页
第4页 / 共55页
统计学分析题_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《统计学分析题》由会员分享,可在线阅读,更多相关《统计学分析题(55页珍藏版)》请在金锄头文库上搜索。

1、统计学原理分析题第4章 数据的概括性度量分析要点:1. 离散系数2. 经验法则3. 标准化分数例1o一项关于大学生体重状况的研究发现,男生平均体重为60kg,标准差为5kg;女生平均体重为50kg,标准差为5kg。回答以下问题:男生体重差异大还是女生体重差异大?估计男生体重在5565kg之间的百分比?估计女生体重在4060kg之间的百分比?例1因标准差相等,应当计算并比较离散系数:55kg65kg等于平均数加减1个标准差,根据经验法则,大约68%的男生体重介于该范围。40kg60kg等于平均数加减2个标准差,根据经验法则,大约95%的女生体重介于该范围。例2o一生产线平均每天产量3700件,标

2、准差50件。如果某天产量落在平均产量的2个标准差以外,就认为生产线“失去控制”,以下是一周的产量,问哪几天失去了控制?日期周1周2周3周4周5周6周日产量3850367036903720361035903700例2o计算标准化分数(Z)日期周1周2周3周4周5周6周日X3850367036903720361035903700Z3-0.6-0.20.4-1.8-2.20结论:周一和周六的产量超出了控制范围(-2 z Probability & Prob. DistributionsNormalNormal ProbabilitiesCommon DataMean200Standard Devia

3、tion20Probability for X =X Value230Z Value1.5P(XProbability & Prob. DistributionsNormal结论:错误在190210之间的概率为38.29%Probability for a RangeFrom X Value190To X Value210Z Value for 190-0.5Z Value for 2100.5P(X=190)0.3085P(X=210)0.6915P(190=XProbability & Prob. DistributionsNormalNormal ProbabilitiesCommon

4、DataMean30Standard Deviation0.6532Probability for X X Value31.84Z Value2.8169014P(X31.84)0.0024抽取的顾客平均消费在31.84美元以上的概率是0.0024;该抽样结果为小概率事件(且概率相当小),因此公司先前的假定极有可能是错误的。例2:样本比例的分布o假定支持某项提案的真实选民比例为 p = 0.4。现在随机调查200个选民,问支持该提案的比例在0.4到0.45之间的概率是多少?例2:样本比例的分布o确定样本比例的分布例2:样本比例的分布o计算概率nPHstatProbability & Prob.

5、 DistributionsNormal支持该提案的比例在0.4到0.45之间的概率是42.55%第7章 参数估计要点:1. 估计总体均值的置信区间2. 估计总体比例的置信区间已知灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命如下。建立该批灯泡平均使用寿命95%的置信区间灯泡使用寿命数据灯泡使用寿命数据 (小时)(小时) 1510152014801500145014801510152014801490153015101460146014701470例1:估计总体均值的置信区间例1:估计总体均值的置信区间oPHstatConfidence Intervals Estimat

6、e for the Mean, sigma unknown例1:估计总体均值的置信区间该种灯泡平均使用寿命的置信区间为:1476.8h1503.2hDataSample Standard Deviation24.76Sample Mean1490Sample Size16Confidence Level95%Intermediate CalculationsStandard Error of the Mean6.19Degrees of Freedom15t Value2.13Interval Half Width13.19Confidence IntervalInterval Lower L

7、imit1476.80Interval Upper Limit1503.20例2:估计总体比例的置信区间o某城市想要估计下岗女性职工比例,随机地抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间例2:估计总体比例的置信区间Sample Size100Number of Successes65Confidence Level95%Confidence IntervalInterval Lower Limit0.5565Interval Upper Limit0.7434oPHstatConfidence IntervalsEstimate for

8、 the proportion该城市下岗职工中女性比例的置信区间为:55.65%74.35%第8章 假设检验要点:1. 总体均值的假设检验2. 总体比例的假设检验总体均值的检验o总体标准差已知时,用正态分布确定样本发生概率o总体标准差已知时,用 t 分布确定样本发生概率,用样本标准差s代替应用PHstat例:总体均值的正态检验某批发商欲从厂家购进一批灯泡,合同规定灯泡平均使用寿命不低于1000小时。已知标准差为200小时,现随机抽取100支灯泡,测得平均寿命为960小时。问该批灯泡的平均寿命是否低于合同规定?原假设显著性水平总体标准差样本容量样本均值左侧检验建立假设:样本信息必须支持备选假设

9、H1例:拒绝原假设时某批发商欲从厂家购进一批灯泡,合同规定灯泡平均使用寿命不低于1000小时,已知标准差为200小时。现随机抽取100支灯泡,测得平均寿命为960小时。问该批灯泡的平均寿命是否低于合同规定?DataNull Hypothesis m m=1000Level of Significance0.05Lower-Tail TestLower Critical Value-1.644p-Value0.0227Reject the null hypothesis决策:P= 0.022 = 0.05,不能拒绝原假设。结论:不能认定该批灯泡的平均寿命低于合同规定。DataNull Hypot

10、hesis m m=1000Level of Significance0.05Population Standard Deviation200Sample Size100Sample Mean980Lower-Tail TestLower Critical Value-1.644p-Value0.158Do not reject the null hypothesis总体比例的检验应用PHstat例:总体比例的检验一项统计结果声称,某市老年人口(65岁以上)的比重为14.7%,为检验该项统计是否可靠,现随机抽选400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为1

11、4.7%的看法?样本中具有某种特征的样本个数例:总体比例的检验一项统计结果声称,某市老年人口(65岁以上)的比重为14.7%,为检验该项统计是否可靠,现随机抽选400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?DataNull Hypothesis p=0.147Level of Significance0.05Number of Successes57Sample Size400Two-Tail TestLower Critical Value-1.95Upper Critical value1.95p-Value0.799Do not re

12、ject the null hypothesis决策:P= 0.0799 = 0.05,不能拒绝原假设。结论:该市老年人口比重为14.7% 。第10章 方差分析要点:1. 单因素方差分析2. 双因素方差分析例:单因素方差分析o一管理咨询机构为不同层次管理者提供培训,为评价培训效果,对随机抽取的不同层次管理者进行满意度调查,评分结果如下:高级管理者中级管理者低级管理者78579688571079941088问:管理者的层次评分是否对评分有显著影响?问:管理者的层次评分是否对评分有显著影响?例:单因素方差分析方差分析差异源SSdfMSFP-value组间29.60952214.8047611.75

13、5730.000849组内18.89048151.259365P-value(组间)工具数据分析方差分析: 可重复双因素分析三次重复试验,即每个组内包含3个数据例:可重复双因素方差分析方差分析差异源SSdfMSFP-valueF crit样本(行)1736.2222868.111134.305169.18E-083.402826列1078.3333359.444414.204171.57E-053.008787交互503.3333683.888893.3150380.016052.508189内部607.33332425.30556P-value(行)0.05,拒绝H0,说明超市位置对销售量有

14、显著影响P-value(列)0.05 ,拒绝H0,说明竞争者数量对销售量有显著影响P-value(交互)0.05 ,拒绝H0,说明超市位置和竞争者数量对销售量有显著的交互影响第11章 一元线性回归要点:建立一元线性回归模型,解释并检验回归系数例:P347_11.7oPHStat | regression | simple linear regression 输入待预测的自变量值输入预测区间的置信水平例:P347_11.7Coefficients标准误差t StatP-valueIntercept430.18972.1545.9620.000337航班正点率(x)-4.700620.9478-4

15、.95900.001108解释回归系数:回归系数-4.7002表示航班正点率每增加1%,旅客投诉次数平均下降4.7次检验回归系数显著性:P-value=0.00110.05,表明回归系数显著,即航班正点率对投诉次数有显著影响例:P347_11.7DataDataX ValueX Value8080Confidence LevelConfidence Level95%95%Intermediate CalculationsPredicted Y (YHat)54.139For Average YFor Average YInterval Half Width16.479Confidence In

16、terval Lower LimitConfidence Interval Lower Limit37.65937.659Confidence Interval Upper LimitConfidence Interval Upper Limit70.61970.619For Individual Response YFor Individual Response YInterval Half Width46.567Prediction Interval Lower LimitPrediction Interval Lower Limit7.57187.5718Prediction Inter

17、val Upper LimitPrediction Interval Upper Limit100.70100.70航班正点率为80%时,估计投诉次数为54.139次航班正点率为80%时,投诉次数的置信区间为(54.13916.479)航班正点率为80%时,投诉次数的预测区间为(54.13946.567)第9章 列联分析例:列联分析o某报社想了解读者的阅读习惯是否与文化程度有关,随机调查了254位读者,得到以下数据:文化程度阅读习惯大学以上大学和大专高中高中以下早上看6131417中午看121688晚上看3840116有空看2122913例:列联分析例:列联分析粘贴例:列联分析DataData

18、Level of SignificanceLevel of Significance0.050.05Number of Rows4Number of Columns4Degrees of Freedom9ResultsResultsCritical ValueCritical Value16.91916.919Chi-Square Test StatisticChi-Square Test Statistic31.861131.8611p-Value-Value0.000210.00021Reject the null hypothesisReject the null hypothesis决

19、策:决策:p = 0.00021 = 0.05,拒绝H0结论:结论:阅读习惯与文化水平有关。第12章 多元线性回归例:馅饼模型WeekPie SalesPrice($)Advertising($100s)13505.503.324607.503.333508.003.044308.004.553506.803.063807.504.074304.503.084706.403.794507.003.5104905.004.0113407.203.5123007.903.2134405.904.0144505.003.5153007.002.71.写出多元回归方程并解释回归系数;2.检验模型总体的

20、显著性和回归系数的显著性( =0.05);3.回归方程的解释比例(R2);4.估计回归系数的置信区间(置信水平95%);5.当价格为 5.5、广告费为350时,预测平均每周的馅饼销量和3季度第一周的馅饼销量 (置信水平95%) 。用 PHstat作回归分析PHstatRegressionMultiple linear regressionPHstat 输出结果回归统计回归统计Multiple R0.722 R Square0.521 Adjusted R Square0.442 标准误差标准误差47.463 观测值观测值15方差分析方差分析dfSSMSFSignificance F回归分析回归

21、分析229460.027 14730.013 6.539 0.012 残差残差1227033.306 2252.776 总计总计1456493.333 Coefficients标准误差标准误差t StatP-valueLower 95%Upper 95%Intercept306.526 114.254 2.683 0.020 57.588 555.464 Price -24.975 10.832 -2.306 0.040 -48.576 -1.374 Advertising 74.131 25.967 2.855 0.014 17.553 130.709 1.写出回归方程并解释回归系数 1 =

22、 -24.975: 如果广告费不变,价格每增加一美元,每周销量将平均下降24.975单位。 2 = 74.131:如果价格不变,广告费每增加100美元,每周销量将平均增长74.131单位。2.检验总体显著性和回归系数显著性o总体显著性检验o回归系数显著性检验p =0.012 =0.05,拒绝H0 结论:至少有一个自变量显著影响因变量。p (价格) = 0.0398 0.05,拒绝H0;p (广告费) = 0.0145 0.05,拒绝H0。结论:价格和广告费对销量均有显著影响价格和广告费可以解释销量变动的52.1% 。如果广告费不变,价格每增加1美元,销量将下降 1.37 至 48.58个单位;如果价格不变,广告费每增加100美元,销量将上升 17.55 至 130.71个单位;3.回归方程的解释比例(R2)4.估计回归系数的置信区间5.预测oPHStat | regression | multiple regression 输入自变量值5.预测预测平均每周的馅饼销量为391至466个单位预测3季度第一周的馅饼销量为318至538个单位

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号