统计学作业(1)

上传人:jiups****uk12 文档编号:91021396 上传时间:2019-06-20 格式:DOC 页数:30 大小:911.01KB
返回 下载 相关 举报
统计学作业(1)_第1页
第1页 / 共30页
统计学作业(1)_第2页
第2页 / 共30页
统计学作业(1)_第3页
第3页 / 共30页
统计学作业(1)_第4页
第4页 / 共30页
统计学作业(1)_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《统计学作业(1)》由会员分享,可在线阅读,更多相关《统计学作业(1)(30页珍藏版)》请在金锄头文库上搜索。

1、统计软件学期作业 学 院: 理学院 专 业: 统计学 学 号: 1109030133 姓 名: 郑文星 指导教师: 马建军 一. 在T1.sav中数据为某工厂职工的部分基本信息,其中性别变量中男女分别用1,2表示,按教育程度共分为5类,婚姻状况中用0代表未婚,1代表已婚.(1) 决策者希望了解不同受教育水平已婚职工和未婚职工之间的收入差别,试用一条形图反映有关信息.(2) 绘制一线图,以反映出不同受教育水平的男职工和女职工之间的收入差异.(3) 绘制出反映不同受教育程度员工数量的饼图.(4) 绘制一散点图,反映出不同工作年限类别员工的工作满意程度.(5) 绘制出可以反映不同工作年限类别收入水平

2、的箱图.二 在T2.sav中给出了2007年某股票83个交易日的交易信息.(1) 绘制反映该股票每日价格最高值和最低值信息的高低图.(2)绘制出该股票每个交易日收盘价的时间序列图,并对每日收盘价格进行自相关分析.自相关分析:模型描述模型名称MOD_2序列名1High转换无非季节性差分0季节性差分0季节性期间的长度无周期性最大滞后数16为计算自相关的标准误而假定的过程独立性(白噪音)a显示并绘图所有滞后正在应用来自 MOD_2 的模型指定。a. 不适用于计算偏自相关的标准误。个案处理摘要High序列长度83缺失值数用户缺失0系统缺失0有效值数83可计算的第一滞后数82自相关图序列:High滞后自

3、相关标准 误差aBox-Ljung 统计量值dfSig.b1.688.10840.6661.0002.603.10772.2942.0003.596.106103.5733.0004.359.106115.0524.0005.428.105131.6295.0006.345.104142.5176.0007.181.104145.5717.0008.175.103148.4548.0009.168.102151.1489.00010.240.102156.72810.00011.235.101162.13811.00012.227.100167.27512.00013.146.100169.4

4、1713.00014.068.099169.88814.00015.061.098170.28015.00016-.020.097170.32016.000a. 假定的基础过程是独立性(白噪音)。b. 基于渐近卡方近似。(3)创建一双轴线图,使之同时反映出该股票每日收盘价格和交易量.三 某调查者想考察果汁饮料销售量的影响因素,为此调查者观察了碳酸饮料销售量, 茶饮料销售量, 固体冲泡饮料销售量和咖啡类饮料的销售量,单位均为万升, 全部数据如果T3.sav文件中. 试利用相关分析或偏相关分析研究果汁饮料与碳酸饮料销售量的相关性.相关分析:描述性统计量均值标准差N碳酸饮料销售量45.895318.

5、8392615果汁销售量25.98934.9280115相关性碳酸饮料销售量果汁销售量碳酸饮料销售量Pearson 相关性1.826*显著性(双侧).000平方与叉积的和4968.8491073.660协方差354.91876.690N1515果汁销售量Pearson 相关性.826*1显著性(双侧).000平方与叉积的和1073.660339.993协方差76.69024.285N1515*. 在 .01 水平(双侧)上显著相关。Pearson相关系数为0.825,二者之间的不相关的双侧显著值为0.000F(1,12)。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)46

6、.4602.76216.820.000培养天数-.753.075-.941-10.031.000a. 因变量: 活性(回归系数的显著性检验)由上表得知t=16.820,所以认为该回归系数与零有显著差异,该自变量与因变量之间存在显著地线性关系。五 在文件T5.sav中是研究脑溢血发病机制的数据文件,包括病人和正常人的六项指标, 其中病人为分组序号为”1”, 正常人为”0”. 希望建立上述指标与脑溢血发病之间的联系,以便可以对脑溢血的发病进行早期诊断.(提示可以利用logistic回归或判别分析)判别分析:分析案例处理摘要未加权案例N百分比有效60100.0排除的缺失或越界组代码0.0至少一个缺失

7、判别变量0.0缺失或越界组代码还有至少一个缺失判别变量0.0合计0.0合计60100.0上图给出了样本数量、有效值和剔除值的相关信息。表5-2组统计量分组均值标准差有效的 N(列表状态)未加权的已加权的0总胆固醇181.200031.178463030.000甘油三脂144.200075.811653030.000高密度胆固醇48.866713.069403030.000低密度胆固醇100.766729.196933030.000载脂蛋白A11.1377.256583030.000载脂蛋白B.8097.174133030.0001总胆固醇212.966740.007313030.000甘油三脂

8、179.500082.077653030.000高密度胆固醇36.70006.884013030.000低密度胆固醇133.266740.401383030.000载脂蛋白A11.0443.210183030.000载脂蛋白B.9320.225553030.000合计总胆固醇197.083339.001216060.000甘油三脂161.850080.331066060.000高密度胆固醇42.783312.036806060.000低密度胆固醇117.016738.598546060.000载脂蛋白A11.0910.237256060.000载脂蛋白B.8708.209086060.000上

9、图给出了各组和所有预测的均值、标准差和加权与未加权的有效值。表5-3特征值函数特征值方差的 %累积 %正则相关性1.631a100.0100.0.622a. 分析中使用了前 1 个典型判别式函数。表5-4Wilks 的 Lambda函数检验Wilks 的 Lambda卡方dfSig.1.61326.9136.000上图给出了Wilks的Lambda检验的结果,从检验结果可以看出,引入的变量对提高分类精度是有作用的。表5-5标准化的典型判别式函数系数函数1总胆固醇.186甘油三脂-.017高密度胆固醇-.985低密度胆固醇.316载脂蛋白A1.338载脂蛋白B.166表5-6结构矩阵函数1高密度

10、胆固醇-.746低密度胆固醇.590总胆固醇.567载脂蛋白B.389甘油三脂.286载脂蛋白A1-.255判别变量和标准化典型判别式函数之间的汇聚组间相关性 按函数内相关性的绝对大小排序的变量。上图给出了判别函数的系数与结构矩阵,可以看出,所有变量均在判别分析中使用。表5-7组质心处的函数分组函数10-.7811.781在组均值处评估的非标准化典型判别式函数上图给出了组重心处的判别函数值。表5-8组的先验概率分组先验用于分析的案例未加权的已加权的0.5003030.0001.5003030.000合计1.0006060.000上图给出了两个组的先验概率。预测的分组结果作为新的变量被保存,从中我们可以看出这60位人员的分组,并可以看出spss对未分类观测进行的分类,分类被保存在“Dis_1”变量中,“1”表示病人,“0”表示正常人,与我们在建立变量时的设置有微小的出入,有13个分组不一样。六 根据我国历年钢产量的数据,(可以查或

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号