如何做统计分析

上传人:re****.1 文档编号:568616050 上传时间:2024-07-25 格式:PPT 页数:81 大小:1.92MB
返回 下载 相关 举报
如何做统计分析_第1页
第1页 / 共81页
如何做统计分析_第2页
第2页 / 共81页
如何做统计分析_第3页
第3页 / 共81页
如何做统计分析_第4页
第4页 / 共81页
如何做统计分析_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《如何做统计分析》由会员分享,可在线阅读,更多相关《如何做统计分析(81页珍藏版)》请在金锄头文库上搜索。

1、如何做统计分析?职业规划部:张国华122目录什么是统计?1如何区分数据类型?如何区分数据类型?2怎样利用统计分析方法?怎样利用统计分析方法?3233什么是统计呢?344什么是统计?455你想过下面的问题吗?你想过下面的问题吗?当公司推行客户当公司推行客户发货需保价时,告发货需保价时,告知客户发货时需要知客户发货时需要购买保险。说多了,购买保险。说多了,客户会觉得高,以客户会觉得高,以后不来发货;说少后不来发货;说少了,公司会得不偿了,公司会得不偿失,也是损失。到失,也是损失。到底这个保价额是怎底这个保价额是怎样决定的呢?样决定的呢?保价这么高?这是公司定的566你想过下面的问题吗?你想过下面的

2、问题吗? 任何客户都有任何客户都有一个信用问题。有一个信用问题。有些客户试图发货时些客户试图发货时采用月结或欠款方采用月结或欠款方式付账时,如何根式付账时,如何根据它们的财务和商据它们的财务和商业资料来判断一个业资料来判断一个客户的信用等级呢客户的信用等级呢?这次我可以欠这次我可以欠款吗?款吗?可以!可以!677你想过下面的问题吗?你想过下面的问题吗? 如何通过员工调查来得到性别、年龄、职如何通过员工调查来得到性别、年龄、职业、收入等各种因素与员工对某项事物(比业、收入等各种因素与员工对某项事物(比如公司某项制度或政策)的态度的关系呢?如公司某项制度或政策)的态度的关系呢?他们会认同这项政策吗

3、?788你想过下面的问题吗?你想过下面的问题吗? 绩效的高低与领导者花在沟通上时间绩效的高低与领导者花在沟通上时间的多寡成正比?的多寡成正比?899 统计是什么?一般来说,统计先从现实世界收集数一般来说,统计先从现实世界收集数据(信息),如营业额增长据(信息),如营业额增长然后,根据数据作出判断,称为模型然后,根据数据作出判断,称为模型模型是从数据产生的模型是从数据产生的模型也需要根据新的信息来改进模型也需要根据新的信息来改进不存在完美的模型不存在完美的模型模型的最终结局都是被更能够说明现模型的最终结局都是被更能够说明现实世界的新模型所取代实世界的新模型所取代91010一句话统计学(统计学(s

4、tatistics)是用以收集数据,分析数是用以收集数据,分析数据和由数据得出结论的一据和由数据得出结论的一组概念,原则和方法。组概念,原则和方法。101111统计学的理念111212数据类型的分类数据类型数据类型品质型数据品质型数据(定性数据)(定性数据)数值型数据数值型数据(定量数据)(定量数据)121313数据类型举例例:花名册信息例:花名册信息籍贯:广东广州籍贯:广东广州姓名:张三姓名:张三性别:男性别:男民族:汉民族:汉家庭成员:家庭成员:4年龄:年龄:50 (连续变量连续变量)身高:身高:172cm131414不同类型数据处理办法141515SPSS操作界面-定义变量151616S

5、PSS操作界面-输入数据161717数值型数值型数据数据品质型品质型数据数据171818如何选取统计方法?该用哪该用哪种分析种分析方法?方法?181919关于美国选举的两个例子关于美国选举的两个例子(1)谁会在谁会在1936选举中获胜选举中获胜 ?Alf London还是还是 F.D.R.(罗斯福罗斯福)? Literary Digest (文摘文摘)送出一千万份问送出一千万份问卷卷(返回二百四十万份返回二百四十万份)后后,预测预测London 会赢会赢. 而而Gallop(盖洛普盖洛普)只问了只问了5000人说人说 Roosevelt (罗斯福罗斯福)会赢会赢. 最后罗斯福和盖洛普都赢了最后

6、罗斯福和盖洛普都赢了.文摘文摘倒闭倒闭了了192020关于美国选举的两个例子关于美国选举的两个例子(2)谁会在谁会在1948选举中获胜选举中获胜 ? Thomas Dewey还是还是Harry Truman(杜鲁门杜鲁门)? Crossley, Gallop(盖洛普盖洛普), Roper所有都所有都预测预测Dewey 会赢会赢(每个机构用每个机构用了了5000个问卷个问卷). 最后最后(包括盖洛普包括盖洛普)他们都输了他们都输了, 而杜鲁而杜鲁门赢了门赢了.202121抽样方法一、简单随机抽样法二、系统抽样法三、分层抽样法四、整群抽样法212222抽样调查考虑因素时间时间/人力及预算成本人力及

7、预算成本操作过程的精确性操作过程的精确性破坏性检验破坏性检验考考考考虑虑虑虑因因因因素素素素222323样本大小(1) 利与弊利与弊样本太小样本太小结果不具代表性结果不具代表性,导致抽样误差可能导致抽样误差可能过大过大样本过大样本过大可以降低抽样误差可以降低抽样误差,增加了成本负担,包括增加了成本负担,包括时间,人力等时间,人力等一般样本以一般样本以50-5000之间为宜。之间为宜。232424样本大小(2)两个公式:两个公式:当估计当估计时,时, N=Z2* 2/ 2其中:其中:Z为某一置信度所对应的临界值(可由正态分布表差得)为某一置信度所对应的临界值(可由正态分布表差得) 为总体标准差(

8、通常以样本标准差为总体标准差(通常以样本标准差S取代)取代) 为可容许的误差范围(可有调查者自己决定可允许的误差)为可容许的误差范围(可有调查者自己决定可允许的误差)当估计当估计p时,时, N=Z2* p*(1-p)/ 2其中:其中:Z为某一置信度所对应的临界值(可由正态分布表差得)为某一置信度所对应的临界值(可由正态分布表差得) p为总体比例为总体比例(以样本比例以样本比例p取代取代) 为可容许的误差范围(可有调查者自己决定可允许的误差)为可容许的误差范围(可有调查者自己决定可允许的误差) 242525举例=NORMINV(A2,0,1)=B22*C2*(1-C2)/D22252626统计学

9、的分类262727 统计分析方法根据研究方法的不同可分为描述性统计和推断性统计两大类。描述性统计描述性统计:就是运用各种表格、图形和数字来概括总体数量特征的方法。最常用的就是平均数。推断性统计推断性统计:在人们可以控制的范围内,根据样本资料的特征,对总体的特征作出估计和预测的方法。272828描述性统计(1)282929 描述性统计(2)293030 描述性统计(3)303131描述性统计离散程度离散程度集中趋势集中趋势313232SPSS和EXCEL比较峰度峰度偏度偏度总分平均156.8998738标准误差0.343950224中位数158众数164标准差23.7151123方差562.40

10、65516峰度0.656194342偏度-0.334991065区域176最小值44最大值220求和745902观测数4754最大(1)220最小(1)44置信度(95.0%)0.674301746323333均值,中位数,众数对称种型分布对称种型分布对称种型分布对称种型分布对称种型分布对称种型分布 均值均值均值均值均值均值 = = = 中位数中位数中位数中位数中位数中位数 = = = 众数众数众数众数众数众数左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众

11、数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数 均值均值均值均值均值均值333434直方图343535353636363737373838几种常用统计方法线性回归分析线性回归分析卡方检验分析卡方检验分析均值比较分析均值比较分析383939均值比较分析(1)394040均值比较分析(2)404141均值比较分析(3)t-检验: 成对双样本均值分析变量 1变量 2平均0.6951984430.7371432方差0.0229945320.0091781观测值1818泊松相关系数0.145129924假设平均差0df17t Stat-1.06433258P(T=t) 单尾0.151031

12、454t 单尾临界1.739606716P(T=t) 双尾0.302062908t 双尾临界2.109815559414242单因素方差分析(1)424343单因素方差分析(2)434444单因素方差分析(3)444545单因素方差分析(4)454646单因素方差分析(5)464747单因素方差分析(6)描述统计描述统计方差齐性检验方差齐性检验方差分析结果方差分析结果474848单因素方差分析(7)两两比较两两比较484949多因素方差分析(1)495050多因素方差分析(2)505151多因素方差分析(3)515252多因素方差分析(4)525353多因素方差分析(5)535454多因素方差

13、分析(6)545555多因素方差分析(7)555656多因素方差分析(8)565757多因素方差分析(9)575858多因素方差分析(10)区域区域NSubset123411,384150.895839155.402222158.48158.488236158.92158.929505159.43159.434408159.82159.823221160.19160.196787162.37162.377152165.14Sig.1.0000.0590.2100.107585959不同部门员工对不同部门员工对工资水平的满意度工资水平的满意度是否有差异?是否有差异?596060卡方检验卡方检验员

14、工性质员工性质满意度满意度合计合计12345(经营)1623421061471732009(运营)2574111140495622165(职能)39812256210387(会计类)4241121281193合计合计130875254710561464754606161卡方检验(卡方检验(1)616262卡方检验(卡方检验(2)626363卡方检验(卡方检验(3)636464卡方检验(卡方检验(4)646565卡方检验(卡方检验(5)656666卡方检验(卡方检验(6)666767卡方检验(卡方检验(7)676868卡方检验(卡方检验(8)686969卡方检验(卡方检验(9)分布表分布表结果结

15、果697070Chi-Square Tests ValuedfAsymp. Sig. (2-sided)Pearson Chi-Square33.378120.001Likelihood Ratio37.283120.000Linear-by-Linear Association11.22610.001N of Valid Cases4,754 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 5.28.707171统计预测统计预测的步骤统计预测的步骤确定预测目的搜索和审核资料分析预测误差,改进预测模型选择预测模型和方法提出预测报告717272预测方法线性回归模型727373线性回归模型737474747575757676767777777878人数人数=600.038+171.926*序数序数787979预测值798080谢谢!80818181 让我们携手共进让我们携手共进 用用 心心 沟沟 通通 天天 地地 人人 和和81

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号