基本描述统计

上传人:pu****.1 文档编号:567302151 上传时间:2024-07-19 格式:PPT 页数:61 大小:1.61MB
返回 下载 相关 举报
基本描述统计_第1页
第1页 / 共61页
基本描述统计_第2页
第2页 / 共61页
基本描述统计_第3页
第3页 / 共61页
基本描述统计_第4页
第4页 / 共61页
基本描述统计_第5页
第5页 / 共61页
点击查看更多>>
资源描述

《基本描述统计》由会员分享,可在线阅读,更多相关《基本描述统计(61页珍藏版)》请在金锄头文库上搜索。

1、频数分布表频数分布表利用频数分布表可以方便地对数据按组进行归类整利用频数分布表可以方便地对数据按组进行归类整利用频数分布表可以方便地对数据按组进行归类整利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平理,形成各变量的不同水平理,形成各变量的不同水平理,形成各变量的不同水平( ( ( (分组分组分组分组) ) ) )的频数分布表及图的频数分布表及图的频数分布表及图的频数分布表及图形,以便对各变量的数据特征和观测量的分布状况形,以便对各变量的数据特征和观测量的分布状况形,以便对各变量的数据特征和观测量的分布状况形,以便对各变量的数据特征和观测量的分布状况有一个概括的认识有一个概

2、括的认识有一个概括的认识有一个概括的认识;单变量频数分布分析单变量频数分布分析单变量频数分布分析单变量频数分布分析, , , ,可通过可通过可通过可通过FrequenciesFrequenciesFrequenciesFrequencies频数分布对频数分布对频数分布对频数分布对话框话框话框话框( ( ( (AnalyzeAnalyzeAnalyzeAnalyze Descriptive Statistics FrequenciesDescriptive Statistics FrequenciesDescriptive Statistics FrequenciesDescriptive St

3、atistics Frequencies) ) ) )来具体实现来具体实现来具体实现来具体实现。例例1已知已知已知已知5 5 5 5种软饮料购买频数的原始记录,分析各种软饮料购买频数的原始记录,分析各种软饮料购买频数的原始记录,分析各种软饮料购买频数的原始记录,分析各种饮料的频数分布情况种饮料的频数分布情况种饮料的频数分布情况种饮料的频数分布情况(数据集(数据集(数据集(数据集1 1 1 1)。可口可乐可口可乐新新 骑骑 士士可口可乐可口可乐雪雪 碧碧雪雪 碧碧杏杏 仁仁 露露可口可乐可口可乐可口可乐可口可乐醒醒 目目可口可乐可口可乐新新 骑骑 士士可口可乐可口可乐可口可乐可口可乐雪雪 碧碧可

4、口可乐可口可乐醒醒 目目可口可乐可口可乐雪雪 碧碧杏杏 仁仁 露露杏杏 仁仁 露露雪雪 碧碧雪雪 碧碧可口可乐可口可乐可口可乐可口可乐雪雪 碧碧新新 骑骑 士士雪雪 碧碧可口可乐可口可乐雪雪 碧碧醒醒 目目雪雪 碧碧雪雪 碧碧杏杏 仁仁 露露可口可乐可口可乐可口可乐可口可乐杏杏 仁仁 露露可口可乐可口可乐杏杏 仁仁 露露新新 骑骑 士士杏杏 仁仁 露露可口可乐可口可乐新新 骑骑 士士雪雪 碧碧可口可乐可口可乐杏杏 仁仁 露露可口可乐可口可乐醒醒 目目可口可乐可口可乐醒醒 目目雪雪 碧碧FrequenciesFrequenciesFrequenciesFrequencies对话框对话框对话框对话

5、框输出频数分布表输出频数分布表输出频数分布表输出频数分布表选择要求输选择要求输选择要求输选择要求输出的统计量出的统计量出的统计量出的统计量设置图形的类设置图形的类设置图形的类设置图形的类型及坐标轴型及坐标轴型及坐标轴型及坐标轴设置频数表设置频数表设置频数表设置频数表输出格式输出格式输出格式输出格式四分位数四分位数四分位数四分位数 将数据分为设将数据分为设将数据分为设将数据分为设定的相等分数定的相等分数定的相等分数定的相等分数百分位数百分位数百分位数百分位数均值均值均值均值中位数中位数中位数中位数众数众数众数众数总和总和总和总和偏度偏度偏度偏度峰度峰度峰度峰度标准差标准差标准差标准差方差方差方差

6、方差全距全距全距全距最小值最小值最小值最小值最大值最大值最大值最大值均值标准误均值标准误均值标准误均值标准误FrequenciesFrequenciesFrequenciesFrequencies对话框对话框对话框对话框 四分位数:四分位数:将一组个案由小到大(或由大到小)排序后,用将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与个点将全部数据分为四等份,与3个点上相对应的变量称为四个点上相对应的变量称为四分位数,分别记为分位数,分别记为Q1(第一四分位数)、(第一四分位数)、Q2(第二四分位数)、(第二四分位数)、Q3(第三四分位数)。其中,(第三四分位数)。其中,Q

7、3到到Q1之间的距离又称为四分之间的距离又称为四分位距(位距(interquartile range),记为,记为IQR。四分位差四分位差(Quartile deviation )为为1/2 IQR。百分位数:百分位数:将一组数据由小到大(或由大到小)排序后分割将一组数据由小到大(或由大到小)排序后分割为为100等份,与等份,与99个分割点位置上相对应的变量称为百分位数,个分割点位置上相对应的变量称为百分位数,分别记为分别记为P1,P2,P99,表示,表示1%的数据落在的数据落在P1下,下,2%的的数据落在数据落在P2下,下,99%落在落在P99下。下。四分位数、十分位数、百分位数四分位数、十

8、分位数、百分位数四分位数、十分位数、百分位数四分位数、十分位数、百分位数峰度:描述某变量所有取值分布形态陡缓程度的统计量。与峰度:描述某变量所有取值分布形态陡缓程度的统计量。与正态分布相比较,峰度为正态分布相比较,峰度为0表示其数据分布与正态分布的陡缓表示其数据分布与正态分布的陡缓程度相同;峰度大于程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。表示比正态分布的高峰要平坦,为平顶峰。计算公式为计算公式为偏度:描述某变量取值分布对称性的统计量。偏度:描述某变量取值分布对称性的统计量。与正态

9、分布相与正态分布相比较,偏度为比较,偏度为0表示其数据分布形态与正态分布偏度表示其数据分布形态与正态分布偏度x相同;相同;偏度大于偏度大于0为正偏或右偏,即有一条长尾巴拖在右边;偏度小为正偏或右偏,即有一条长尾巴拖在右边;偏度小于于0表示负偏或左偏,有一条长尾拖在左边。而偏度的绝对值表示负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。数值越大表示分布形态的偏斜程度越大。计算公式为计算公式为峰度、偏度峰度、偏度峰度、偏度峰度、偏度不输出图形不输出图形不输出图形不输出图形条形图条形图条形图条形图饼形图饼形图饼形图饼形图直方图直方图直方图直方图选择频数表排列顺序选择

10、频数表排列顺序选择频数表排列顺序选择频数表排列顺序按变量值升序排列按变量值升序排列按变量值升序排列按变量值升序排列按变量值降序排列按变量值降序排列按变量值降序排列按变量值降序排列按变量值发生频数升序排列按变量值发生频数升序排列按变量值发生频数升序排列按变量值发生频数升序排列按变量值发生频数降序排列按变量值发生频数降序排列按变量值发生频数降序排列按变量值发生频数降序排列选择多变量输出表格设置选择多变量输出表格设置选择多变量输出表格设置选择多变量输出表格设置控制频数表输出的分类数控制频数表输出的分类数控制频数表输出的分类数控制频数表输出的分类数FrequenciesFrequenciesFrequ

11、enciesFrequencies对话框对话框对话框对话框SPSSSPSS输出结果:输出结果:本例均选系统默认项本例均选系统默认项本例均选系统默认项本例均选系统默认项描述统计分析描述统计分析描述统计分析过程,是通过计算均值、算术和、标描述统计分析过程,是通过计算均值、算术和、标描述统计分析过程,是通过计算均值、算术和、标描述统计分析过程,是通过计算均值、算术和、标准差、极值、方差、均值、标准误等统计量来描述样准差、极值、方差、均值、标准误等统计量来描述样准差、极值、方差、均值、标准误等统计量来描述样准差、极值、方差、均值、标准误等统计量来描述样本数据的集中趋势、离散趋势及分布特征;本数据的集中

12、趋势、离散趋势及分布特征;本数据的集中趋势、离散趋势及分布特征;本数据的集中趋势、离散趋势及分布特征;描述统计分析过程,可通过描述统计分析过程,可通过描述统计分析过程,可通过描述统计分析过程,可通过DescriptivesDescriptivesDescriptivesDescriptives对话框对话框对话框对话框( ( ( (AnalyzeAnalyzeAnalyzeAnalyze Descriptive StatisticsDescriptive StatisticsDescriptive StatisticsDescriptive Statistics DescriptivesDesc

13、riptivesDescriptivesDescriptives) ) ) ) 来具来具来具来具体实现体实现体实现体实现。序号序号性别性别年龄年龄身高身高体重体重序号序号性别性别年龄年龄身高身高体重体重123456789101112131415男男男男男男男男男男男男女女女女女女女女女女男男男男男男男男131313131313131313131314141414156.0155.0144.6161.5161.3158.0161.0162.0164.3144.0157.9176.1168.0164.5153.047.537.838.641.643.347.347.147.033.833.849.

14、254.550.044.058.0161718192021222324252627282930女女女女女女女女女女男男男男男男男男男男女女女女女女女女女女141414141415151515151515151515164.7160.5147.0153.2157.9166.0169.0170.0165.1172.0159.4161.3158.0158.6169.044.153.036.430.140.457.058.551.058.055.044.745.444.342.851.1例例2已知三十名学生的身高与体重数据,要求对已知三十名学生的身高与体重数据,要求对已知三十名学生的身高与体重数据,要

15、求对已知三十名学生的身高与体重数据,要求对其进行简单的描述统计分析其进行简单的描述统计分析其进行简单的描述统计分析其进行简单的描述统计分析( ( ( (数据集数据集数据集数据集2) 2) 2) 2)。DescriptivesDescriptivesDescriptivesDescriptives对话框对话框对话框对话框指定统计量指定统计量指定统计量指定统计量与输出结果与输出结果与输出结果与输出结果显示的顺序显示的顺序显示的顺序显示的顺序计算并保存所选变量计算并保存所选变量计算并保存所选变量计算并保存所选变量的标准化值,公式为的标准化值,公式为的标准化值,公式为的标准化值,公式为Descript

16、ivesDescriptivesDescriptivesDescriptives对话框对话框对话框对话框均值均值均值均值合计合计合计合计偏度偏度偏度偏度峰度峰度峰度峰度标准差标准差标准差标准差方差方差方差方差全距全距全距全距均值标准误均值标准误均值标准误均值标准误离散趋势离散趋势离散趋势离散趋势分布分布分布分布输出顺序输出顺序输出顺序输出顺序按均值升序显示统计量按均值升序显示统计量按均值升序显示统计量按均值升序显示统计量按均值降序显示统计量按均值降序显示统计量按均值降序显示统计量按均值降序显示统计量按变量名字母顺序显示统计量按变量名字母顺序显示统计量按变量名字母顺序显示统计量按变量名字母顺序显

17、示统计量按数据集中变量的排列顺序显示统计量按数据集中变量的排列顺序显示统计量按数据集中变量的排列顺序显示统计量按数据集中变量的排列顺序显示统计量输出结果:输出结果:标准化值标准化值标准化值标准化值探索分析探索分析探索分析是指对测得的数据进行初步考察与核实,探索分析是指对测得的数据进行初步考察与核实,探索分析是指对测得的数据进行初步考察与核实,探索分析是指对测得的数据进行初步考察与核实,目的是检查数据中是否存在奇异值、影响点或错目的是检查数据中是否存在奇异值、影响点或错目的是检查数据中是否存在奇异值、影响点或错目的是检查数据中是否存在奇异值、影响点或错误数据,判别数据分布特征,以及进行假设检验误

18、数据,判别数据分布特征,以及进行假设检验误数据,判别数据分布特征,以及进行假设检验误数据,判别数据分布特征,以及进行假设检验等;等;等;等;探索分析过程,可通过探索分析过程,可通过探索分析过程,可通过探索分析过程,可通过ExploreExploreExploreExplore对话框对话框对话框对话框实现实现实现实现( ( ( (AnalyzeAnalyzeAnalyzeAnalyze Descriptive StatisticsDescriptive StatisticsDescriptive StatisticsDescriptive Statistics ExploreExploreExp

19、loreExplore) ) ) ) ,该该该该过程要求参与分析的变量是等距测度的数值型变过程要求参与分析的变量是等距测度的数值型变过程要求参与分析的变量是等距测度的数值型变过程要求参与分析的变量是等距测度的数值型变量,分组变量可以是数值型或是字符型。量,分组变量可以是数值型或是字符型。量,分组变量可以是数值型或是字符型。量,分组变量可以是数值型或是字符型。例例3对对对对例例例例2 2 2 2中三十名学生的身高数据按性别进行中三十名学生的身高数据按性别进行中三十名学生的身高数据按性别进行中三十名学生的身高数据按性别进行简单的探索分析简单的探索分析简单的探索分析简单的探索分析( ( ( (数据集

20、数据集数据集数据集2)2)2)2)。选择分析变量选择分析变量选择分析变量选择分析变量指定分组变量指定分组变量指定分组变量指定分组变量选择标识变量选择标识变量选择标识变量选择标识变量选择输出项选择输出项选择输出项选择输出项选择描述选择描述选择描述选择描述统计量统计量统计量统计量设置输设置输设置输设置输出图形出图形出图形出图形指定缺失值指定缺失值指定缺失值指定缺失值的处理方式的处理方式的处理方式的处理方式ExploreExplore对话框对话框输出基本描述统计量输出基本描述统计量输出基本描述统计量输出基本描述统计量指定均值的指定均值的指定均值的指定均值的置信区间置信区间置信区间置信区间输出最大似然

21、比的稳健估计输出最大似然比的稳健估计输出最大似然比的稳健估计输出最大似然比的稳健估计输出输出输出输出5 5个最大与最小值个最大与最小值个最大与最小值个最大与最小值输出输出输出输出5 5、1010、2525、5050、7575、9090以以以以及及及及9595的百分位数的百分位数的百分位数的百分位数剔除带有缺失值的观测量剔除带有缺失值的观测量剔除带有缺失值的观测量剔除带有缺失值的观测量同时剔除缺失值及与其同时剔除缺失值及与其同时剔除缺失值及与其同时剔除缺失值及与其有成对关系的观测量有成对关系的观测量有成对关系的观测量有成对关系的观测量将缺失值单列一组显示将缺失值单列一组显示将缺失值单列一组显示将

22、缺失值单列一组显示ExploreExplore对话框对话框箱图箱图箱图箱图描述图形描述图形描述图形描述图形茎叶图茎叶图茎叶图茎叶图直方图直方图直方图直方图输出正态概率与离散概率图输出正态概率与离散概率图输出正态概率与离散概率图输出正态概率与离散概率图输出散布输出散布输出散布输出散布- -水平图及方差齐水平图及方差齐水平图及方差齐水平图及方差齐性的性的性的性的LevenesLevenes检验检验检验检验转换幂值估计转换幂值估计转换幂值估计转换幂值估计对原始数据进行变换对原始数据进行变换对原始数据进行变换对原始数据进行变换不同分组的同一不同分组的同一因变量显示在一因变量显示在一个箱图中个箱图中同一

23、组的不同因同一组的不同因变量显示在一个变量显示在一个箱图中箱图中Spread versus Level : 横轴为各水平组的中位数及纵轴为四分横轴为各水平组的中位数及纵轴为四分位距的自然对数。位距的自然对数。 Power estimation: 对原始数据进行幂转换,对原始数据进行幂转换,直到各组间满足方差齐性。直到各组间满足方差齐性。Transformed 为原始数据转换后,为原始数据转换后,再划图。再划图。输出结果(一)输出结果(一)输出结果(一)输出结果(一)选项均为系统默认选项均为系统默认选项均为系统默认选项均为系统默认输出结果(二)输出结果(二)输出结果(二)输出结果(二)箱图箱图箱

24、图箱图茎叶图茎叶图茎叶图茎叶图奇异值奇异值奇异值奇异值极值极值极值极值IQR输出身高正态概率图(输出身高正态概率图(Normal Q-Q Plot ofNormal Q-Q Plot of身高)。身高)。男孩身高男孩身高男孩身高男孩身高变变变变量的正量的正量的正量的正态态态态概率概率概率概率图图图图输出结果(三)输出结果(三)输出结果(三)输出结果(三)女孩身高女孩身高女孩身高女孩身高变变变变量的正量的正量的正量的正态态态态概率概率概率概率图图图图正态分布正态分布Q-Q检验图,横坐标为实际观测值按从小到大的顺检验图,横坐标为实际观测值按从小到大的顺序排列,纵坐标为正态分布下的期望值。如果实际观

25、测值取序排列,纵坐标为正态分布下的期望值。如果实际观测值取自正态分布的总体,图中所示的落点应该分布在趋势线的附自正态分布的总体,图中所示的落点应该分布在趋势线的附近,并且应该表现出一定的集中趋势,即平均数附近应该聚近,并且应该表现出一定的集中趋势,即平均数附近应该聚集较多的落点,越靠近两个极端落点越少。集较多的落点,越靠近两个极端落点越少。输出离散正态概率图(输出离散正态概率图(Detrended Normal Q-Q Plot of 身高)。身高)。以实际观测值为横坐标,以实际观测值与期望值的差为纵坐以实际观测值为横坐标,以实际观测值与期望值的差为纵坐标。在符合正态分布的情况下,图中的落点应

26、该分布在中央标。在符合正态分布的情况下,图中的落点应该分布在中央横线的附近,甚至完全落到这条横线上,而且也应表现出集横线的附近,甚至完全落到这条横线上,而且也应表现出集中在平均数周围的趋势。中在平均数周围的趋势。 男孩身高离散正男孩身高离散正男孩身高离散正男孩身高离散正态态态态概率概率概率概率图图图图女孩身高离散正女孩身高离散正女孩身高离散正女孩身高离散正态态态态概率概率概率概率图图图图横坐标为实际观测值的累加百分比,纵横坐标为实际观测值的累加百分比,纵横坐标为实际观测值的累加百分比,纵横坐标为实际观测值的累加百分比,纵坐标为假定正态分布下的累加百分比。坐标为假定正态分布下的累加百分比。坐标为

27、假定正态分布下的累加百分比。坐标为假定正态分布下的累加百分比。是否接近正态分布的判断标准与是否接近正态分布的判断标准与是否接近正态分布的判断标准与是否接近正态分布的判断标准与Q-QQ-Q输输输输出图相同。出图相同。出图相同。出图相同。P-PP-PP-PP-P概率图概率图概率图概率图P-P PlotsP-P PlotsP-P PlotsP-P Plots输出结果输出结果输出结果输出结果输出结果输出结果输出结果输出结果(离散正态分布(离散正态分布(离散正态分布(离散正态分布P-PP-PP-PP-P概率图概率图概率图概率图)该图描述的是正态概率图中各点偏离正态直线的偏差;该图描述的是正态概率图中各点

28、偏离正态直线的偏差;该图描述的是正态概率图中各点偏离正态直线的偏差;该图描述的是正态概率图中各点偏离正态直线的偏差;若数据为正态分布,各散点应随机聚集在一条通过零点若数据为正态分布,各散点应随机聚集在一条通过零点若数据为正态分布,各散点应随机聚集在一条通过零点若数据为正态分布,各散点应随机聚集在一条通过零点的水平直线的周围;的水平直线的周围;的水平直线的周围;的水平直线的周围;说说说说明明明明Lilliefors 显著水平下,正态总体检验Kolmogorov-Smirnov统计量,如果样本量在3500之间还计算Shapiro-Wilk统计量。输出结果(四)输出结果(四)输出结果(四)输出结果(

29、四)输出结果(五)输出结果(五)输出结果(五)输出结果(五)Levene检验对数据进行方差齐次性检验时,不强求数据必须服检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。如果得到显著再通过这些差值的绝对值进行单因素方差分析。如果得到显著性水平小于性水平小于0.05,那么就可以拒绝方差相同的假设。,那么就可以拒绝方差相同的假设。列联表列联表列联表是指交叉分组的多维频数分析表,用来列联表是指交叉分组的多维频数分析表,用来列联表是指交叉分组的多维频数分析

30、表,用来列联表是指交叉分组的多维频数分析表,用来反映多个变量不同取值的数据分布情况、变量间反映多个变量不同取值的数据分布情况、变量间反映多个变量不同取值的数据分布情况、变量间反映多个变量不同取值的数据分布情况、变量间的相互影响和关系等;的相互影响和关系等;的相互影响和关系等;的相互影响和关系等;列联表分析过程,可通过列联表分析过程,可通过列联表分析过程,可通过列联表分析过程,可通过CrosstabsCrosstabsCrosstabsCrosstabs对话框对话框对话框对话框实现实现实现实现( ( ( (AnalyzeAnalyzeAnalyzeAnalyze Descriptive Stat

31、istics Descriptive Statistics Descriptive Statistics Descriptive Statistics CrosstabsCrosstabsCrosstabsCrosstabs) ) ) )。公司公司公司公司1 1公司公司公司公司2 2公司公司公司公司3 3公司公司公司公司4 4合计合计合计合计赞成赞成赞成赞成6868757557577979279279反对反对反对反对3232454533333131141141合计合计合计合计1001001201209090110110420420例例4已知对集团公司某项改革方案意见的调查结已知对集团公司某项改

32、革方案意见的调查结已知对集团公司某项改革方案意见的调查结已知对集团公司某项改革方案意见的调查结果,试分析各子公司对该项改革方案的态度果,试分析各子公司对该项改革方案的态度果,试分析各子公司对该项改革方案的态度果,试分析各子公司对该项改革方案的态度是否一致是否一致是否一致是否一致. . . . 定义变量定义变量( (形成数据集形成数据集3 3) )公司公司公司公司 company公司公司公司公司1 11 1公司公司公司公司2 22 2公司公司公司公司3 33 3公司公司公司公司4 44 468683232757545455757333379793131态度态度态度态度 attitude赞成赞成赞

33、成赞成 1 1反对反对反对反对 2 2 赞成赞成赞成赞成 1 1反对反对反对反对 2 2 赞成赞成赞成赞成 1 1反对反对反对反对 2 2 赞成赞成赞成赞成 1 1反对反对反对反对 2 2 观察频数观察频数观察频数观察频数 freqfreq指定指定freq为加权变量为加权变量CrosstabsCrosstabsCrosstabsCrosstabs对话框对话框对话框对话框指定行变量指定行变量指定行变量指定行变量指定列变量指定列变量指定列变量指定列变量指定分布表的层变量指定分布表的层变量指定分布表的层变量指定分布表的层变量显示分类条形图显示分类条形图显示分类条形图显示分类条形图不输出多维交叉表不输

34、出多维交叉表不输出多维交叉表不输出多维交叉表CrosstabsCrosstabsCrosstabsCrosstabs对话框对话框对话框对话框本例中选择本例中选择本例中选择本例中选择chi-squarechi-square卡方检验卡方检验卡方检验卡方检验分类变量相关指标分类变量相关指标分类变量相关指标分类变量相关指标相关相关相关相关列联系数列联系数列联系数列联系数和和和和V V系数系数系数系数 值值值值不确定系数不确定系数不确定系数不确定系数定序变量的相关指标定序变量的相关指标定序变量的相关指标定序变量的相关指标适用于一个为分类适用于一个为分类适用于一个为分类适用于一个为分类变量、另一个为等变量

35、、另一个为等变量、另一个为等变量、另一个为等距变量的检验距变量的检验距变量的检验距变量的检验SPSSSPSSContingency coefficient:列联系数。用于名义变量:列联系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改之间的相关系数计算。计算公式由卡方统计量修改而得,公式为而得,公式为 其中,其中,N为样本个数为样本个数Phi and Cramers V:系数。用于名义变量之间的系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,相关系数计算。计算公式由卡方统计量修改而得,公式为公式为 数值界于数值界于01之间,其中之间,其中K为为行数和列数较小的实

36、际数。行数和列数较小的实际数。CrosstabsCrosstabsCrosstabsCrosstabs对话框对话框对话框对话框本例中选择频数本例中选择频数本例中选择频数本例中选择频数及频率输出项及频率输出项及频率输出项及频率输出项观察频数观察频数观察频数观察频数期望频数期望频数期望频数期望频数频率频率频率频率行频率行频率行频率行频率列频率列频率列频率列频率总和频率总和频率总和频率总和频率残差残差残差残差非标准化非标准化非标准化非标准化标准化标准化标准化标准化调整的标准化残差调整的标准化残差调整的标准化残差调整的标准化残差频数频数频数频数升序升序升序升序行顺序行顺序行顺序行顺序降序降序降序降序输

37、出结果:输出结果:输出结果:输出结果:输出结果:输出结果:输出结果:输出结果:多选项分析多选项分析是对多选项问题的分析方法。多选项问题的编是对多选项问题的分析方法。多选项问题的编码方案有两种:码方案有两种:多选项二分法多选项二分法(Multiple Dichotomies Method)将每个可能的答案设置为一个将每个可能的答案设置为一个SPSS变量,变量的取值有两变量,变量的取值有两个,分别表示选中或没选中。比如一道题目有个,分别表示选中或没选中。比如一道题目有6个选项,个选项,则一道多选题目就需要用则一道多选题目就需要用6个变量来表示。个变量来表示。多选项分类法多选项分类法(Multipl

38、e Category Method)首先估计多选项问题可能出现的答案个数。比如一个多选首先估计多选项问题可能出现的答案个数。比如一个多选题,如果最多有题,如果最多有3 3个答案,那么就设置个答案,那么就设置3 3个个SPSSSPSS变量,分别变量,分别用来存放用来存放3 3个可能的答案。如果某个案的答案只有两个,个可能的答案。如果某个案的答案只有两个,那么第那么第3 3个个SPSSSPSS变量取值为缺失值。变量取值为缺失值。多选项分析多选项分析 ID康 佳长 虹西 湖TCL东 芝创 维性 别1101010121011000300011104101100051001010600111017011

39、10018100011190011100100111000111110000121010011130111001141011000150011010161110000171110000180110011190111001201101001例例5某商场对某商场对6种品牌的电视机进行消费者满意度调查,种品牌的电视机进行消费者满意度调查,随机调查了随机调查了20位消费者,让他们选出最满意的位消费者,让他们选出最满意的3个电个电视机品牌,收集到相应的数据。视机品牌,收集到相应的数据。 Analyze- Analyze- Multiple ResponseMultiple ResponseFrequen

40、ciesFrequenciesDefine Multiple Response SetsDefine Multiple Response SetsSPSSSPSS“ “Multiple Response Multiple Response CrosstabsCrosstabs” ”ID答 案 1答 案 2答 案 3性 别115312134034560414305146063451723418561195340104230113120123611133241144310156340162310172130182631193241202141例例6某商场对某商场对6种品牌的电视机进行消费者满意度调

41、查,种品牌的电视机进行消费者满意度调查,随机调查了随机调查了20位消费者,让他们选出最满意的位消费者,让他们选出最满意的3个电个电视机品牌,收集到相应的数据。视机品牌,收集到相应的数据。Define Multiple Response SetsDefine Multiple Response SetsMultiple Response FrequenciesMultiple Response FrequenciesSPSSSPSSMultiple Response Multiple Response CrosstabsCrosstabsMultiple Response Multiple Re

42、sponse CrosstabsCrosstabs: options: optionsSPSSSPSS结果和讨论结果和讨论(1 1)多选项二分法频数分析结果)多选项二分法频数分析结果: :SPSSSPSS(2 2)多选项分类法频数分析结果)多选项分类法频数分析结果: :结果和讨论结果和讨论SPSSSPSS基本统计分析的报表制作基本统计分析的报表制作 本章讨论了本章讨论了SPSSSPSS的一些基本统计功能。的一些基本统计功能。SPSSSPSS还还提供了这些基本统计分析的报表制作功能,根据报提供了这些基本统计分析的报表制作功能,根据报表制作的侧重点不同,可以分为以下表制作的侧重点不同,可以分为以下

43、3 3种。种。 1个案简明统计报表(个案简明统计报表(Cases Summary) 2行形式报表(行形式报表(Report Summaries in Rows) 3列形式报表(列形式报表(Report Summaries in Columns)部 门基 本 工 资奖 金分 红010001500800080013005000800130050008001000400080010004000800130050008001000800090010005000900130050008001000400080010004001900130050019001000800190010005001900130

44、050019001000400190010004001110015005001900100050018001200600例例7某公司两个部门共有某公司两个部门共有20名员工,收集到员工的基本名员工,收集到员工的基本工资、奖金和分红信息,生成工资、奖金和分红信息,生成个案简明统计报表个案简明统计报表。Analyze-Report-Case SummariesAnalyze-Report-Case Summaries 实现步骤实现步骤SPSSSPSSSummary ReportSummary Report:StatisticsStatisticsSummary ReportSummary Repo

45、rt: OptionsOptionsSPSSSPSS 使用例使用例7 7的数据,生的数据,生成成行形式报表行形式报表Analyze- Report Summaries in RowsAnalyze- Report Summaries in RowsFormatFormatSPSSSPSSReportReport:Summary Lines for Summary Lines for 部部部部门门门门ReportReport:Break Options for Break Options for 部部部部门门门门SPSSSPSSReportReport:Final Summary LinesFi

46、nal Summary LinesReportReport:OptionsOptionsReportReport:LayoutLayoutReportReport:Title(sTitle(sSPSSSPSS 使用例使用例7 7的数据,生的数据,生成成列形式报表列形式报表Analyze- Report- Summaries in Analyze- Report- Summaries in ColumnsColumnsFormatFormatSPSSSPSSReportReport:Summary Lines for Summary Lines for 基本工资基本工资基本工资基本工资Repor

47、tReport:Summary ColumnsSummary ColumnsSPSSSPSS(1 1)个案简明)个案简明 统计报表结果:统计报表结果:结果和讨论结果和讨论SPSSSPSS(2 2)行形式报表)行形式报表 结果如下表所示。结果如下表所示。结果和讨论结果和讨论SPSSSPSS(3 3)列形式报表结果:)列形式报表结果:结果和讨论结果和讨论SPSSSPSSAnalyze-Table-Custom Tables SPSSSPSS小小 结结 描述性统计是进行其他统计分析的基础和前提。描述性统计是进行其他统计分析的基础和前提。利用这些基本统计方法,可以对要分析数据的总体利用这些基本统计方法

48、,可以对要分析数据的总体特征有比较准确的把握,同时也为更深入的分析提特征有比较准确的把握,同时也为更深入的分析提供了依据。供了依据。 FrequenciesFrequencies命令可用于数字型或字符型变量的统命令可用于数字型或字符型变量的统计分析,如均值、标准差、最小值、最大值、众数、计分析,如均值、标准差、最小值、最大值、众数、中位数、方差、全距等中位数、方差、全距等1414种统计量。种统计量。 探索分析可对变量进行更为深入详尽的描述性统探索分析可对变量进行更为深入详尽的描述性统计分析,有助于用户思考对数据进行进一步分析的计分析,有助于用户思考对数据进行进一步分析的方案。方案。SPSSSP

49、SS小小 结结 FrequenciesFrequencies命令可用于数字型或字符型变量的统命令可用于数字型或字符型变量的统计分析,如均值、标准差、最小值、最大值、众数、计分析,如均值、标准差、最小值、最大值、众数、中位数、方差、全距等中位数、方差、全距等1414种统计量。种统计量。 探索分析可对变量进行更为深入详尽的描述性统探索分析可对变量进行更为深入详尽的描述性统计分析,有助于用户思考对数据进行进一步分析的计分析,有助于用户思考对数据进行进一步分析的方案。方案。SPSSSPSS作业Frequencies / / Descriptives / / Explore / Multiple Response / Table/每种程序任意完成两个,并贴在每种程序任意完成两个,并贴在wordword里,里,描述结果。描述结果。文件文件“作业作业”。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号