应用1_随机抽样与数据显示

上传人:豆浆 文档编号:48779794 上传时间:2018-07-20 格式:PPT 页数:24 大小:1.66MB
返回 下载 相关 举报
应用1_随机抽样与数据显示_第1页
第1页 / 共24页
应用1_随机抽样与数据显示_第2页
第2页 / 共24页
应用1_随机抽样与数据显示_第3页
第3页 / 共24页
应用1_随机抽样与数据显示_第4页
第4页 / 共24页
应用1_随机抽样与数据显示_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《应用1_随机抽样与数据显示》由会员分享,可在线阅读,更多相关《应用1_随机抽样与数据显示(24页珍藏版)》请在金锄头文库上搜索。

1、语言研究中的统计学()2009年4月山西大学数学科学学院1第三章 数理统计基础统计学的分类2统计以其功能可以分为两类:1、描述统计目的:对数据进行整理、归纳和总结,便于研究者把握期一般的特征和全貌。内容:特征数和统计图表2、推断统计目的:以概率论为基础通过样本对总体做出更科学的判断。内容:一方面根据样本特征值对总体进行推断或估计;另一方面估计或假设进行检验。 山西大学数学科学学院第三章 数理统计基础数据的基本分类31、简单随机抽样2、分层随机抽样3、多级抽样山西大学数学科学学院第三章 数理统计基础单机抽样1、简单随机抽样4(1)抽签(2)随机数表法Step1 根据总体规模确定随机数表中的实际分

2、组大小Step2 从随机数表中任意一个地方开始,从左到右或从上到下顺序寻找,将有效数字记下来(重复的不再记),直到满足所需的样本容量为此。Step3 将所记的有效数字和实物(研究对象)对应,从而选取出样本。 山西大学数学科学学院第三章 数理统计基础随机数表5随机数表是由0-9十个数随机排列的若干组数字组成。山西大学数学科学学院第三章 数理统计基础有效数字自然是不超过总体规模的数字。随机数表6例如:我们要从450人(总体规模)中抽取一个20人(样本容量)的样本,我们将随机数表中每3个数(分组规模)分为一组。假如从第3行第2组的数字(26)开始,从左到右选取,每3个数字为一个号,选取20个不重复的

3、有效数字即可。结果如下:269,370,(602),235,(851),(513),(920),山西大学数学科学学院第三章 数理统计基础1、简单随机抽样7(3)系统随机抽样只要求所抽取样本的第一个单位按真正的随机方法进行选取,余后单位则按等距抽取(抽取间距的大小视样本的大小而定)。例如,从1000个英语句子中抽取50个作为样本加以研究,抽取间距为1000/50=20。首先从随机数表中选取一个不超过20的数字作为第一个单位,如18,则以后应抽取的句子数依次为38,58,78,98,998。由于第二个及其以后的单位并不独立于第一个单位,所以严格来说,并不是真正的随机样本。山西大学数学科学学院第三章

4、 数理统计基础2、分层随机抽样8Step1 根据所研究的自变量把总体分成若干组或层,所分成的组或层(stratum)也称为次总体;Step2 在各个部分(层)中分别进行简单随机抽样;Step3 将所抽取的分样本合并起来,就得到一个总样本。如果从各层中抽取得分样本在总样本中所占的比例与各层在总体中所占的比例相同,那么这种抽样就称为比例分层随机抽样。否则称为非比例分层抽样。山西大学数学科学学院第三章 数理统计基础分层随机抽样实例9例如:要从一个年级(男女不等)中抽取一个样本,考虑到男女比例,进行比例分层随机抽样。山西大学数学科学学院第三章 数理统计基础3、多级抽样10多级抽样就是逐级进行抽样,把每

5、一级所抽取的样本看成下一级抽样的总体。例如:要从某个作家的作品(小说)中抽取10000个词加以研究山西大学数学科学学院第三章 数理统计基础数据的基本分类111、 范畴型数据又称属质型数据,即按变量的性质或类别来区分的数据2、 数值型数据数值型数据的基本处理方法1、 排序2、 分组山西大学数学科学学院第三章 数理统计基础频数分布表12包括:每个样本值出现的次数、频数(次数)、相对频数(频率)、百分比频率、累积频数和累计百分比频率等。【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满

6、意;5非常满意。 山西大学数学科学学院第三章 数理统计基础频数分布表13山西大学数学科学学院第三章 数理统计基础乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布 回答类别乙城市户数 (户)百分比 (%)向上累积 向下累积 户数 (户)百分比 (%)户数 (户)百分比 (%)非常不满意不满意一般满意非常满意21 99 78 64 387.0 33.0 26.0 21.3 12.721 120 198 262 3007.0 40.0 66.0 87.3 100.0300 279 180 102 38100.0 93.0 60.0 34.0 12.7合计300100.0分组频数分

7、布表14包括:分组区间、组中值、组频数、组频率,累积频数、 累计频率(百分数)山西大学数学科学学院第三章 数理统计基础分组频数分布表15说明:明端点归属的问题,不能重复统计也不能遗漏;组中值是每组两端点的平均值;从小到大的累积(百分比)频率就是样本分布函数,其对应的数值即为分位数(点)。山西大学数学科学学院第三章 数理统计基础分组频数分布图16一、直方图山西大学数学科学学院第三章 数理统计基础140 150210某电脑公司销售量分布的直方图我一眼就看出 来了,销售量 在170180之 间的天数最多 !190 200180160 170频数(天)25201510530220 230 240分组频

8、数分布图17二、茎叶图山西大学数学科学学院第三章 数理统计基础2 1 4 4 6 7 7 3 0 2 84 1Stem and Leaf display:21, 24, 24, 26, 27, 27, 30, 32, 38, 41分组频数分布图18山西大学数学科学学院第三章 数理统计基础频数多边形图19又称折线图山西大学数学科学学院第三章 数理统计基础140140 150150210210190190 200200180180160160 170170220220 230230240240某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图频频数数( (天天) )2525202015151

9、0105 53030分组频数分布图20经验结论:1、如果总体是正态分布的,分组数K由下式计算:其中N为样本容量。2、如果20N300,茎叶图最大行数不超过:山西大学数学科学学院第三章 数理统计基础作图指导第三章 数理统计基础21山西大学数学科学学院SPSS 作图指导图形用SPSS时绘图的基本选项直方图Graphs-Histogram盒形图Graphs-Boxplot茎叶图、直方图、盒形图Analyze-Descriptive Statistics-Explore 散点图Graphs-Scatter/Graphs- Line/Graphs-Sequence 饼图Graphs-Pie条形图Graphs-Bar山西大学数学科学学院22第三章 数理统计基础Excel作图小结图形用Excel时绘图的基本选项直方图工具数据分析(D)直方图盒形图插入图表股价图茎叶图不是标准图形散点图插入图表折线图饼图插入图表饼图条形图插入图表柱形图条形图山西大学数学科学学院23第三章 数理统计基础Exercise第三章 数理统计基础24山西大学数学科学学院找一组数据:1、作频数分布表2、作分组频数分布表3、直方图4、茎叶图并观察图表特征。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号