统计学期末总结备份(双语)

上传人:第*** 文档编号:33491163 上传时间:2018-02-15 格式:DOC 页数:24 大小:3.23MB
返回 下载 相关 举报
统计学期末总结备份(双语)_第1页
第1页 / 共24页
统计学期末总结备份(双语)_第2页
第2页 / 共24页
统计学期末总结备份(双语)_第3页
第3页 / 共24页
统计学期末总结备份(双语)_第4页
第4页 / 共24页
统计学期末总结备份(双语)_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《统计学期末总结备份(双语)》由会员分享,可在线阅读,更多相关《统计学期末总结备份(双语)(24页珍藏版)》请在金锄头文库上搜索。

1、第一章 数据与统计术语表Statistic统计学 收集、分析、陈述和解析数据的技术和科学Data数据 经过收集、分析和解析的事实和数字Data set数据集 某一特定研究中所收集的所有数据Elements单位 收集数据所依赖的对象Variable变量 单位所感兴趣的特征Observation观测值 对单个单位获得的测量值的集合Nominal scale定类尺度 对单个单位获得的测量尺度即数据使用标记或者名称来定义单位属性时,即为定义尺度。定义尺度可以是数值型的,也可以是非数值型的。Ordinal scale定序尺度 数据在表示了单位的定义特征外,还含有顺序或者等级信息,这个变量的测量尺度为定序

2、尺度。定序尺度可以是数值型的,也可以是非数值型的。Interval scale定距尺度 但数据表示定序属性的同时,值与值之间的差距可以用某一个固定的测量单位来确定时,这个变量的测量尺度为定距尺度。定距尺度通常都是数值型的。Ratio scale定比尺度 数据拥有所有定距属性外,两个值之间的比值也含有有意义的信息时,其测量尺度为定比尺度。定比尺度通常是非数值型的。Qualitative data定性数据 提供单位某一特征的标记或者名称的数据。定性数据使用的测量尺度为定类尺度或定序尺度,既可以是数值型也可以是非数值型。Quantitative data定量数据 表明某物有多少或者是多少的数据,一般

3、重视数值型的,使用的测量尺度定距尺度或者定比尺度。Qualitative variable定性变量 纪录定性数据的变量Quantitative variable定量变量 纪录定量数据的变量Cross-sectional data横截面数据 在同一时间点或者大约同一时间点收集的数据Time series data时间序列数据 在连续时间段收集的数据Descriptive statistics描述统计 用表格、图形和数论方法来概括数据Population总体 某一特定研究中所有感兴趣的单位的集合Sample样本 总体的一个子集Census普查 收集总体数据进行调查Sample survey抽样调查

4、 收集样本数据进行的调查Statistical inference统计推断 利用充样本中获得的数据对总体特征进行估计或检验假设的过程。第二章 描述性统计:表格法和图形法术语表Qualitative data定性数据 为分类中的同类个体提供标记或名称的数据Quantitative data定量数据 表明是多少或者有多少的数据变量Frequency distribution频数分布 数据的表格概括形式,用来显示若干个互不重复的组中每组观测值的总量Relative frequency distribution相对频数分布 数据的表格概括形式、用来显示若干个互不重复的组中每组观测值的组成和比例。Per

5、cent frequency distribution百分比频数分布 数据的表格概括形式,用来显示若干个互不重复的组中每组观测值的百分比Bar graph条形图 一种描述定性数据的频数分布、相对频数分布或者百分比频数分布所提供的信息的图形方法Pie chart饼图 一种通过将一个圆分成集分成几个扇区,每个扇区对应每个分组的相对频数分布所提供的信息的图形方法Class midpoint组中值 位于每组中上限和下限之间一半的那个值Dot plot点阵图 一种用在一条横轴上每个数据值上点的数目来概括数据的图形方法Histogram直方图 一种描述定性数据的频数分布、相对频数分布或者百分比频数分布所提

6、供的信息的图形方法。绘图时将组距放在横轴上,频数分布、相对频数分布或者百分比频数分布放在纵轴上。Cumulative frequency distribution累积频数分布 一种用来显示相遇或者等于每组上限的观测值的次数的表格来概括定量数据的方法Cumulative relative frequency distribution累积相对频数分布 一种用来显示小雨或者等于每组上限的观测值的比例或者百分比的表格来概括定量数据的方法Cumulative percent frequency distribution累积百分比频数分布 一种用来显示小于或者等于每组上限的观测值的百分比的表格来概括定性数

7、据的方法。Ogive折线图 累积分布的曲线图Exploratory data analysis探索性数据分析 用简单的算术运算及容易绘制的图形来迅速概括数据的方法Stem-and-leaf display茎叶图 一种探索性数据分析方法,可以给定量数据排序,并提供有关分布形状的信息Cross tabulation交互表 一种两个变量数据的表格概括法。一个变量的分组情况用行表示,另外一个变量的分组情况用列表示Simpsons paradox辛普森悖论 从两个或者多个独立的交互表中得到的结论,与把些交互表中的数据合成一个交互表后所得的结论可能是相反的Scatter diagram散点图 用图形表示两

8、个定量变量之间的关系的方法。一个变量在横轴上显示,另外一个变量在纵轴上显示Trend line趋势图 用来近似表示两个变量之间相互关系的一条直线 主要公式相对频数 = 每 组 的 频 数近似组距 = 最大数据 值 最小数据 值分 组 数量第三章 描述性统计:数量方法术语表Sample statistic 样本统计量 用于样本概括性测量的数值(如样本均值 、样本方差 和样本 2标准差 s)Population parameter总体参数 用于总体概括性测量的数值(如总体均值 、总体方差 和总体 2标准差 )Point estimator点估计 用来估计相对应总体参数的样本统计量,如 、 和 s)

9、 2Mean均值 中心位置的测量。对所有的数据求和,再除以观测值的个数Median中位数 中心位置的测量。当数据按照升序排列时,中间的一个值Mode众数 中心位置的测量。定义为发生最频繁的数据值Percentile百分位数 它是这样的一个值,至少 p%的观测值少于或者等于该值,至少(100-p)%的观测值大于或者等于该值,第 50 个百分位数即是中位数Quartiles四分位数 第 25 个、第 50 个和第 75 个百分位数数,也分别指的是第一个四分位数、第二个四分位数(中位数) 、第三个四分位数。四分位数可以把数据分成四个部分,每个部分包含大约 25%的数据值Range全距 变异性的测量,

10、定义为最大值和最小值之差Interquartile range(IQR)四分位距 变异性的测量,定义为第三个四分位数和第一个四分位数之差Variance方差 变异性的测量。基于数据值偏离均值的平方Standard deviation标准差 变异性的测量。取方差的算术平均数可得Coefficient of variation变异系数 一种相对离散的测量方法。将标准差除以均值再乘以 100 而得到Skewness偏度 一种对数据分布形状的测量。数据偏向左边导致负偏度;数据分布对称导致零偏度;数据偏向右边导致正偏度Z-scoreZ 值 它是这样的数据值:将均值的偏差( - )除以标准差 s 得到。

11、Z 值又称为标准化值,表示 偏移均值的标准差的个数Chebyshevs theorem切比雪夫定理 可以用来陈述位于均值若干倍标准差范围内的数据所占的百分比的一个定理Empirical rule经验法则 一个法则,陈述了在丘形或者钟形分布中,位于均值上下 1 个、2 个、3 个标准差内的数值所占的百分比Outlier异常值 异乎寻常的小或者大的数据值Five-number summary五数概括 用 5 个数来概括数据的探索性数据分析技术;最小值、第一个四分位数、中位数、第三个四分位数和最大值Box plot箱形图 一种基于五数概括的图形概括数据的方法Covariance协方差 两个变量之间的

12、闲心关系的一种测量。正值表示正相关关系;负值表示负相关关系。Correlation coefficient相关系数 两个变量之间线性关系的一种预测。其取值在 -1 到 +1 之间。值接近于 +1 说明强正线性关系,值接近于 -1 说明强负线性关系,值接近于 0 说明不存在线性关系Weighted mean加权平均值 该平均值是通过赋予每一个观测值一个权数以反映其重要性而得到的。Grouped data分组数据 以组距形式获取的数据通过频数分布汇总起来,原始数据的单个值不被记录主要公式样本均值= 总体均值= 四分位距IQR = - 31总体方差 = 2( ) 2样本方差2= ( ) 2 1标准差

13、总体标准差 = = 2样本标准差 = s = 2变异系数( )%标 准差均 值 100Z 值= 样本协方差= ( )( ) 1总体协方差= ( )( )皮尔森积差相关系数:样本数据= 皮尔森积差相关系数:总体数据= 加权平均数= 分组数据的样本均值= 分组数据的样本方差= ( ) 2 1分组数据的总体均值= 分组数据的总体方差2= ( ) 2第四章 概率论简述术语表Probability概率 某一事件将要发生的可能性的数量测量Experiment试验 产生定义明确的结果的过程Sample space样本空间 所有试验的结果的集合Sample point样本点 样本空间的一个元素。一个样本点表示

14、一种试验结果。Tree diagram树形图 一种有助于确定包含多步骤试验的样本点的图形表示法Basic requirements for assigning probabilities概率分布的基本要求限制概率分布的连个要求:(1 ) 对每个试验结果 ,必须有 0 ()1(2 ) 对于所有试验结果,必须有 + + = 1.0(1) (2) ()Classical method古典方法 一种分配概率的方法,它假定所有的试验结果翻身的可能性相同Relative frequency method相对频数方法 当试验可以大量重复,从而能够得到用以估计试验结果次数的总体数据时,我们采用的一种分配概率的

15、方法Subjective method主观方法 一种以判断为基础的概率分配方法Event事件 样本点的集合Complement of A事件 A 的对立事件 包括所有不属于事件 A 的样本点的事件Venn diagram文氏图 一种用符号表示样本空间和所涉及事件的运算的图形表示方法。样本空间以矩形表示,事件以圆圈表示Union of A and B事件 A 和事件 B 的并 包括所有属于事件 A 或事件 B 或属于事件 A 又属于事件 B的样本点的事件。用符号 A B 表示Intersection of A and B 事件 A 和事件 B 的交 包括所有既属于事件 A 又属于事件 B 的样本点的事件。用符号 A B 表示Addition law加法法则 用来计算两事件的并的概率的一种概率法则,即 P( = P(A)+P(B)-P( )。对于互不相容的事件,因为 P(A ) =

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号