《STATA第二章描述性统计命令与输出结果说明(最新整理)》由会员分享,可在线阅读,更多相关《STATA第二章描述性统计命令与输出结果说明(最新整理)(5页珍藏版)》请在金锄头文库上搜索。
1、第二章 描述性统计命令与输出结果说明by分组变量:summarize 变量名 1变量名 2 变量名 m,detail ci 变量名 1变量名 2 变量名 m,level(#) binomialpoisson exposure(varname) by(分组变 量) cii样本量均数标准差 ,level(#) tab1 变量名 ,generate(变量名)本 节 STATA命 令 摘 要资料特征描述(均数,中位数,离散程度)例:某地测定克ft病患者与克ft病健康人的血磷测定值如下表患 者2.63.243.733.734.324.735.185.585.786.406.53健 康人1.671.981
2、.982.332.342.503.603.734.144.174.574.825.78其中变量x1 为患者的血磷测定值数据,变量x2 为健康人的血磷测定值数据。上述数据也可以用变量 x 表示血磷测定值,分组变量 group=0 表示患者组和group=1 表示健康组(如:患者组中第一个数据为 2.6,则 x=2.6,group=0;又如: 健康组中第三个数据为 1.98,则 x 为 1.98 以及 group 为 1),并假定这些数据已以 STATA 格式存入 ex2a.dta 文件中。计算资料均数,标准差命令 summarize, 以 述 资 料 为 例:. summarizeVariabl
3、eObsMeanStd. Dev.MinMaxx1114.7109091.3029772.66.53x2133.3546151.3043681.675.78Mean 均值;Std.Dev.标准差即: 本例中急性克ft 病患者组的样本数为 11, 血磷测定值均数为4.711(mg%),相应的标准差为 1.303,最小值为 2.6 以及最大值为 6.53;健康组的样本量为 13,血磷测定值均数为 3.3546,相应的标准差为 1.3044,最小值为1.67 以及最大值为 5.78。计算资料均数,标准差,中位数,低四分位数和高四分位数的命令 summarize 以及子命令 detail,仍以述资料为
4、例:1. summarize x1 x2,detailx1PercentilesSmallest1%2.62.65%2.63.2410%3.243.73Obs1125%3.733.73Sum of Wgt.1150%4.73Mean4.71090975%5.78Largest5.58Std. Dev.1.30297790%6.45.78Variance1.69774995%6.536.4Skewness-.081344699%6.536.53Kurtosis1.809951x2PercentilesSmallest1%1.671.675%1.671.9810%1.981.98Obs1325%2
5、.332.33Sum of Wgt.1350%3.6Mean3.35461575%4.17Largest4.17Std. Dev.1.30436890%4.824.57Variance1.70137795%5.784.82Skewness.296394399%5.785.78Kurtosis1.875392.结果:Percentiles 显示了从 1%到 99%的分位数的取值。第二列是最小和最大的 5 个数。第三列从上到下:obs 观测值数目、mean 平均数、std.dev 标准差、 variance 方差。skewness 偏度: 偏度的绝对值越小,表明该数据的正态对称性越好。kurtos
6、is 峰度: 峰度值越大表明该数据的正态峰越明显。95%可信限计算:正态数据:ci 变量名0-1 数 据 :ci 变 量 名 ,binomial poisson 分布数据:ci 变量名,poisson90%可信限计算(其它可信限类推)正态数据:ci 变量名,level(90)0-1 数据:ci 变量名,level(90) binomialpoisson 分布数据:ci 变量名,level(90) poissonci x1 x2. ci x1 x2VariableObsMeanStd. Err.95% Conf. Intervalx1114.710909.39286243.8355575.586
7、261x2133.354615.36176672.5663934.14283795%Conf.Interval为 95%的 可 信 限 , 因 此 x1 的 95 可 信 限 为3.8356,5.5863,x2 的 95可信限为2.5664,4.1428。根据样本数,样本均数和标准差计算可信限。若数据服从正态分布,并已知样本均数和标准差以及样本数, 则 95可信限计算为:cii 样本数样本均数标准差,level(#)例:已知样本数为 90 样本均数为 40 以及样本标准差为 12,则:计算该样本均数的 95%可信限为cii 90 40 12VariableObsMeanStd. Err.95%
8、 Conf.Interval90401.26491137.4866542.51335样本均数 95%可信限为37.48665,42.51335. cii 90 40 12该cii 90 40 12,level(90)VariableObsMeanStd. Err.90% Conf.Interval90401.26491137.8975242.10248样本均数 90%可信限为37.89752,42.10248. cii 90 40 12,level(90)该计数资料中频数和比例STATA 命令:tab1 变量名,g(新变量名)因为该命令主要适用描述计数资料(即:属性资料),当使用子命令 g(新
9、变量),则产生属性指示变量。在回归分析中经常需要这些指示变量作为亚元变量进行分析。例:50 只小鼠随机分配到 5 个不同饲料组,每组 10 只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显著性差别。用 x 表示鼠肝中铁的含量以及用 group=1,2,3,4,5 分别表示对应的 5 个组。x:2.231.142.6311.352.011.641.131.011.70group:1111111111x:5.590.966.961.231.612.941.963.681.542.59group:2222222222x:4.53.9210.338.
10、232.074.96.846.423.726group:3333333333x:1.351.060.740.961.162.080.690.680.841.34group:4444444444x:1.41.512.491.741.591.3634.815.215.12group:5555555555tab1 group,g(a). tab1 group,g(a)- tabulation of groupgroupFreq.PercentCum.11020.0020.0021020.0040.0031020.0060.0041020.0080.0051020.00100.00Total50100
11、.00Freq.为各属性资料的频数;Percent 为该属性占整个资料样本数的百分比;Cum.为累计百分比。本例中,总样本数为 50,共有 5 组,每组有 10 个样本点,各占总样本数的 10%。因为使用了子命令 g(a),从而产生 5 个指示变量(又可称亚元变量):a1,a2,a3,a4和 a5。变量 a1 用于指示第 1 组的资料:即:当资料属于第 1 组的(group=1), 则 a1=1;其它组的资料(group1),则 a1=0。变量 a2 用于指示第 2 组的资料, 变量 a3,a4 和 a5 相应分别指示第 3,4,5 组的资料(详细见下表)。“”“”At the end, Xi
12、ao Bian gives you a passage. Minand once said, people who learn to learn are very happy people. In every wonderful life, learning is an eternal theme. As a professional clerical and teaching position, I understand the importance of continuous learning, life is diligent, nothing can be gained, only c
13、ontinuous learning can achieve better self. Only by constantly learning and mastering the latest relevant knowledge, can employees from all walks of life keep up with the pace of enterprise development and innovate to meet the needs of the market. This document is also edited by my studio professionals, there may be errors in the document, if there are errors, please correct, thank you!