数学建模 统计分析

上传人:飞****9 文档编号:139282485 上传时间:2020-07-20 格式:PPT 页数:60 大小:239KB
返回 下载 相关 举报
数学建模 统计分析_第1页
第1页 / 共60页
数学建模 统计分析_第2页
第2页 / 共60页
数学建模 统计分析_第3页
第3页 / 共60页
数学建模 统计分析_第4页
第4页 / 共60页
数学建模 统计分析_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《数学建模 统计分析》由会员分享,可在线阅读,更多相关《数学建模 统计分析(60页珍藏版)》请在金锄头文库上搜索。

1、Outline,一、描述性统计 二、随机数的生成 三、参数假设检验 四、正态性检验* 五、方差分析 六、回归分析,一、描述性统计,直方图 均值 标准差 偏度 峰度,1. 直方图 (histogram),hist(x),hist(x, m),histfit(x, m) % 带正态拟合的直方图,2. 描述性统计量,mean(x) % 均值,std(x) % 标准差,median(x) % 中位数,sort(x) % 顺序统计量,sum(x) % 和,var(x) % 方差,kurtosis(x) % 峰度,正态是3,skewness(x) % 偏度,正态是0,二、随机数 (random numbe

2、r),均匀分布随机数 正态分布随机数 指数分布随机数 卡方分布随机数 t分布随机数 F分布随机数 离散分布随机数,1. 均匀分布的随机数,rand(n) % 0, 1区间上,rand(m, n) % 0, 1区间上,unifrnd(a, b, m, n) % a, b区间上,2. 正态分布的随机数,randn(n) % N(0, 1),randn(m, n) % N(0, 1),normrnd(a, b, m, n) % N(a, b2),或等价地, x=randn(m, n); x=a+b*x,3. 指数分布的随机数,exprnd (lambda) % 1个随机数,exprnd (lambd

3、a, m, n),4. 卡方分布的随机数,chi2rnd (df),chi2rnd (df, m, n),5. t分布的随机数,trnd (df),trnd (df, m, n),6. F分布的随机数,frnd (df1, df2),frnd (df1, df2, m, n),7. 二项分布的随机数,binornd (N, p),binornd (N, p, m, n),8. Poisson分布的随机数,poissrnd (lambda),poissrnd (lambda, m, n),9. 离散型分布的随机数,以标准的均匀分布U作为模拟变量,若 U 0.20, 则X值x1 ; 若0.20U

4、0.35, 则X值x2 ; 若0.35U 0.60, 则X值x3 ; 若0.60U 1, 则X值x4 .,clear n=5000; for i=1:n u=rand(1); if u=0.2 x(i)=1; elseif u=0.35 x(i)=2; elseif u=0.6 x(i)=3; else x(i)=4; end end % sum(x=1)/n,三、单样本与两样本的t检验,单样本的t检验 两样本的t检验 检验的水平 检验的功效(势),1. 单样本的t检验,设总体的分布为 ,从总体中抽取 容量为n的样本,要检验的问题是,设总体的方差未知,则使用的是单样本t检验:,取检验的水平为

5、,则检验的拒绝域为:,clear n=20; mu0=0; x=randn(1, n); % 样本观测值 xbar=mean(x); s=std(x); t=sqrt(n)*(xbar-mu0)/s; if abs(t)2.093 % 2.093是临界值 c=1; else c=0; end c,例:,h=ttest(x, mu0) % x是样本; % muo缺省时为0 ; % h输出值0和1,分别表示接受和拒绝H0 .,单样本t检验的Matlab实现:,h, sig, ci, stats=ttest(x, mu0, alpha, tail) % alpha: 显著性水平, 缺省时为0.05.

6、 % tail: 取0表示双侧检验(可缺省); 取-1或1表示单侧检 验, 其中-1对应H1: mumu0. % h输出值0和1, 分别表示接受和拒绝H0 . % sig: 检验的p-值, sig0.05等价于h=1. % ci输出置信区间, stats输出统计量的值和自由度.,单样本t检验的Matlab实现:,2. 两样本的t检验,设有两个总体 和 , 分别从这两个总体中抽取容量为n1和 n2的样本,要检验的问题是,设总体的方差未知,则使用的是两样本t检验:,取检验的水平为 ,则检验的拒绝域为:,h=ttest2(x, y) % x,y是样本; % h输出值0和1,分别表示接受和拒绝H0 .

7、,两样本t检验的Matlab实现:,h, sig, ci, stats=ttest2(x, y, alpha, tail) % alpha: 显著性水平, 缺省时为0.05. % tail: 取0表示双侧检验(可缺省); 取-1或1表示单侧检验, 其中-1对应H1: mu1mu2. % h输出值0和1, 分别表示接受和拒绝H0 . % sig: 检验的p-值, sig0.05等价于h=1. % ci输出置信区间, stats输出统计量的值和自由度.,两样本t检验的Matlab实现:,3. 检验的水平*,在零假设成立下,重复执行检验过程,考察零假设被拒绝的概率,这就是犯第一类错误的概率,即检验的

8、实际水平。,clear n=20; N=10000; mu0=0; for i=1:N x=randn(1, n); a(i)=ttest(x,mu0); end sum(a)/N % t检验的实际水平,4. 检验的功效* (势, power),在备择假设成立下,重复执行检验过程,考察零假设被拒绝的概率,这就是不犯第二类错误的概率,即检验的功效。 检验的功效越高,检验就越好。,clear n=20; N=10000; mu0=0.5; for i=1:N x=randn(1, n); a(i)=ttest(x,mu0); end sum(a)/N % 功效,四、正态性检验*,Q-Q图 Kolm

9、ogorov-Smirov检验 Lilliefors检验,1. Q-Q图 (quantile-quantile),clear n=40; x=randn(1,n); qqplot(x),Q-Q图: 第i个点的纵坐标是排序的样本观测值 ,横坐标是,理论直线的方程为:,2. Kolmogorov-Smirov检验,检验的统计量是:,其中 是待检验的分布函数。,Matlab中的命令: h, p=kstest(x, , alpha, tail),检验样本是否服从标准的正态分布,其中 alpha: 检验的水平 tail: 检验的类型,0表示双侧检验,-1和1是单侧检验 h: 取值0和1,分别表示接受和拒

10、绝零假设 p: 检验的p-值 简单用法:h=kstest(x),clear n=30; N=5000; for i=1:N x=randn(1, n); h=kstest(x); if h=1 a(i)=1; else a(i)=0; end end sum(a)/N % 结果是什么?,clear n=80; N=5000; for i=1:N x=trnd(1, 1, n); %样本来自于t(1) a(i)= kstest(x); end sum(a)/N %结果是什么?,3. Lilliefors检验,Matlab中的命令: h=lillietest(x) h,p=lillietest(x

11、, , alpha, tail),用来检验数据是否具有与样本相同均值和方差的 正态分布。,clear n=30; N=5000; for i=1:N x=randn(1, n)+2; a(i)= lillietest(x); end sum(a)/N % ?,五、方差分析(analysis of variance),例1:在实验室内有多种方法可以测定生物样品中的磷含量,现选取4种测定方法,测定同一干草样品的磷含量,结果见下表,试分析这4种方法之间差异是否显著。,不同方法测定的干草磷含量,例2:随机选取三种千足虫,测定了不同性别个体血淋巴中的丙氨酸含量(mg/L),试检验性别和物种对丙氨酸含量的

12、影响有无显著性差异。,p=anova1(x) % x是样本观测值构成的矩阵,每一列为 一个水平 % p是检验的p-值. % 输出结果除p-值外,还有方差分析表以 及箱形图。,1. 单因素方差分析的Matlab实现:,例1的求解:,clear x=34 37 34 36 36 36 37 34 34 35 35 37 35 37 37 34 34 37 36 35; p=anova1(x) % 1是数字,单因素方差分析表:,p=anova2(x, 1) % 括号中的1表示每个水平组合下只有一次观测,此时不考虑交互效应。 p=anova2(x, m) % 括号中的m表示每个水平组合下有m次重复观测

13、。 The number of rows must be a multiple of reps.,2. 两因素方差分析的Matlab实现:,例2的求解:,clear x= 215 145 160 196 174 203 209 150 185 228 178 193 148 121 144 156 114 147 135 127 138 164 145 120 ; p=anova2(x,4),两因素方差分析表:,Columns: 列因素 Rows: 行因素 Interaction: 交互作用,六、回归分析,一元线性回归 多元线性回归,1. 一元线性回归分析,设x为自变量,y为因变量,考虑y对x

14、的线性回归。 采用最小二乘估计法。,b=polyfit(x, y, 1) % x是自变量的样本观测值 % y是因变量的样本观测值,一元线性回归分析的Matlab实现:,x=0.7608 -0.9291 -0.4007 -0.1267 -0.4829 -0.6075 -0.7594 -1.3627 0.4069 0.4236; y=1.7159 -1.2786 -0.3744 0.5986 -0.6290 -1.0179 -1.0921 -2.6222 1.6396 1.8324; plot(x,y,*) % 散点图 a=polyfit(x,y,1) % a(1)是一次项系数, a(2)是截距项

15、 yy=polyval(a,x); hold on plot(x,yy),例:,2. 多元线性回归分析,设x1, x2, , xk为自变量,y为因变量,考虑y对x1, x2, , xk的线性回归: 假设进行了n次观测.,b=regress(y, X) 或 b, bint, r, rint, stats=regress(y, X),多元线性回归分析的Matlab实现:,y: 因变量的观测值所构成的列向量. X:自变量的取值构成的矩阵, X各列(除第1列外)就是自变量的n次取值。,b: 最小二乘估计法得到的回归系数 bint:各回归系数的置信区间 r: 残差 rint:各残差的置信区间 stats: 输出拟合优度R2 、F值和p值,x=0.7608 -0.9291 -0.4007 -0.1267 -0.4829 -0.6075 -0.7594 -1.3627 0.4069 0.4236; y=1.7159 -1.2786 -0.3744 0.5986 -0.6290 -1.0179 -1.0921 -2.6222 1.6396 1.8324; n=length(x); X=ones(n, 1), x; b, bint, r, rint, stats=regress(y, X),例:,T

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号