数据统计建模方法7月28日

上传人:wt****50 文档编号:53503145 上传时间:2018-09-01 格式:PPT 页数:134 大小:2.09MB
返回 下载 相关 举报
数据统计建模方法7月28日_第1页
第1页 / 共134页
数据统计建模方法7月28日_第2页
第2页 / 共134页
数据统计建模方法7月28日_第3页
第3页 / 共134页
数据统计建模方法7月28日_第4页
第4页 / 共134页
数据统计建模方法7月28日_第5页
第5页 / 共134页
点击查看更多>>
资源描述

《数据统计建模方法7月28日》由会员分享,可在线阅读,更多相关《数据统计建模方法7月28日(134页珍藏版)》请在金锄头文库上搜索。

1、数学建模中的统计方法,朱和贵 ,全国大学生统计建模大赛,时间: 2009年开始 举办单位: 中国统计教育学会、中国现场统计研究会、中国数学会概率统计学会 参赛对象: 本科生,研究生 论文题目: 比赛以撰写自由选题的论文方式进行,中国大学生数学建模竞赛(CUMCM),1992年中国工业与应用数学学会(CSIAM)开始组织,1994年起教育部高教司和CSIAM共同举办(每年9月),2009年33省/市/区(含港澳)的1137所学校15042队参加,赛题和优秀答卷刊登于次年“数学的实践与认识”(2001年起刊登于当年“工程数学学报”),网址:http:/,奖励:证书 (“一次参赛,终身受益”),等级

2、:全国一等2%、二等 6%;赛区奖1/3,非数学专业学生约90%(其中约10%来自非理工类专业),我国CUMCM竞赛规模,学生欢迎:“一次参赛,终身受益”研究生导师们的认同企业界的认同赞助教育改革同行的认同:“成功范例”国际同行的认同,竞赛的反响,IBM 中国研究中心- 招聘条件 Position title: Business Optimization(BJ) 1Background in industrial engineering, operations research, mathematics, Artificial Intelligence, management science

3、etc. 2. Knowledge in network design, job scheduling, data analysis, simulation and optimization 3. Award in mathematical contest in modeling is a plus 4. Experience in industry is a plus 5. Experience in eclipse or programming model / architecture design is a plus -Feb. 18, 2006, http:/ 中国研究中心: Busi

4、ness Analysis Optimization Job Requirements: 1、PhD M.S. in mathematics, statistics, computer science, industrial engineering management science etc. 2、Self-motivated, responsible, able to wk independently under tight deadline willing to wk under pressure. 3、Skill in applied mathematics, including ma

5、thematical programming, statistics, data mining, simulation etc. 4、Knowledge in supply chain logistics strategy modeling, simulation, planning optimization. 5、Strong interest basic knowledge about industry trends, technologies, solutions in analytics optimization. 6、Experience in ERP/SCM/CRM system

6、SCM consulting practice is a plus. 7、Award in highly regarded mathematical modeling contest is a plus. 8、Experience in eclipse, Java, architecture design is a plus.-March 26, 2009, http:/ 但不得与队外任何人讨论(包括上网讨论),宗旨,创新意识 团队精神 重在参与 公平竞争,标准,假设的合理性,建模的创造性,结果的正确性,表述的清晰性。,2018/9/1,9,一、CUMCM历年赛题的分析,数学建模竞赛的规模越来

7、越大,水平越来越高;竞赛的水平主要体现在赛题水平的提高;赛题的水平主要体现: ()综合性、实用性、创新性、即时性等; ()多种解题方法的创造性、灵活性、开放性等; ()给参赛者留有很大的发挥创造的想象空间。纵览18年的本科组36个题目,可以从问题的实际意义、解决问题的方法和题型三个方面作一些简单的分析。,2018/9/1,10,一、CUMCM历年赛题的分析,36个问题的从实际意义分析大体上可分为:工业、农业、工程设计、交通运输、经济管理、生物医学和社会事业等七个大类。,工业类:电子通信、机械加工与制造、机械设计与控制等行业,共有8个题,占26.7%。 农业类:个题,占3.3%。 工程设计类:

8、3个题,占10.0%。,交通运输类:3个题,占10.0% 经济管理类:5个题,占16.7% 生物医学类:5个题,占16.7% 社会事业类: 5个题,占16.7%,有的问题属于交叉的,或者是边缘的。,CUMCM:1992-2009,2018/9/1,11,一、CUMCM历年赛题的分析,3、从问题的解决方法上分析,从问题的解决方法上分析,涉及到的数学建模方法:几何理论、组合概率、统计(回归)分析、优化方法(规划)、图论与网络优化、层次分析、插值与拟合、差分方法、微分方程、排队论、模糊数学、随机决策、多目标决策、随机模拟、灰色系统理论、神经网络、时间序列、综合评价、机理分析等方法。,2018/9/1

9、,12,用的最多的方法是优化方法和概率统计的方法.用到优化方法的共有21个题,占总数的70%,其中整数规划4个,线性规划6个,非线性规划14个,多目标规划5个。用到概率统计方法的有16个题,占53.3%,几乎是每年至少有一个题目用到概率统计的方法。用到图论与网络优化方法的问题有5个;用到层次分析方法的问题有个;,一、CUMCM历年赛题的分析,3、从问题的解决方法上分析,2018/9/1,13,用到插值拟合的问题有6个;用到神经网络的4个;用灰色系统理论的4个;用到时间序列分析的至少2个;用到综合评价方法的至少3个;机理分析方法和随机模拟都多次用到;其他的方法都至少用到一次。大部分题目都可以用两

10、种以上的方法来解决,即综合性较强的题目有25个,占83.3%。,一、CUMCM历年赛题的分析,3、从问题的解决方法上分析,统计的基本概念,参数估计,假设检验,数据的统计描述和分析,我们将用Matlab的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析。,今年新增matlab创新奖,一、统计量,二、分布函数的近似求法,三、几个在统计中常用的概率分布,1,正态分布,密度函数:,分布函数:,其中,m,为均值,,为方差,,.,标准正态分布:,N,(0,1),密度函数,分布函数,F(10,50)分布的密度函数曲线,统计工具箱中的基本统计命令,1. 数据的录入、保存和调用,2.

11、 基本统计量,3. 常见的概率分布函数,4. 频 数 直 方 图 的 描 绘,5. 参数估计,6. 假设检验,7. 综合实例,一、数据的录入、保存和调用,例1 上海市区社会商品零售总额和全民所有制职工工资总额的数据如下:,统计工具箱中的基本统计命令,1年份数据以1为增量,用产生向量的方法输入.命令格式: x=a:h:bt=78:87,2分别以x和y代表变量职工工资总额和商品零售总额.x=23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4y=41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,3

12、将变量t、x、y的数据保存在文件data中.save data t x y,4进行统计分析时,调用数据文件data中的数据.load data,方法1,1输入矩阵: data=78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4; 41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0,2将矩阵data的数据保存在文件data1中:save data1 data,3进行统计分析时,先用命令:load data1 调用数据文件data

13、1中的数据,再用以下命令分别将矩阵data的第一、二、三行的数据赋给变量t、x、y:t=data(1,:)x=data(2,:)y=data(3,:) 若要调用矩阵data的第j列的数据,可用命令:data(:,j),方法2,二、基本统计量,对随机变量x,计算其基本统计量的命令如下:均值:mean(x) 中位数:median(x) 标准差:std(x) 方差:var(x) 偏度:skewness(x) 峰度:kurtosis(x),例 对例1中的职工工资总额x,可计算上述基本统计量.,例1 上海市区社会商品零售总额和全民所有制职工工资总额的数据如下:,x=23.8 27.6 31.6 32.4

14、 33.7 34.9 43.2 52.8 63.8 73.4; y=41.4 51.8 61.7 67.9 68.7 77.5 95.9 137.4 155.0 175.0;,X=mean(x),median(x),std(x),var(x),skewness(x),kurtosis(x)X =41.7200 34.3000 16.4544 270.7462 0.8590 2.4037,Y=mean(y),median(y),std(y),var(y),skewness(y),kurtosis(y)Y =1.0e+003 *0.0932 0.0731 0.0464 2.1497 0.0007

15、0.0020,三、常见概率分布的函数,MATLAB工具箱对每一种分布都提供5类函数,其命令字符为: 概率密度:pdf 概率分布:cdf 逆概率分布:inv 均值与方差:stat 随机数生成:rnd,(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.),在MATLAB中输入以下命令: x=-6:0.01:6; y=normpdf(x); z=normpdf(x,0,2); plot(x,y,x,z),1密度函数:p=normpdf(x,mu,sigma) (当mu=0,sigma=1时可缺省),如对均值为mu、标准差为sigma的正态分布,举例如下:,3逆概率分布:x=norminv(P,mu,sigma). 即求出x ,使得PXx=P.此命令可用来求分位数.,2概率分布:P=normcdf(x,mu,sigma),

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号