出租车数量估计赵朋飞修改版B题

上传人:pu****.1 文档编号:498648832 上传时间:2022-12-12 格式:DOCX 页数:16 大小:97.57KB
返回 下载 相关 举报
出租车数量估计赵朋飞修改版B题_第1页
第1页 / 共16页
出租车数量估计赵朋飞修改版B题_第2页
第2页 / 共16页
出租车数量估计赵朋飞修改版B题_第3页
第3页 / 共16页
出租车数量估计赵朋飞修改版B题_第4页
第4页 / 共16页
出租车数量估计赵朋飞修改版B题_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《出租车数量估计赵朋飞修改版B题》由会员分享,可在线阅读,更多相关《出租车数量估计赵朋飞修改版B题(16页珍藏版)》请在金锄头文库上搜索。

1、宝鸡文理学院2014年数学建模培训第二次模拟姓名系别学号赵朋飞数学系201290014087王文鹏计科系201296014053叶鹏物理系201291024078出租车数量的估计问题摘要本文运用概率统计的思想,解决了出租车数量的估计问题。依据题目要求,我们建 立了两种估计模型,估算出了该小镇出租车的数量,并且对模型的可靠性进行了检验。对于模型一:首先,题目所给样本数据是随机的,通过MATLAB软件作图,发现区 间间隔为100 时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。 而车牌号又是按顺序排列的,所以样本中的最小车牌号与最大车牌号趋近于该市机动车 出租车车牌号的起始号与终止

2、号,试假设该机动车出租车车牌号区间为【24000,31999,进而求出该市机动车出租车的总数量为N = 8000辆;然后,对于样本中所给的出租车牌 号,经过后减运算,得到每两个相邻的车牌号之间间隔的车牌号数量,用EXCEL软件排 序并作图,剔除了极端差值,其余求其平均数 ,即每辆出租车车牌号之间间隔平均是 Ax = 55 ;最后计算出该小镇出租车的数量n二146辆。对于模型二:由于模型一中确定该市机动车出租车车牌号区间不甚精确,我们考虑 对其进行优化。首先,我们运用了两种方法估计了该市机动车的总数量:方法一,引用 盟军估计德军坦克数量的模型估计出该市机动车的总数为8046 ;方法二,运用极大似

3、然 估计函数确定该市机动车出租车的车牌号区间为24176,31982,经端点值作差得出该市 机动车出租车的总数为7806 ;(这两种方法貌似得去掉一个)将两种方法(去掉)|所求 的该市机动车总数均值作为该市机动车最终数量N = 7928。然后,把样本的车牌号每隔 1000进行统计,得到每1000个车牌号中的出租车车牌数量,对得到的数据用SPSS软件进 行检验,显示呈正态分布并得其均值y=17,采用极大似然估计法求得正态分布总体 N(PQ2)中参数卩=y = 17,即该市每1000辆机动车出租车中有17辆出租车属于分配在该小镇。最后计算出该小镇有出租车n = 153辆综合两种模型,模型一对机动车

4、车牌号范围的区间估计不够精确,而模型二在估算机动车牌号范围的区间时,恰当运用盟军估计德军坦克数量模型与极大似然估计法,比 较精确地求得该市机动车的数量。另外,模型二对车牌号分区间考虑使得估算更为合理。 模型检验中偏态系数与峰度系数对统计数据的分析使得模型更为完善。(改为)最后我 们对两种模型的优缺点进行了讨论。关键字:极大似然估计 正态分布 SPSS 软件 偏态系数 峰度系数一、问题重述小张寒假回到他的家乡某小镇,在出门探亲访友过程中,他发现小镇的出租车,存 在诸多问题。他打算从小镇的出租车数量入手,解决这些问题。在接下来的几天时间里, 他随机的记录了 133 辆出租车车牌号的后 5 位见(附

5、录 1 。他只知道车牌号是按顺序 排列的,但他不知道车牌的起始号,也不知道车牌的终止号,他希望通过上述数据估计 出小镇的出租车数量。要求帮助小张设计一种或多种数学模型,来估计小镇出租车的数量,并分析方法的可靠性。二、模型假设1、样本统计过程中没有考虑外来车辆2、该市机动车的车牌号连续。3、该市机动车与车牌号一一对应。4、该市机动车车牌号的后五位均由数字组成三、符号说明符号含义N该市机动车数量X(0)(i)i 二 1,2,133原始车牌号序列X(i)(i) i 二 2,-,133样本相邻车牌号的差值序列X差值的平均值Ax俩车牌号的间隔n小镇出租车数量卩样本均值I、/. _ I _-2_ S -样

6、本方差方差a样本中最小的车牌号b样本中最大的车牌号k样本中车牌号的数量p该市机动车下限的最大似然估计值q该市机动车上限的最大似然估计值卩总体均值Xi组中值Fi对应比重a3a4偏态系数峰度系数、问题分析本题属于概率统计问题。要估算出该小镇出租车的数量,首先需要估算出该市机动 车出租车的数量。考虑到题目所给样本数据是随机的,通过MATLAB软件作图,发现区 间间隔为100 时,落在每个区间车牌号数量是均匀分布的,即车牌号服从于均匀分布。 我们可以采用点估计,即以实际样本指标数值作为总体参数的估计值,估算出该市机动 车的数量,进而估计出小镇出租车数量。我们可以从以下两种思路来求解:思路一:由于样本中

7、的车牌号均匀分布,考虑到所在地为小镇且车牌号是按顺序排 列的,所给车牌号码的最小值与最大值就非常趋近于起初号和终止号,所以假设车牌号 区间为24000,31999。经过后减运算,剔除坏数据,得出每两辆车牌号之间相差的个 数,从而得出小镇出租车的数量。思路二:对思路一中确定总体车牌号区间存在的不精确性,我们将其进行优化,可 以用点估计1与极大似然函数(和摘要对应,去掉一种方法)确定总体的车牌号区间。 参照点估计中最小无偏估计,采用较为准确的计算公式确定车牌号区间,即为该市机动 车总数,当然,我们还可以利用极大似然函数确定车牌号区间。(与上对应,去掉一种 方法)其次,将样本的车牌号每隔1000 进

8、行统计,得到的统计数据求其平均值,把所得 平均值与机动车总数的千分之一的乘积作为该小镇出租车数量的估计值。五、模型建立与求解5.1 模型一:对于随机分布的样本数据,若其服从于均匀分布,可取接近样本最大值与最小值的 数据作为总体区间的上下限,即区间a,b,进而可得总体的数量为N二b-a +1据问题分析知样本中的车牌号均匀分布,且已设车牌号区间为24000,31999,故得总的车牌号数量,即该市机动车的数量N二8000。由题目已给条件知原始车牌号序列:x(0)= x(o)(1),x(o)(2),,x(o)(133)即:x(0)二24176,24231,31982由后减运算计算,即求出后前两个数据之

9、差:x(1)(i)二 x(0)(i) x(0)(i-1),其中 i = 2,-,133 ;可得一个新的序列:x(1) = x(1)(2),xw(3),x(1)(133)利用EXCEL软件,以此新序列排序作为纵坐标并作图1 :数据差值图017131925313743495561677379859197 103 109 115 121 127图1观察图 1,发现中间部分有很多均匀的差值,两端出现较大的波动,忽略两端极端差值,即剔除40以下和90100以上的差值,其余求平均值,经EXCEL软件计算得平均 值约为X = 55,即两车牌号之间间隔Ax = 55 。由此估计出出租车数量为:Nn =-Ax结

10、合以上数据,估计出该小镇共有出租车146辆。5.2 模型二 (去掉一种方法,建议去掉盟军模型)1. 估计样本对应总体的取值空间(该市机动车数量):方法一:在统计学理论的估计中,用不放回抽样来估计离散型均匀分布最大值问题 是著名的德国坦克问题1。 针对该问题,建立盟军估计德军坦克数量模型。对于点估计(实际样本指标数值作为总体参数的估计值),最小方差无偏估计由下式给出并以此确定总体取值区间:M k +1N 二b - aka是样本最小值,b是样本最大值,k是样本大小。题目中所给车牌号为随机抽取的一组数据,其为离散均匀分布,结合题目已知,样本中出租车车牌号的最小值a二24176,出租车车牌号的最大值b

11、=31982,出租车数量 k二133,代入以上公式求得N二8046 。即在车牌号连续的情况下,可估计该市机动车数量 N = 8046方法二:再者,我们可以以极大似然估计来确定总体取值区间:设总体C在p,q上服从于均匀分布,x ,x ,,x是一个样本值,我们来确p,q的最 1 2 n大似然估计量:记x = min(x ,x ,x ), x = max(x ,x,x ), C的概率密度是(1) 1 2 n( n)1 2 n1 ,p x qf (x; p, q) = q - Pq x 。似然函数为(n)0,else由于 p x1 , x2 , ,x133 q ,等价于 p x(1)L(p, q)二1

12、(q - p) n1(x -x )nn1即L(p, q)在p = x , q = x时取到最大值(x - x )-n。(1)(n)(n)(1)故 p,q 的最大似然估计值为:p = x = min x , q 二 x 二 max 1in 1(n)1i n即:p = min X , q = max X1in i1in i该市机动车出租车车牌号C在p, q上服从均匀分布,24176,24231,1982为样本出租车车牌号,样本最小值x(i、= 24176,样本最大值x = 31982,可求得p的最大似然(1)( n )估计量为24176,q的最大似然估计量为31982。即该市机动车出租车车牌号区间

13、为24176,31982,在车牌号连续的情况下,可估计该市机动车数量N二7806 。综合考虑方法一与方法二所得该市机动车数量N,我们将其平均值(N = 7928)作为 估计该小镇出租车数量的基数。2. 将样本数据分成若干区间考虑(估计该小镇出租车数量):把样本的车牌号每隔1000进行统计,得到每1000个车牌号中的出租车车牌数量并作 表 1:区间出租车车牌数量(个)24000- 249991625000-259991826000-269991927000-279991728000-289991729000-299991630000-309991731000-3199913表 1:出租车车牌数量

14、统计表观察表1,对于指定区间的出租车车牌数量我们加以分析,通过 SPSS 软件2, 使用K-S对其进行正态性检验(附录2),检验结果如图2 :假逮检验汇总测试踽常恕蠻蠶弊労:平羣样本 kolriiogorov- Smii riov 检验761黯显不渐进显着性.显著性水平是图 2:正态性检验根据检验结果,指定区间的出租车车牌数量符合正态分布。接下来求正态分布N(PQ2)中卩Q2的极大似然估计量:y ,y,y是正态分布总体N(卩Q2)的随机样本,需要求正态分布N(RQ2)参数的 1 2 n极大似然估计量。似然函数为:(y - 卩)2r in22 exp2a 2.2兀a 2丿L( |lx, cy2) = 11expi=1J2 兀y12a 2 (y -卩)2ii=1取对数,得:n n 1 nln L(2) = - ln(2 兀)一ln a2 222兀a 2i=1那么似然方程组为:解得:da 2 i i=1一卩)2 = 0莎ln L( “2)=n2a 2+2a4i=1一卩)2 = 0卩二-工y = ynii=1a2=-工(ynii=1因此,正态分布总体平均数的极大似然估计量为:入

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号