数学建模影响戒烟成功因素的分析报告

上传人:xmg****18 文档编号:118839592 上传时间:2019-12-27 格式:DOC 页数:28 大小:386.50KB
返回 下载 相关 举报
数学建模影响戒烟成功因素的分析报告_第1页
第1页 / 共28页
数学建模影响戒烟成功因素的分析报告_第2页
第2页 / 共28页
数学建模影响戒烟成功因素的分析报告_第3页
第3页 / 共28页
数学建模影响戒烟成功因素的分析报告_第4页
第4页 / 共28页
数学建模影响戒烟成功因素的分析报告_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《数学建模影响戒烟成功因素的分析报告》由会员分享,可在线阅读,更多相关《数学建模影响戒烟成功因素的分析报告(28页珍藏版)》请在金锄头文库上搜索。

1、. . .题目:影响戒烟成功的因素分析姓名1:许沛韩姓名2:马雪瑜姓名3:秦栋2012年8月20日星期一 专业资料.目录摘要3关键词3问题重述4问题分析5建模过程5问题一5模型假设与约定5符号说明及名词定义6模型建立与求解6问题二9模型假设与约定9符号说明及名词定义9建立模型进行求解9问题三15模型假设与约定15符号说明及名词定义15建立模型进行求解16问题四18模型优缺点19参考文献及参考书籍和网站19附录20摘要 据调查,中国是烟草生产和消费大国,生产和消费均占全球三分之一以上。目前,中国约有亿吸烟者,尽管与之前相比吸烟率略有下降,但是随着中国总人口的增加,吸烟人数仍然在增加。为了帮助相关

2、人士摆脱烟瘾的困扰,研究小组对234个自愿表示戒烟但还未戒烟的人进行调查,并记录下了调查的数据。根据数据,我们对戒烟成功的因素、再次吸烟的累加发病率和影响戒烟时间长短的因素进行分析。在分析过程中,我们利用MATLAB和SAS统计工具对数据进行拟合并进行逐步多元回归分析和方差分析,其次在建立模型时我们还利用了残差分析法发现了模型的缺陷,并及时引入交互作用项来对模型进行修改。而在分析再次吸烟的累加发病率时,我们用控制变量法对各个影响因素的数据进行控制并在Excel中用直方图表现出来,使其看起来直观易懂。最后,通过了对其建立起模型分析,得出了影响戒烟成功的因素有每天抽烟的支数、CO的浓度和调整的CO

3、浓度等三个因素,而影响戒烟时间长短除了上述三个因素外则还有性别的因素在影响。关键词累加发病率、CO的浓度、调整的CO浓度问题重述为了帮助相关人士摆脱烟瘾的困扰,研究小组展开了调查,对234个自愿表示戒烟但还未戒烟的人进行调查. 在他们戒烟的这一天, 测量了每个人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO 测定的时间. CO的水平提供了一个他们先前抽烟数量的客观指标, 但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO 的水平. 记录下研究对象的性别、年龄及自述每日抽烟支数. 这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病

4、率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 戒烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数.假定他们全部没有人中途退出研究. 1)试分析上述234人中再次吸烟的累加发病率在不同因素下的分布情况。 2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?若影响,请利用附录中的数据,对其进行定量分析。 3)建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。 4)撰写一篇短文,向有志于戒烟的人士提供戒烟对策和建议。问题分析上述问题中提到对234个自愿表示戒烟但还未戒烟的人进行调查. 在他们戒烟的这一天, 测量了每个

5、人的CO(一氧化碳)水平并记下他们抽最后一支烟到CO 测定的时间. CO的水平提供了一个他们先前抽烟数量的客观指标, 但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO 的水平. 记录下研究对象的性别、年龄及自述每日抽烟支数. 并用这些数据来估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例。为此,我们第一步应该明确再次吸烟的累加发病率的概念及根据常识自己估计一下影响戒烟时间和能否戒烟的因素有哪些,然后再从数据中找出一些有代表性的数据进行整理,接着建立起数学模型,用数据去拟合运算来验证假设并做出修改以解决问题。最后再从所建立的模型中提取有

6、效信息,对有意戒烟者提出一些建议。建模过程问题一模型假设与约定1、假定被调查者没有人中途退出研究。2、假定被调查者中没有坚持到365天的都认为是再犯者。符号说明及名词定义再一次吸烟的累加发病率:原吸烟者戒烟一段时间后又再吸烟所占周刚开始调查时总人数的比例模型建立与求解在上述问题中,我们以再犯者人数除以总调查人数来计算累加发病率。首先,我们先从234个被调查者中去除了10个数据不全的调查者。然后再对剩下的224个被调查者进行分析,发现其中有193个是属于再犯者,因此,这些人中再一次吸烟的累加发病率是193/224。为了看出再次吸烟的累加发病率的分布情况,我们利用控制变量法分别对性别、各个年龄段、

7、调整的CO浓度和戒烟天数进行分析,在对年龄段进行分析的时候,我们将年龄分成青年、中年和老年三个年龄阶段进行分析,并做出其分布直方图如下图所示:不同年龄段和不同性别之间累加发病率条形统计图不同年龄段和不同性别累积发病率表年龄段/性别男女合计青年39/22453/22492/224中年35/22450/22485/224老年13/2243/22416/224合计87/224106/224193/224上图则是对性别还有各个年龄段进行分析的直方图,从上图可以看出,在同一个年龄段中,青年和中年的女性的累加发病率高一点,这个可能是由女性吸烟的人数少导致基数低和女性的毅力低的原因引起的,而相对来说老年的男

8、性累加发病率高于女性。而在同一性别中,在三个年龄段中,女性的累加发病率最高的是中年阶段;而男性的累加发病率最高的是青年阶段。上图则是不同调整的CO浓度情况下累积发病率的不同分布,由图可以看出在(1400,1600)这个范围内的累加发病率是最高的,在小于1000的情况下累加发病率是最低的。在小于1600之前的阶段是随着调整浓度的增高,累加发病率也随着增大,在1600之后又回归正常,这是因为大于1600时的人数很少,所以累加发病率也就比较小。上图则是每天抽烟支数不同情况下累加发病率的不同分布,由上图可以看出每天抽烟支数在(10,20)范围内的累加发病率是最高的,在大于50的范围内的累加发病率是最低

9、的。从图中还可以看出一点就是从每天抽烟支数大于10支起,随着抽烟支数的增加,累加发病率反而减少,这其中的原因是每天抽烟支数多的人群所占的比例很少,基数小,所以累加发病率也会小。问题二模型假设与约定1、假定被调查者没有人中途退出研究。2 、假定被调查者自述提供的数据是可靠。3、 假定被调查者是在自愿戒烟的人群中随机选取的,没有任何人为的主观因素影响。符号说明及名词定义:年龄:性别(1表示男性,2表示女性):每日抽烟支数:CO的浓度:调整的CO浓度Y:戒烟时间(天数)建立模型进行求解为了分析问题,首先,我们从已知的234个调查者中剔除了10个资料不全的调查者之后剩下224个调查者。然后再将这224

10、个调查者中戒烟天数相同的调查者的各项影响因素中的数据取均值当成一个新的新的数据进行分析。以下的模型建立也都是在此基础上进行的(处理后的数据如附录1所示)。基本模型为了简单起见,在大假设的前提下,我们再假定年龄、性别、每日抽烟支数、调整的CO浓度及CO浓度对戒烟时间(长短)的作用是线性的;同时年龄、性别、年龄、性别、每日抽烟支数、调整的CO浓度及CO浓度等因素之间没有交互作用。由此设戒烟时间Y与(年龄)、(性别)、(每天抽烟支数)、 (CO的浓度)和(调整的CO浓度)之间的多元线性回归模型为:其中是待估计的回归系数,是随机误差。 利用MATLAB的统计工具可以得到回归系数及其置信区间(a=0.0

11、5)、检验统计量的结果,如下表所示参数参数估计值置信区间-113.8034-433.0170 ,205.4102-0.2095-2.5236 ,2.104538.8328-20.0172 ,97.68281.8081-0.4675 ,4.0837-0.4936-0.7694 ,-0.21780.1566-0.0529 ,0.3662=0.2 F=3.2 P= 0进一步分析讨论从上表中,我们可以看出,即因变量(戒烟时间的长短)的20%可由模型确定,而且F的值才3.2,所以该模型还需要改进。还有一点需要指出,以上的求解我们都以各个变量之间没有相互作用来做的,而现在看来各个变量之间应该会有一些交互作

12、用,因此,我们对刚才建立的模型进行修改。修改后的模型结合常识,我们认为年龄、性别与每天抽烟的支数之间可能会有交互作用。因此,在上述的模型中我们增加了与、的交互项后,得到的模型记作:其中是待估计的回归系数,是随机误差。再一次利用MATLAB的统计工具经过多次的去点拟合可以得到回归系数及其置信区间(a=0.05)、检验统计量的结果,如下表所示:参数参数估计值置信区间195.82263.0853 , 388.5599-1.9402-4.4711,0.59089.6849-54.1522 ,73.5220-14.4118-23.0221,-5.8014-0.1284-0.2256 ,-0.03110.

13、06880.0125 ,0.12520.26810.1880 , 0.34820.0341 -0.0765 , 0.1447-0.5083 -3.0585 ,2.0418=0.8051 F=18.0759 P= 0进一步分析讨论从上表中,我们可以看出=0.8051,即因变量(戒烟时间)的80%可由该模型确定,F=18.0759也还可以,p远小于a,因而模型总体上来说还是可以用的。但是美中不足的是、的置信区间包含了零点。为此,我们再对此模型进行了修改。更好的模型根据上述的分析,我们将上述模型中的性别()、还有年龄、性别分别与每天抽烟的支数的交互去掉,改成以下模型:其中是待估计的回归系数,是随机误

14、差。利用MATLAB的统计工具对以上式子进行回归分析,经过多次的去点拟合,得到了以下回归系数及其置信区间(a=0.05)、检验统计量的结果(其运算过程见附录2),如下表所示:参数参数估计值置信区间205.0931 153.4352 ,256.7510-1.7613-2.2552 ,-1.2673-14.4455-16.4947 ,-12.3963-0.2012-0.2566 , -0.14580.07350.0404 , 0.10660.30310.2601 ,0.3461=0.9325 F=85.5996 P= 0进一步分析讨论 由上表,我们可以得出=0.9325,即因变量(戒烟时间)的93.25%可由该模型确定,F=85.5996也远大于临界值,p远小于a,因此,该模型整体上还是可以用的,也可从中得出该模型的关系式为: 模型中的各个回归系数的含义可解释如下:的系数为,说明年龄每增加一岁,戒烟时间减少天;的系数为,说明每天抽烟的支数每增加一支,戒烟时间减少天;的系数为,说明CO的浓度每增加一个单位,戒烟的时间减少天;的系数为,说明调整的CO浓度每增加一个单位,戒烟的时间增加天。 综上所述,影响戒烟时间长短的因素有年龄()、每天抽烟

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号