《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文

上传人:zhuma****mei1 文档编号:136071745 上传时间:2020-06-23 格式:DOC 页数:52 大小:186.50KB
返回 下载 相关 举报
《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文_第1页
第1页 / 共52页
《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文_第2页
第2页 / 共52页
《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文_第3页
第3页 / 共52页
《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文_第4页
第4页 / 共52页
《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文》由会员分享,可在线阅读,更多相关《《基于关联规则的运动员体能测试优化分析》-公开DOC·毕业论文(52页珍藏版)》请在金锄头文库上搜索。

1、精品摘 要 关联规则挖掘是数据挖掘的一个重要分支,它是指在大量数据中项集之间的有趣的关联或相关联系。关联规则被认为是有趣的,如果它满足最小支持度和最小可信度。近年来,关联规则研究成为数据挖掘中的一个热点,并广泛应用于市场营销、事务分析等应用领域。本文以运动员体能测试数据为分析对象,研究应用数据挖掘技术解决运动员体能指标优化分析问题的方法. 文中重点介绍了关联规则挖掘的原理与方法 , 提出并实现了适宜于网球运动员体能指标优化分析的算法,并进行了实际应用,发现了出乎常规的规律。通过本论文的介绍我们可以对数据挖掘有个初步的了解,对关联规则及其算法有个深刻的理解。通过本论文的结论,我们明白教练员要了解

2、运动状态是不需要定期对所有的体能测试指标进行测试的,教练员只需要对一些指标的测试就可以判断运动员其他指标的情况,进而了解运动员的整体状态,从而达到运动员体能测试的优化。当然,通过论文,我们也发现了很多教练员可能忽视或不知道的一些东西,比如运动员的长距离跑动能力不仅仅与其腿部力量有关,也与其上肢力量有着密切的关联关系,如果一个教练员只训练运动员的腿部力量和跑动能力而不去进行上肢力量的训练,是很难提高他的长距离成绩的。当然数据挖掘在体育事业中的应用还有很多很多,这也显示了数据挖掘在我们体育事业中的重要性。关键词:数据挖掘,关联规则,Apriori算法,频繁集,支持度,置信度 AbstractAss

3、ociation rules mining is an important sub-branch of data mining, which mines interesting association or correlation relationships among a large set of data itemsAssociation rules are considered interesting if they satisfy both a minimum support threshold and a minimum confidence threshold,Associatio

4、n rules mining has become a hot research topic in recent years,and it has been used widely in elective marketing,decision analysis and business managementIn this paper , DM techniques are used in order to analyze the data of physical ability for athletes. Basic principles , methods and typical algor

5、ithms for association rules are discussed. An adjusted algorithm is developed and used for optimizing the target of physical ability of tennis athletes. Experimental results validate these works.Through the introduction of this paper on data mining we can have a preliminary understanding of the asso

6、ciation rules and the algorithm has a deep understanding. By the conclusion of this thesis, we understand that coaches do not need to understand the state of motion of all the physical tests on a regular basis to test the indicators, coaches only need to test some of the indicators can determine oth

7、er indicators, the athletes in order to understand the athletesthe whole state, so as to achieve optimal physical fitness test athletes.Of course, through the papers, we also found a lot of coaches may ignore or do not know something, such as long distance running ability of the athletes not only on

8、 their leg strength, upper body strength is also his close relationship, if a coachMembers only training athletes in the leg strength and running ability but not to the upper body strength training, it is difficult to improve his long-range results.Course in data mining applications in sports and ma

9、ny, it also shows the data mining in the importance of our sport.Keywords: Data mining,Association rule,Apriori algorithm,Frequent items,Support ,Confidence 目 录1 前 言11.1数据挖掘产生与发展11.2传统分析方法与数据挖掘的区别31.3数据挖掘的研究现状41.4数据挖掘中的关联规则51.5本论文的目的和意义61.6本论文的主要工作72 数据挖掘技术92.1数据挖掘的定义和特点92.2数据挖掘的过程102.3数据挖掘系统总体结构112

10、.4数据挖掘的任务122.5数据挖掘的技术及其应用142.6数据挖掘的趋势和面临的困难172.7本章小结183 关联规则挖掘193.1关联规则基础知识193.1.1关联规则的相关定义203.1.2关联规则的两个重要定理213.2关联规则的分类213.3挖掘关联规则的步骤223.4关联规则的研究方向223.5关联规则的数据挖掘的实际应用领域233.6本章小结254 运动员体能测试优化分析的实现过程264.1常用的关联规则的算法264.1.1经典Apriori算法研究264.1.2 Apriori算法的瓶颈问题324.1.3 改进的Apriori算法AprioriTid324.1.3 FP-tre

11、e算法的简单了解364.2运动体能测试分析的研究374.2.1 运动员体能测试数据分析中存在的问题384.3采用关联规则优化体能测试指标394.3.1数据准备394.3.2数据选择404.3.3数据的预处理404.3.4数据挖掘414.3.5挖掘后的结论分析434.4本章小结46致 谢47参考文献48 精品1 前 言1.1数据挖掘产生与发展科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。大量的数据被搜集和存储在各种数据库中,并成指数性增长。让我们来看些身边俯拾即是的现象:Wal Mart公司(美国

12、最大的零售连锁店)每天产生两千万个事务;又如美国航天局1999年发射的地球观测系统每天要产生1200Gb的图像数据;还有生物学领域中数以百万计的遗传基因,世界各国定期进行的人口普查,国土资源地理信息,铁路动态调度控制,公安司法部门的案件处理等等都是海量数据。但是对如此众多的数据的利用还主要是检索查询,效率很低,而且相当数量的数据具有很强的时效性,往往很多数据还没来得及分析就已经过时,数据的价值没有得到充分利用。面对数据的急剧膨胀和高度时效性,一方面,人们苦于不能及时得到科学决策所必须的可靠知识,另一方面,大量宝贵的数据资源甚至还没有得到利用就已经过时,这导致了一个新的问题,即所谓的“数据丰富,

13、知识贫乏”问题,结果是数据库往往变成了“数据的坟墓”,很少被人访问,决策更多地不是依赖信息,而是依赖决策者的直觉。“我们淹没在信息之中,但仍处于知识的饥渴中Johe Naisbett说。我们迫切需要研究新一代数据处理技术,以提高数据的利用率。数据挖掘技术就是在这样的背景下产生的。它的宗旨就是分析处理海量数据,以发现有用的知识,为用户提供所需问题的答案,将“数据的坟墓”变成隐藏着知识的“金矿”。数据挖掘技术的产生也不是一蹴而就的,它的产生和发展其实是一个逐渐演变的过程。电子数据处理的初期,人们就试图通过某些方法来实现自动决策支持,当时机器学习成为人们关注的焦点。机器学习的过程就是将一些已知的并已

14、被成功解决的问题作为范例输入计算机,机器通过学习这些范例总结并生成相应的规则,这些规则具有通用性,使用它们可以解决某一类的问题。随后,由于神经网络技术的形成和发展,人们的注意力转向知识工程,知识工程不同于机器学习之处就是直接给计算机输入已被代码化的规则,专家系统就是这种方法所得到的成果,但由于它投资大、效果不甚理想。80年代人们又在新的神经网络理论的指导下,重新回到机器学习的方法上,并将其成果应用于处理海量商业数据。直到1989年在美国底特律举行了第十一届国际人工智能学术会议,在这次会议上定义了一个新的术语,它就是数据库中的知识发现(Knowledge Discovery in Databas

15、e),简称KDD。人们接受了这个术语,并用KDD来描述整个发现知识的过程,包括最开始的制定业务目标到最终的结果分析,而用数据挖掘(Data Mining,DM)来描述使用挖掘方法进行数据挖掘的子过程。随后,知识发现与数据挖掘流行起来了,大量学者及产业界参与进来,取得长足的进展。数据挖掘是一个众多学科诸如人工智能、机器学习、模式识别、统计学、数据库和知识库、数据可视化等相互交叉、融合所形成的一个新兴的且具有广阔前景的领域。从数据库中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等许多方面。所以,数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。从早期的数据搜索到现在的数据挖掘大约可以分为四个阶段,如表1-1表1-1 数据挖掘的进化历程发展阶段提出问题支持技术产品厂家产品特点数据搜索(60年代)“在过去五年中我的总收入是多少?”计算机,磁带和磁盘IBM,CDC提供历史性的、静态的数据信息数据访问(80年代)“在上海地区去年三月份销售额是多少?”关系数据库(RDBMS),结构化查询语言(SQL),ODBSOracle,Sybase,Informix,IBM,Microsoft在记录级提供历史性的、

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号