机器学习k-means算法在电竞选手分析中的应用

上传人:小** 文档编号:34156310 上传时间:2018-02-21 格式:DOC 页数:5 大小:73KB
返回 下载 相关 举报
机器学习k-means算法在电竞选手分析中的应用_第1页
第1页 / 共5页
机器学习k-means算法在电竞选手分析中的应用_第2页
第2页 / 共5页
机器学习k-means算法在电竞选手分析中的应用_第3页
第3页 / 共5页
机器学习k-means算法在电竞选手分析中的应用_第4页
第4页 / 共5页
机器学习k-means算法在电竞选手分析中的应用_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《机器学习k-means算法在电竞选手分析中的应用》由会员分享,可在线阅读,更多相关《机器学习k-means算法在电竞选手分析中的应用(5页珍藏版)》请在金锄头文库上搜索。

1、机器学习 k-means算法在电竞选手分析中的应用 柯嘉鑫 北京 161中学 摘 要: 随着计算机技术的发展, 数据挖掘在很多方面得到应用, 尤其是在电竞行业发展迅速的今天, 数据挖掘技术被应用到电竞分析中。本研究用机器学习的方法进行数据挖掘, 将机器学习中 K-means算法应用于电子竞技职业选手, 对电竞选手比赛数据的指标进行聚类, 划分为三个不同的等级, 并对聚类结果进行分析, 将个人能力水平数据化, 用聚类结果指导职业选手今后的针对性训练以及发展方向, 为电子竞技行业标准化、成熟化起到推动作用。本研究旨在推动计算机技术中机器学习的发展, 为我国电子竞技提供参考数据, 对日后电竞选手分析

2、的亚那就具有很大的意义。关键词: 机器学习; 数据挖掘; 聚类 K-means算法; 电子竞技; 计算机技术; 作者简介:柯嘉鑫 (2000) , 男, 广东人, 现就读于北京 161中学。1 引言随着信息化、数字化的发展, 计算机技术渗透到人们生活的方方面面, 在社会生活中展现出强大的力量, 与此同时, 机器学习作为一种新型的技术, 在科研中占据扮演重要角色, 其通过模拟或实现人类的学习行为, 以获取新的知识或技能, 重新组织已有的知识结构使之不断改善自身的性能的一项技术。作为人工智能的核心以及今后重要发展方向, 机器学习在商务、生物学、地球环境学上都有不同程度的应用, 在社会实用中有重要的

3、应用价值和广阔的前景, 合理的将机器学习 K-means算法应用于行业中, 可以让一个新兴领域在数据挖掘, 分析指导方面取得先机1,2。近些年来中国电子竞技行业突破传统, 迅速崛起, 方兴未艾, 逐渐走入了人们的视野, 然而由于该领域在中国正处于起步阶段, 针对其产生的大数据的分析方法十分缺乏, 导致在对于竞技理念风格, 以及变动方面发展缓慢。采用 K-means算法对职业选手进行评估, 是基于现在电竞数据分析空白现状的重要突破和创新。本研究采用数据挖掘中典型的聚类 K-means分析算法, 针对 Dota2项目选手展开初步研究, 收集在国际赛事中参赛战队各选手的实战数据以及细节成果, 通过反

4、复学习、调整, 以获得合适的聚类中心, 将参赛选手划分不同类别, 使符合相应风格和打法理解的选手划归为一类, 结合聚类结果对选手进行分析3-5。2 K-means算法2.1 算法思想1967年, Macqueen 提出了 K-means算法思想6, 把空间中数据集中的 n个数据点分为 k组, 把每组的均值作为中心点, 并以这 k个点为中心进行聚类, 对最靠近他们的对象划为一类。通过 t次迭代, 重新计算数据点与各组中心的相似度, 逐次更新各聚类中心的值, 直至得到最好的聚类结果7,8。2.2 算法特点K-means算法作为数据挖掘中经典的聚类分析算法, 是一种比较快速有效的聚类方法, 能根据较

5、少的已知聚类样本的类别确定部分样本的分类;其次, 为克服少量样本聚类的不准确性, 该算法本身具有优化迭代功能, 在已经求得的聚类上再次进行迭代修正, 确定部分样本的聚类, 优化了初始监督学习样本分类不合理的地方;第三, 由于只是针对部分小样本可以降低数据挖掘所需时间。2.3 具体算法算法流程图如图 1所示, 给定一个训练集:随机选择 K个簇的质心, 我们将其设为:聚类开始, 选取 k个质心点, 通过多次运行, 每次运行都是随机选取质心点, 最终确定平均误差和最小的几个点作为质心点;接着进行距离的计算, 求每个样本与各个质心之间的距离, 将该样本数据归为距离小的质心所在的类中, 根据不同情况,

6、可选用欧几里德距离或曼哈顿距离, 本论文采用欧几里德距离;进而计算每个聚类的平均值, 作为新的质心, 不断的重复第二步与第三步的计算过程, 知道质心带你收敛即不再发生变化, 表示聚类结束。各样本与质心的距离表达式如下:聚类质心的选取表达式:3 基于 k-means算法的电竞研究与分析图 1 k-means算法流程图 下载原图图 2 分析流程图 下载原图表 1 选手电竞得分结果表 下载原表 图 2为研究的技术路线图。(1) 数据采集本研究中数据来源于某游戏国际邀请赛通用平台中部分选手数据作为本次的分析样本数据, 共计 15位参赛选手的比赛数据, 其中包含比赛中场均 KDA、总击杀数、总死亡数、总

7、助攻数等数据信息, 这些数据都快可以从比赛平台上获取, 真实有效。(2) 数据预处理对数据进行预先处理, 是数据挖掘中数据分析的首要步骤, 也是重中之重, 对原数据进行筛选、去噪、标准化等操作, 将数据变为有效数据, 不仅可以提高数据挖掘的效率, 同时决定了数据挖掘结果的准确性。首先对数据进行集成、整合, 将多位参赛选手的数据整合到一张表中, 将参与聚类分析的 14个属性整合到表中, 如表 1所示。数据清洗:将原数据进行标准化, 从表 1中可看出原始数据没有统一, 因此, 对数据进行标准化处理, 本研究采用经典的数据标准化方法极差法, 表达式如下:(3) 聚类分析本研究选取具有代表性的两个属性

8、总击杀数和场均 XPM, 对选手进行聚类, 选用的开发工具是 Py Charm, 开发语言是 Python。Python 开发语言相对于其他语言, 以脚本的形式存在, 操作简单, 将选手聚集成三类, 部分代码如图 3所示:图 3 部分代码图 下载原图仿真结果如图 4所示:图 4 聚类结果图 下载原图聚类结果表如表 2所示。从图 4中可以看出将 15名选手分成 3类, 其中紫色表示偏重自身经验获取与发育, 具备一定后期能力, 团队支撑的选手;中间绿色表示能够在发育与参战中权衡并保持自己的节奏, 执行率较高, 能在团队中发挥应有的作用, 全能型的选手;右下角黄色部分表示进攻性很强, 但是容易丢失自

9、己发育节奏的选手。从表2中可以看出第二名选手个人能力较强, 应努力保持。第 9, 12, 15打法较为积极主动, 但是发育能力较差, 要多多与队伍磨合, 稳中求彩。其余选手应更多的开发自己适合的战术, 以有更多发挥空间。表 2 电竞选手聚类结果表 下载原表 4 结论本文将电竞选手的参赛成绩采用数据挖掘中的经典算法 k-means聚类算法, 通过程序仿真, 将选手的个人特色与能力客观地展现出来, 通过聚类分析, 反映出比赛选手之间的竞技水平存在明显差异, 该结果可以便于选手了解自己的不足之处, 以及日后比赛的努力方向, 为各大战队以及俱乐部选手提供有效参考;与此同时, 还可以提供数据给开发公司及

10、相关赛事负责人员提供决策支撑, 便于了解每位选手以及当前版本的节奏和风格, 方便游戏与赛制优化与完善, 逐步推进电子竞技科学化, 成熟化。本文在电竞选手聚类分析中取得一定的成果, 为以后机器学习在电竞分析中的应用奠定了良好的理论基础;但仍然存在不足之处, 比如以后的研究将关联规则与聚类分析算法一同使用, 可以提高算法的性能。参考文献1徐卫广.自动化机器学习领域中 k-means聚类算法应用研究J.工程技术全文版, 2016 (6) :00212. 2熊志斌, 朱剑锋, 王冬.K-means 聚类算法的研究和应用J.电脑编程技巧与维护, 2014 (8) :10-12. 3李双虎, 王铁洪.K-

11、means 聚类分析算法中一个新的确定聚类个数有效性的指标J.河北省科学院学报, 2003, 20 (4) :199-202. 4方开泰, 潘恩沛.聚类分析M.地质出版社, 1982. 5方方, 王子英.K-means 聚类分析在人体体型分类中的应用J.东华大学学报 (自然科学版) , 2014, 40 (5) :593-598. 6张云涛.数据挖掘原理与技术M.电子工业出版社, 2004. 7Hartigan J A, Wong M A.A K-means clustering algorithmJ.Applied Statistics, 1979, 28 (1) :100-108. 8Jain, Anil K.Data clustering:50 years beyond K-meansJ.Pattern Recognition Letters, 2010, 31 (8) :651-666. 9Hartigan J A, Wong M A.Algorithm AS 136:A K-Means Clustering AlgorithmJ.Journal of the Royal Statistical Society, 1979, 28 (1) :100-108.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 管理论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号