基于svm的数据挖掘技术研究

上传人:cjc****537 文档编号:48280702 上传时间:2018-07-12 格式:DOC 页数:38 大小:71.49KB
返回 下载 相关 举报
基于svm的数据挖掘技术研究_第1页
第1页 / 共38页
基于svm的数据挖掘技术研究_第2页
第2页 / 共38页
基于svm的数据挖掘技术研究_第3页
第3页 / 共38页
基于svm的数据挖掘技术研究_第4页
第4页 / 共38页
基于svm的数据挖掘技术研究_第5页
第5页 / 共38页
点击查看更多>>
资源描述

《基于svm的数据挖掘技术研究》由会员分享,可在线阅读,更多相关《基于svm的数据挖掘技术研究(38页珍藏版)》请在金锄头文库上搜索。

1、计算机软件与理论专业毕业论文计算机软件与理论专业毕业论文 精品论文精品论文 基于基于 SVMSVM 的数据挖的数据挖掘技术研究掘技术研究关键词:机器学习关键词:机器学习 统计学习理论统计学习理论 数据挖掘数据挖掘 支持向量机支持向量机 增量学习增量学习摘要:随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、 复杂的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领 域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学 科特点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数 据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学

2、习 机器,目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为 了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用 核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有 结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常 用技术等进行了介绍,然后对支持向量机的理论基础、基本概念和基本算法, 及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中, 数据挖掘处理的往往是大量的数据或者是增量的数据,因此,本文重点对支持 向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究, 针对一般 SVM 增量学习算

3、法训练速度还有提高空间、针对历史数据处理过于粗 糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本 集数据分布可能不同的状况,本文提出了一种改进的基于两凸包边界向量预选 取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明,该方 法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训 练精度上明显优于一般支持向量机增量学习算法,在训练数据较少时跟标准 CSVM 相差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这 说明该方法非常适合大规模数

4、据集的增量学习。正文内容正文内容随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、 复杂的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领 域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学 科特点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数 据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习 机器,目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为 了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用 核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有 结构简

5、单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常 用技术等进行了介绍,然后对支持向量机的理论基础、基本概念和基本算法, 及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中, 数据挖掘处理的往往是大量的数据或者是增量的数据,因此,本文重点对支持 向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究, 针对一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗 糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本 集数据分布可能不同的状况,

6、本文提出了一种改进的基于两凸包边界向量预选 取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明,该方 法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训 练精度上明显优于一般支持向量机增量学习算法,在训练数据较少时跟标准 CSVM 相差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这 说明该方法非常适合大规模数据集的增量学习。 随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂 的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的 热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特

7、 点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数据挖 掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器, 目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据 挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数 把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简 单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术 等进行了介绍,然后对支持向量机的理论基础、基本概念和基本算法,及目前 支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中,数据 挖掘处理的往往是大量的数据或者

8、是增量的数据,因此,本文重点对支持向量 机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究,针对 一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而 不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增 量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据 分布可能不同的状况,本文提出了一种改进的基于两凸包边界向量预选取的自 调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明,该方法在训 练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训练精度 上明显优于一般支持向量机增量学

9、习算法,在训练数据较少时跟标准 CSVM 相差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这说明该方 法非常适合大规模数据集的增量学习。 随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂 的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的 热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特 点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数据挖 掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器, 目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据 挖掘中分类挖掘的研

10、究热点。他的主要思想就是在高维特征空间中利用核函数 把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简 单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术 等进行了介绍,然后对支持向量机的理论基础、基本概念和基本算法,及目前 支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中,数据 挖掘处理的往往是大量的数据或者是增量的数据,因此,本文重点对支持向量 机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究,针对 一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而 不能适应新增样本集中数据分布不同情形导致分类精度受损

11、、针对一般 SVM 增 量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据 分布可能不同的状况,本文提出了一种改进的基于两凸包边界向量预选取的自 调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明,该方法在训 练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训练精度 上明显优于一般支持向量机增量学习算法,在训练数据较少时跟标准 CSVM 相 差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这说明该方 法非常适合大规模数据集的增量学习。 随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂 的数据中获取

12、有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的 热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特 点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数据挖 掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器, 目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据 挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数 把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简 单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术 等进行了介绍,然后对支持向量机的理论基础、基

13、本概念和基本算法,及目前 支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中,数据 挖掘处理的往往是大量的数据或者是增量的数据,因此,本文重点对支持向量 机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究,针对 一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而 不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增 量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据 分布可能不同的状况,本文提出了一种改进的基于两凸包边界向量预选取的自 调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实

14、验表明,该方法在训 练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训练精度 上明显优于一般支持向量机增量学习算法,在训练数据较少时跟标准 CSVM 相差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这说明该方 法非常适合大规模数据集的增量学习。 随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂 的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的 热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特 点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是最常见的数据挖 掘任务。支持向量机是基于统计学习理论基础

15、上发展起来的一种通用学习机器, 目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据 挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数 把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简 单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术 等进行了介绍,然后对支持向量机的理论基础、基本概念和基本算法,及目前 支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中,数据 挖掘处理的往往是大量的数据或者是增量的数据,因此,本文重点对支持向量 机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究,针对 一

16、般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而 不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增 量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据 分布可能不同的状况,本文提出了一种改进的基于两凸包边界向量预选取的自 调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明,该方法在训 练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法,在训练精度 上明显优于一般支持向量机增量学习算法,在训练数据较少时跟标准 CSVM 相 差不多,但随着训练数据的增多,训练精度逐渐超越标准 CSVM,这说明该方 法非常适合大规模数据集的增量学习。 随着世界信息技术的迅猛发展,信息量也呈几何指数增长,如何从巨量、复杂 的数据中获取有用的信息,使数据挖掘技术成为了近年来信息技术研究领域的 热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特 点的新兴技术,包含的内容很多,其中分类挖掘是最重要也是

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 经济/贸易/财会 > 经济学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号