基于svm的数据挖掘技术研究

资源描述

《基于svm的数据挖掘技术研究》由会员分享，可在线阅读，更多相关《基于svm的数据挖掘技术研究（38页珍藏版）》请在金锄头文库上搜索。

1、计算机软件与理论专业毕业论文计算机软件与理论专业毕业论文精品论文精品论文基于基于 SVMSVM 的数据挖的数据挖掘技术研究掘技术研究关键词：机器学习关键词：机器学习统计学习理论统计学习理论数据挖掘数据挖掘支持向量机支持向量机增量学习增量学习摘要：随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学

2、习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一般 SVM 增量学习算

3、法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数

4、据集的增量学习。正文内容正文内容随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简

5、单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，

6、本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数据集的增量学习。随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特

7、点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者

8、是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学

9、习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数据集的增量学习。随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研

10、究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损

11、、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数据集的增量学习。随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取

12、有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础上发展起来的一种通用学习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基

13、本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实

14、验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数据集的增量学习。随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是最常见的数据挖掘任务。支持向量机是基于统计学习理论基础

15、上发展起来的一种通用学习机器，目前正以其优秀的理论基础(VC 维、结构最小化理论和核空间理论)成为了数据挖掘中分类挖掘的研究热点。他的主要思想就是在高维特征空间中利用核函数把复杂的分类任务映射成一个线性分类超平面的问题。支持向量机具有结构简单、全局最优、推广能力强等优点。本文先对数据挖掘的基本概念、常用技术等进行了介绍，然后对支持向量机的理论基础、基本概念和基本算法，及目前支持向量机的现有各种改进算法进行了研究和分析。由于在实际应用中，数据挖掘处理的往往是大量的数据或者是增量的数据，因此，本文重点对支持向量机的快速学习和解决大规模数据问题时采用的增量学习策略进行了研究，针对一

16、般 SVM 增量学习算法训练速度还有提高空间、针对历史数据处理过于粗糙而不能适应新增样本集中数据分布不同情形导致分类精度受损、针对一般 SVM 增量学习算法优化问题 CSVM 惩罚分量 C 选择的困难及难以适应新增样本集数据分布可能不同的状况，本文提出了一种改进的基于两凸包边界向量预选取的自调整参数 BvSVM 增量学习方法。通过在 UCI 数据库上实验表明，该方法在训练时间上都明显优于标准 CSVM 和一般支持向量机增量学习算法，在训练精度上明显优于一般支持向量机增量学习算法，在训练数据较少时跟标准 CSVM 相差不多，但随着训练数据的增多，训练精度逐渐超越标准 CSVM，这说明该方法非常适合大规模数据集的增量学习。随着世界信息技术的迅猛发展，信息量也呈几何指数增长，如何从巨量、复杂的数据中获取有用的信息，使数据挖掘技术成为了近年来信息技术研究领域的热点问题。数据挖掘是一种包含了数据库、人工智能和数理统计等多种学科特点的新兴技术，包含的内容很多，其中分类挖掘是最重要也是

展开阅读全文