sas8.2enterpriseminer数据挖掘实例

上传人:小** 文档编号:46747129 上传时间:2018-06-27 格式:DOC 页数:34 大小:854.50KB
返回 下载 相关 举报
sas8.2enterpriseminer数据挖掘实例_第1页
第1页 / 共34页
sas8.2enterpriseminer数据挖掘实例_第2页
第2页 / 共34页
sas8.2enterpriseminer数据挖掘实例_第3页
第3页 / 共34页
sas8.2enterpriseminer数据挖掘实例_第4页
第4页 / 共34页
sas8.2enterpriseminer数据挖掘实例_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《sas8.2enterpriseminer数据挖掘实例》由会员分享,可在线阅读,更多相关《sas8.2enterpriseminer数据挖掘实例(34页珍藏版)》请在金锄头文库上搜索。

1、SAS 8.2 Enterprise Miner 数据挖掘实例目录1.SAS 8.2 Enterprise Miner 简介.2 2.EM 工具具体使用说明.2 3.定义商业问题.3 4.创建一个工程.4 4.1调用 EM.4 4.2新建一个工程.5 4.3应用工作空间中的节点.6 5.数据挖掘工作流程.6 5.1定义数据源.7 5.2探索数据.9 5.2.1设置 Insight 节点.9 5.2.2察看 Insight 节点输出结果.10 5.3准备建模数据.12 5.3.1建立目标变量.12 5.3.2设置目标变量.14 5.3.3数据分割.23 5.3.4替换缺失值.23 5.4建模.2

2、5 5.4.1回归模型.25 5.4.2决策树模型.26 5.5评估模型.29 5.6应用模型.31 5.6.1抽取打分程序.31 5.6.2引入原始数据源.32 5.6.3查看结果.33 6.参考文献:.351. SAS 8.2 Enterprise Miner 简介 数据挖掘就是对观测到的庞大数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。1一个数据挖掘工程需要足够的软件来完成分析工作,为了计划、实现和成功建立一个数据挖掘工程,需要一个集成了所有分析阶段的软件解决方案,包括从数据抽样到分析和建模,最后公布结果信息。大部分专业统计数据分析软件只实现

3、特定的数据挖掘技术,而 SAS 8.2 Enterprise Miner 是一个集成的数据挖掘系统,允许使用和比较不同的技术,同时还集成了复杂的数据库管理软件。SAS 8.2 Enterprise Miner 把统计分析系统和图形用户界面(GUI)集成在一起,并与 SAS 协会定义的数据挖掘方法SEMMA 方法,即抽样(Sample) 、探索(Explore) 、修改(Modify)建模(Model) 、评价(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户也可以理解和使用。 Enterprise Miner 简称 EM,它的运行方式是通过在一个工作空间(wor

4、kspace)中按照一定的顺序添加各种可以实现不同功能的节点,然后对不同节点进行相应的设置,最后运行整个工作流程(workflow),便可以得到相应的结果。2. EM 工具具体使用说明 EM 中工具分为七类:Sample 类 包含 Input Data Source、Sampling、Data PartitionExplore 类 包含 Distribution Explorer、Multiplot、Insight、 Association、Variable Selection、Link Analysis(Exp.)Modify 类 包含 Data Set Attribute、Transfor

5、m Variable、Filter Outliers、Replacement、Clustering、SOM/Kohonen、Time Series(Exp.)Medel 类 包括 Regression、Tree、Neural Network、Princomp/Dmneural、User Defined Model、Ensemble、Memory-Based Reasoning、Two Stage ModelAssess 类 包括 Assessment、ReporterScoring 类 包括 Score、C*ScoreUtility 类 包括 Group Processing、Data Min

6、ing Database、SAS Code、Control point、Subdiagram每个节点的具体使用方法可以在 EM 打开界面,选择 SAS 主菜单中帮助子菜单中的“EM 参考资料”选项,进一步查看各个节点的具体使用方法。下面我们将以客户商品信息为例来建立如下的工作流程,从而引导我们学会使用 EM(Enterprise Miner) 。3. 定义商业问题假设有一家目录服务公司每个月都要向发出一份服饰用品和家用器皿的商品目录。为了更好的面对商品战,公司打算发出一张主要宣传厨房用品(dining) ,包括厨具(kitchenware) 、器皿(dishes)和餐具(flatware)的目

7、录。由于对所有的客户发送目录的成本是公司无法承受的,所以公司需要把目标锁定在那些有购买倾向的客户。我们可以通过 EM 来建立一个倾向模型来完成这个任务,从而得到一个邮寄对象列表。要完成这个任务我们需要准备好关于客户购买产品记录的数据库表,表中应该包含近两年内客户是否购买了厨具(kitchenware) 、器皿(dishes)和餐具(flatware)的数据,以及其他与客户购买倾向相关的变量。我们这里根据客户购买的历史数据建立起来了数据集(数据库表)CUSTDET1CUSTDET1,它包含了 49 个变量。 上表中的 TotalTotal DiningDining (kitch+dish+flat)(kitch+dish+flat)变量是我们新建的变量,它的值等于 Kitchen Product、Dishes Purchase 和 Flatware Purchase 三个变量的值的和,这个变量可以用来预示客户购买厨房用品(dining)的倾向,同时也

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 宣传企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号