spss_clementine_数据挖掘入门

上传人:第*** 文档编号:32697532 上传时间:2018-02-12 格式:DOC 页数:31 大小:973KB
返回 下载 相关 举报
spss_clementine_数据挖掘入门_第1页
第1页 / 共31页
spss_clementine_数据挖掘入门_第2页
第2页 / 共31页
spss_clementine_数据挖掘入门_第3页
第3页 / 共31页
spss_clementine_数据挖掘入门_第4页
第4页 / 共31页
spss_clementine_数据挖掘入门_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《spss_clementine_数据挖掘入门》由会员分享,可在线阅读,更多相关《spss_clementine_数据挖掘入门(31页珍藏版)》请在金锄头文库上搜索。

1、SPSS Clementine1目 录SPSS Clementine 数据挖掘入门 (1) .2客户端基本界面 .3项目区 .3工具栏 .3源工具(Sources) .3记录操作(Record Ops)和字段操作(Field Ops) .4图形(Graphs) .4输出(Output) .4模型(Model) .4数据流设计区 .4管理区 .5Outputs.5Models.5SPSS Clementine 数据挖掘入门 (2) .61定义数据源 .62理解数据 .83准备数据 .94建模 .135模型评估 .146部署模型 .15SPSS Clementine 数据挖掘入门 (3) .17分

2、类 .20决策树 .20Nave Bayes .23神经网络 .24回归 .26聚类 .27序列聚类 .30关联 .31SPSS Clementine2SPSS Clementine 数据挖掘入门 (1)SPSS Clementine 是 Spss 公司收购 ISL 获得的数据挖掘工具。在 Gartner 的客户数据挖掘工具评估中,仅有两家厂商被列为领导者:SAS 和 SPSS。SAS 获得了最高 ability to execute 评分,代表着 SAS在市场执行、推广、认知方面有最佳表现;而 SPSS 获得了最高的 completeness of vision,表明 SPSS在技术创新方面

3、遥遥领先。SPSS Clementine3客户端基本界面SPSS Clementine(在此简称 clementine)在安装好后会自动启用服务,服务端的管理需要使用 SPSS Predictive Enterprise Manager,在服务端 clementine 没有复杂的管理工具,一般的数据挖掘人员通过客户端完成所有工作。下面就是 clementine 客户端的界面。一看到上面这个界面,我相信只要是使用过 SSISSSAS 部署数据挖掘模型的,应该已经明白了六、七分。是否以跃跃欲试了呢,别急,精彩的还在后面 _项目区顾名思义,是对项目的管理,提供了两种视图。其中 CRISPDM (Cr

4、oss Industry Standard Process for Data Mining,数据挖掘跨行业标准流程)是由 SPSS、DaimlerChrysler(戴姆勒克莱斯勒,汽车公司)、NCR(就是那个拥有 Teradata 的公司)共同提出的。Clementine 里通过组织 CRISPDM 的六个步骤完成项目。在项目中可以加入流、节点、输出、模型等。工具栏工具栏总包括了 ETL、数据分析、挖掘模型工具,工具可以加入到数据流设计区中,跟 SSIS 中的数据流非常相似。Clementine 中有 6 类工具。源工具( Sources)相当 SSIS 数据流中的源组件啦,clementin

5、e 支持的数据源有数据库、平面文件、Excel、维度数据、SAS 数据、用户输入等。SPSS Clementine4记录操作( Record Ops)和字段操作( Field Ops)相当于 SSIS 数据流的转换组件,Record Ops 是对数据行转换,Field Ops 是对列转换,有些类型 SSIS 的异步输出转换和同步输出转换(关于 SSIS 异步和同步输出的概念,详见拙作:http:/wwwcnblogscom/esestt/archive/2007/06/03/769411html)。图形( Graphs)用于数据可视化分析。输出( Output)Clementine 的输出不仅

6、仅是 ETL 过程中的 load 过程,它的输出包括了对数据的统计分析报告输出。在 ver 11,Output 中的 ETL 数据目的工具被分到了 Export 的工具栏中。模型( Model)Clementine 中包括了丰富的数据挖掘模型。数据流设计区这个没什么好说的,看图就知道了,有向的箭头指明了数据的流向。Clementine 项目中可以有多个数据流设计区,就像在 PhotoShop 中可以同时开启多个设计图一样。比如说,我这里有两个数据流:Stream1 和 Stream2。通过在管理区的 Streams 栏中点击切换不同的数量流。SPSS Clementine5管理区管理区包括 Streams、Outputs、Models 三栏。Streams 上面已经说过了,是管理数据流的。Outputs不要跟工具栏中的输出搞混,这里的 Outputs 是图形、输出这类工具产生的分析结果。例如,下面的数据源连接到矩阵、数据审查、直方图工具,在执行数据流后,这个工具产生了三个输出。在管理区的 Outputs 栏中双击这些输出,可看到输出的图形或报表。Models经过训练的模型会出现在这一栏中,这就像是真表(Truth Table)的概念那样,训练过的模型可以

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号