《UCI数据集和源代码》

上传人:平*** 文档编号:13540670 上传时间:2017-10-24 格式:DOCX 页数:7 大小:23.19KB
返回 下载 相关 举报
《UCI数据集和源代码》_第1页
第1页 / 共7页
《UCI数据集和源代码》_第2页
第2页 / 共7页
《UCI数据集和源代码》_第3页
第3页 / 共7页
《UCI数据集和源代码》_第4页
第4页 / 共7页
《UCI数据集和源代码》_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《《UCI数据集和源代码》》由会员分享,可在线阅读,更多相关《《UCI数据集和源代码》(7页珍藏版)》请在金锄头文库上搜索。

1、UCI 数据集和源代码UCI 数据集是一个常用的标准测试数据集,下载地址在http:/www.ics.uci.edu/mlearn/MLRepository.html我的主页上也有整理好的一些 UCI 数据集(arff 格式):http:/ Weka,MLC+等。Weka 还在不断的更新其算法,下载地址:http:/www.cs.waikato.ac.nz/ml/weka/很多的机器学习的经典算法都在里面。而且公布源程序,易于修改。如果作者没有公布源程序,可以到作者主页找找,也可以写信给作者要,一般论文开头都会有作者的 email地址。写信的时候要注意要很有礼貌,否则作者,尤其是著名学者,很有

2、可能不会理睬。如果算法简单,可以自己实现。关于论文的下载,如果能够访问电子图书馆是最好的,很多学校都买了 IEEE, Elsevier, Kluwer 等,上面的期刊都不错。有一些很好的期刊是免费的,像 JAIR 和 JMLR,分别在:http:/www.cs.washington.edu/research/jair/home.htmlhttp:/www.jmlr.org/如果能访问的免费期刊太少,可以到 CiteSeer 上搜索(http:/citeseer.ist.psu.edu/ ),上面搜集了很多免费论文(但是要注意,论文的质量参差不齐),或者用 G )搜索。再嘱咐两点,要做研究,首先

3、要打好基础,例如数学基础和程序设计能力,要学会熟练使用 google 等搜索引擎,还有一定要看高质量的论文。数据挖掘的数据集资源大家做数据挖掘研究时,常常为找不到合适的数据而发愁。在 KDNuggets 上有 Datasets 栏目,提供一些数据集,网址为:http:/ ,里面包含的数据资源如下(按应用领域划分):Direct MarketingKDD CUP 1998 DataGISForest CoverTypeIndexingCorel Image FeaturesPseudo Periodic Synthetic Time SeriesIntrusion DetectionKDD CU

4、P 1999 DataProcess ControlSynthetic Control Chart Time SeriesRecommendation SystemsEntree Chicago Recommendation DataRobotsPioneer-1 Mobile Robot DataRobot Execution FailuresSign Language RecognitionAustralian Sign Language DataHigh-quality Australian Sign Language DataText Categorization20 Newsgrou

5、ps DataReuters-21578 Text Categorization Collection NSF Research Awards Abstracts 199 0-2003World Wide WebMicrosoft Anonymous Web DataMSNBC Anonymous Web DataSyskill Webert Web Data转:http:/ http:/cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http:/www.cs.toronto.edu/roweis/data.htmlhttp:/www.cs.toronto

6、.edu/roweis/data.htmlhttp:/kdd.ics.uci.edu/summary.task.type.htmlhttp:/www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-20/www/data/http:/www-2.cs.cmu.edu/afs/cs.cmu.edu/project/theo-11/www/wwkb/http:/www.phys.uni.torun.pl/duch/software.html在下面的网址可以找到 reuters 数据集 http:/ rainbow 的数据集http:/www-2.cs.cmu.ed

7、u/afs/cs/project/theo-11/www/naive-bayes.html3、找了很多测试数据集, 写论文的同志们肯定需要的, 至少能用来检验算法的效果可能有一些不能访问,但是总有能访问的吧:UCI 收集的机器学习数据集ftp:/ 数据集http:/ 算法的测试数据http:/ jarfile containing 37 classification problems, originally obtained from the UCI repositoryhttp:/ jarfile containing 37 regression problems, obtained from various sourceshttp:/ jarfile containing 30 regression datasets collected by Luis Torgohttp:/ reuters 数据集http:/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号