西安电子科技大学软件学院级本科生

上传人:鲁** 文档编号:569398785 上传时间:2024-07-29 格式:PPT 页数:19 大小:299KB
返回 下载 相关 举报
西安电子科技大学软件学院级本科生_第1页
第1页 / 共19页
西安电子科技大学软件学院级本科生_第2页
第2页 / 共19页
西安电子科技大学软件学院级本科生_第3页
第3页 / 共19页
西安电子科技大学软件学院级本科生_第4页
第4页 / 共19页
西安电子科技大学软件学院级本科生_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《西安电子科技大学软件学院级本科生》由会员分享,可在线阅读,更多相关《西安电子科技大学软件学院级本科生(19页珍藏版)》请在金锄头文库上搜索。

1、 软件学院项目实践计划 西安电子科技大学软件学院2006级本科生项目需求分析报告项目需求分析报告中文文本分析工具中文文本分析工具报告人:黄珊珊报告人:黄珊珊日日 期:期:2008年年3月月炔浓羚克英葛菩毛哈聪挪执团棠铭搂杀队葫萍柬穆箕忙冉呐苏嗜缚溅病著西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划西安电子科技大学软件学院2006级本科生主题安排背景和意义背景和意义文本分析领域的现状文本分析领域的现状详细内容详细内容总结与建议总结与建议参考资料参考资料漂概靳呀另蜂粟枣暂纬哩卡溺鉴认咕易协溪娃碌镇岿唾镭肚硅猛苇幼撒所西安电子科技大学软件学院2006级本科生软件项目

2、报告文档模板软件学院项目实践计划 文本分析的背景和意义文本分析的背景和意义上世纪九十年代以来,因特网以惊人的速度发展起来它容纳了海量的各种类型的数据和信息包括文本、声音、图像等。文本数据与声音和图像数据相比,占用网络资源少,更容易上传和下载,这使得网络资源中的大部分是以文本(超文本)形式出现的。西安电子科技大学软件学院2006级本科生岂药嘘朱垣偷笛陶颁蘑斤勃晨巨腐庇宁谎齿羡闪铆昂焦辆砌苦孺翔拔澜氰西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划 文本分析的背景和意义文本分析的背景和意义如何从这些浩瀚的文本中发现有价值的信息是信息处理的一大目标基于机器学习的文本分

3、类系统能够在给定的分类模型下根据文本的内容自动对文本分门别类,从而更好地帮助人们组织文本、挖掘文本信息,因此得到日益广泛的关注,成为信息处理领域最重要的研究方向之一泊谁覆旅怎傀靳稠转个黔叼空涂删咐五岔谴狈殉淄稼筐顺镁翅幅拆娃庐藤西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划中文文本分析现状文本挖掘属于新兴的前沿领域,国内对此研究相对较少,目前国内外学者主要在文本结构分析、文本摘要、文本分类、文本聚类、文本关联分析、分布分析和趋势预测等方面进行了研究,中国学者在中文分词等领域取得了一些进展。文本挖掘可以对上大量文档集合的内容进行总结、分类、聚类、关联分析,以及利

4、用文档进行趋势预测等。 可以说关于文本挖掘的研究只是刚刚开始,诸多问题等待研究、解决。我们列出一些具有挑战性的问题,主要涉及到以下几个方面。衰冠庸龟昌才缔抨遏墒恤酣片五履镶履懈筷秩咒邯入锨见米没响席茶南坚西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划 文本分析之文本分析之文本聚类文本聚类访蚤鸭滥远毛僧麻搅列哟赋取露统蕴乐愿遥脾片使线遁思怜察淆朵娥寻射西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划文本聚类文本聚类饶凯忱尺赡洛啪邪际殃邱啄立毁闯候固脑神谴才曼谢揭鸣晚甭骆魁帅毕粕西安电子科技大学软件学院2006级本科生软件项目报告文

5、档模板软件学院项目实践计划项目研究目标:基于特征词的中文文本聚类基于特征词的中文文本聚类单机版建立文章库,找出关键词用户输入特征词将特征词与关键词相关性计算按照相关性将文章排序饥苔勾咏锨骤迄盔秧攀午控削朝忆放鸣贞肢牢凯巨窑恋级阿瘸种全豢存璃西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划涉及的问题域涉及的问题域分词特征词抓取 相似性计算准确性测试伺冤妓总虱咳拼缔泛潞弓王彰苗分公亢诣廓趋票脐砾觅引鲁受持桑儿侄毛西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划运行示意图特征词相似 计算文章排序用户软件关键词怪悔佰揍困臂挎玩皿衍贪位琢讹

6、楔巨碳良雾糕够日犊肤驹讯造睛小奢庐岳西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划 目前有的分词工具:ICTCLAS输入 输出踊奔矫龚嗽抬屈摸郁映搐羚芳茨蛰绽怂赢哟盒湍默裕纵虐博交榜呀触候单西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划囱菱纯胖弹钉爸喝钠炎泛羌胸伏左敏忌黑谴诧盼潭韩贬聋蔫佣讹债右嫡拼西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划姬希校涧存圆吉屿惮极浓彰梯题兑秀管片使为喻募哨炔闲婉打狗瞪集价再西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划准确率评

7、价谐达铃翁贫帽社畏乍须堕涨燎恰识袋旺伤伺辙色文耽员定别可单轰竣剁欣西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划应用数据挖掘技术从一开始就是面向应用的。目前,在很多领域,数据挖掘(data mining)都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。数据挖掘所能解决的典型商业问题包括:数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行

8、为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等。促莽虾氖眼滩愧前碎窗率畜祖哆堆蹲眩业虾痛澜秩杉侥恳亢酒轴馅尝打豪西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划应用之一电子商务随着网络技术和数据库技术的成熟,全球传统商务正经历一次重大变革,向电子商务全速挺进。这种商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的

9、支持和可靠的保证,是电子商务不可缺少的重要工具颅久睹救摈委缕光陵狠吊溉舶敛峰吃避中拯袱尔顾暑改颗强熔氛狰件圆菇西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划总结与评价算法要求高算法要求高界面设计实用为主界面设计实用为主使用广泛使用广泛可扩展性较高可扩展性较高源蔗盆刁境观禽酮毖赞消敲靠锥众细磅可树桑攫闽绍氏舜挫谈喧戎坏硝甄西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划参考资源参考软件:中科院参考资料:文本分类综述文本分类技术研究文本分类中的特征抽取基于向量空间模型的文本分类方法的研究文本分类的特征提取方法比较与改进驶妥晦鸭舰扁琶扳判牛梨拽荷松加厅匝掐就侩吹馏诽徽荡棕痹削贿简秩诅西安电子科技大学软件学院2006级本科生软件项目报告文档模板软件学院项目实践计划Thank you !傈青航连郁机锣顽氏沛凝砰慈歇壬固早眠饼蛊淆灶震螟言苹静股令起每乃西安电子科技大学软件学院2006级本科生软件项目报告文档模板

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号