大数据分类

上传人:jiups****uk12 文档编号:39441642 上传时间:2018-05-15 格式:DOC 页数:2 大小:110.50KB
返回 下载 相关 举报
大数据分类_第1页
第1页 / 共2页
大数据分类_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《大数据分类》由会员分享,可在线阅读,更多相关《大数据分类(2页珍藏版)》请在金锄头文库上搜索。

大数据分类大数据的特点有体量巨大,而有价值信息的密度低,因此,需要采用大数据分类的技术,对海量数据进行分类整理。大数据分类技术能够按照用户预设的类别体系,将数据进行归类。实际的业务往往面临着不同的分类需求,例如新闻分类、简历分类、邮件分类、办公文档分类、区域分类等,这样就需要分类系统能够适应不同的分类标准。 灵玖大数据分类采用基于内容的分类和基于规则的分类两种方式,并支持两种方式的混合分类,能够进行多级分类,很好地满足实际业务要求。 主要功能主要功能: 样本训练分类: 为每个类别人工挑选样本,机器自动学习样本特征,对新的数据按照样本特征进行分类。 规则匹配分类: 为每个类别设置关键词表达式,机器按照精确设置的表达式进行分类;表达式支持“与、或、非、近邻”等复杂的逻辑符号嵌套。 样本规则混合分类: 将样本学习和规则匹配相结合进行分类,发挥二者的优势。 应用案例应用案例: 下图给出了样本训练分类方法的结果示例图: 图图 1 1:样本训练分类结果示例:样本训练分类结果示例 技术特点技术特点: 1、支持自动分类和规则的两种分类方式,而且支持两种方式的混合分类; 2、速度快,分类速度每秒 100 篇以上,平均准确率 90%以上; 3、能够进行中英文分类和中英文的混合分类。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号