基于组合分类策略的中英文情感分析系统研究与实现

上传人:li45****605 文档编号:44625716 上传时间:2018-06-14 格式:PDF 页数:55 大小:4.16MB
返回 下载 相关 举报
基于组合分类策略的中英文情感分析系统研究与实现_第1页
第1页 / 共55页
基于组合分类策略的中英文情感分析系统研究与实现_第2页
第2页 / 共55页
基于组合分类策略的中英文情感分析系统研究与实现_第3页
第3页 / 共55页
基于组合分类策略的中英文情感分析系统研究与实现_第4页
第4页 / 共55页
基于组合分类策略的中英文情感分析系统研究与实现_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《基于组合分类策略的中英文情感分析系统研究与实现》由会员分享,可在线阅读,更多相关《基于组合分类策略的中英文情感分析系统研究与实现(55页珍藏版)》请在金锄头文库上搜索。

1、国内图书分类号:T P 3 0 3 国际图书分类号:0 0 4硕士学位论文学校代码:1 0 0 7 9 密级:公开基于组合分类策略的中英文情感分析系统 研究与实现硕士研究生:导师:企业导师:申请学位:专业领域:培养方式:所在学院:答辩日期:授予学位单位:杨雅琴赵文清副教授工程硕士计算机技术全日制控制与计算机工程学院2 0 1 3 年3 月华北电力大学C l a s s i f i e dI n d e x :T P 3 0 3U D C :0 0 4T h e s i sf o rt h eM a s t e rD e g r e eR e s e a r c h m e n ta n dI

2、m p l e m e n t a t i o no nC h i n e s ea n dE n g l i s hS e n t i m e n tC l a s s i f i c a t i o nS y s t e mB a s e do nM u l t i - F e a t u r eF u s i o nC a n d i d a t e :S u p e r v i s o r :S c h o o l -D a t eo fD e f e n c e :D e g r e e - - C o n f e r r i n g - - l n s t i t u t i o

3、n Y a n gY a q i nP r o Z h a oW e n q i n gS c h o o lo fC o n t r o la n dC o m p u t e rL n g l n e e r m gM a r c h ,2 0 1 3N o r t hC h i n aE l e c t r i cP o w e rU n i v e r s i t y华北电力大学硕士学位论文原创性声明本人郑重声明:此处所提交的硕士学位论文基于组合分类策略的中英文情感分析系统研究与实现,是本人在导师指导下,在华北电力大学攻读硕士学位期间独立进行研究工作所取得的成果。据本人所知,论文中除己

4、注明部分外不包含他人己发表或撰写过的研究成果。对本文的研究工作做出重要贡献的个人和集体,均已在文中以明确方式注明。本声明的法律结果将完全由本人承担。作者签名:榔日期:b I 年弓月肪日华北电力大学硕士学位论文使用授权书基于组合分类策略的中英文情感分析系统研究与实现系本人在华北电力大学攻读硕士学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归华北电力大学所有,本论文的研究内容不得以其它单位的名义发表。本人完全了解华北电力大学关于保存、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版本,同意学校将学位论文的全部或部分内容编入有关数据库进行检索,允许论文被查阅和

5、借阅。本人授权华北电力大学,可以采用影印、缩印或扫描等复制手段保存、可以公布论文的全部或部分内容。本学位论文属于( 请在以上相应方框内打“、”) :保密口,在年解密后适用本授权书不保密叮作者签名:导师签名:榔琴 冽轧 J日期:沙B 年月J 乙日日期:伊f 弓年月7 日华北电力大学硕士学位论文摘要随着以网络为载体的文章与评论信息的迅猛增加,情感分析技术的研究显得尤为迫切。情感分类是一种自动挖掘并分析文本中所包含的具有情感色彩、反映人们主张观点信息的技术方法。在当今信息大爆炸的时代,情感分类引起了广泛关注和研究,已经逐渐成为研究热点。本文构建了以特定网站海量评论信息爬取、中英文混合文本预处理、情感

6、分类、结果展示一体化的平台:基于组合分类策略的中英文情感分析系统。研究了系统的关键问题中英文情感分析以及基于多特征融合的组合分类策略,并给出了解决方案和实现方法。由于网络信息的便利和英语的国际通用性,国内很多用户评论信息都是中英文结合表达的。在以往的中文情感分类中,因为无法对英文分词分类从而丢失了大量有效的信息。本文分别研究分析了中英文情感分析,总结了中英文的常见混合方式,对中英文混合文本的情感分析做了深入研究,给出了在已有算法基础上改进后的混合分词算法,并对算法进行了测试实验。结合了英文丰富的情感分析资源后,在整体上提高中文情感分类的效果。本文对基于多特征融合的组合分类策略进行了重点分析和研

7、究,通过对特征选择维度的补充和引入情感词典的方法来提高系统性能和分类效果。在对多特征融合的实验中,进行了多次不同特征组合实验,并分析结果,得到了可以得到较好召回率值和准确率值的最优组合方法,并将实验所得的组合方法应用于基于组合分类策略的中英文情感分析系统。关键字:网络爬虫;特征融合;情感分类;组合模型;混合分词华北电力大学硕士学位论文A b s t r a c tW i t ht h ei n c r e a s eo fa r t i c l e sa n dr e v i e w si nn e t w o r k ,t h es e n t i m e n ta r i a l y s

8、i st e c h n o l o g yh a sb e c o m eu r g e n t S e n t i m e n tc l a s s i f i c a t i o ni saw a yt h a ta u t o m a t i c l ym i n i n ga n da n a l y z i n gt h es u b j e c t i v ei n f o r m a t i o ni nt h et e x t I nt h ei n f o r m a t i o ne x p l o s i o ne r a ,i th a sb e e nw i d e

9、 l ye o n c e m e da n dg r a d u a l l yb e c o m eah o tr e s e a r c ht o p i c Ai n t e g r a t i v ep l a t f o r mf o rs e n t i m e n tc l a s s i f i c a t i o nb a s e do nm u l t i - f e a t u r ef u s i o nw a Sp r o p o s e di nt h i sp a p e r W i t ht h er e s e a r c ho fs e n t i m e

10、 n ta n a l y s i si nb o t hC h i n e s ea n dE n g l i s ht e x t ,t h eE n g l i s h - C h i n e s es e n t i m e n tc l a s s i f i c a t i o ns y s t e mb a s e do nm u l t i f e a t u r ef u s i o nh a sb e e nc o n s t r u c t e di nt h i sp a p e r E n g l i s h w o r d si nC h i n e s ec o

11、m m n e ta r eu s e di n t h i ss y s t e mw h i c ha l s oa d dt h es e n t i m e n td i c t i o n a r ya n du s et h em u l t i f e a t u r ef u s i o nt oi m p r o v ec l a s s i f i c a t i o ne f f e c t i v e n e sa n ds y s t e mp e r f o r m a n c e M a n yu s e r s c o m m e n to nd o m e s

12、 t i ci n f - o n n a t i o na r ec o m b i n e dw i t hb o t hi nC h i n e s ea n dE n g l i s hb e c a u s eo ft h ec o n v e n i e n c eo fn e t 、v o r ki n f o r m a t i o na n dt h ei n t e r n a t i o n a lg e n e r a l i t yo fE n g l i s h I nt h ep a s to fC h i n e s ee m o t i o nc l a s

13、s i f i c a t i o ns y s t e m ,al o to fe f f e c t i v ei n f o r m a t i o nh a sb e e nl o s tb e c a u s eo ft h eu n a b l et oc l a s s i f yt h eE n g l i s hw o r d s I nt h i sp a p e r ,t h eC h i n e s ea n dE n g l i s hS e n t i m e n ta n a l y s i sm e t h o d sh a v eb e e nw o r k

14、e do u t ,t h ec o m l n e nC h i n e s ea n dE n g l i s hm i x e d m e t h o d sh a v eb e e ns u m m a r i z e d ,t h ei m p r o v e dh y b r i ds e g m e n t a t i o na l g o r i t h mh a sb e e np r o p o s e db a s e do nt h eo r i g i n a la l g o r i t h m ,a n dt h ee x p e r m e n t sh a v

15、 eb e e nt e s t e dt h ea l g o r i t h m t h ee f f e c th a sb e e ni m p r o v e do nt h ew h o l e I nt h i sp a p e r , t h ea n a l y s i sa n dr e s e a r c ho nt h ec o m b i n a t i o nc l a s s i f i c a t i o ns t r a t e g yb a s e do nm u l t i p l ef e a t u r e sf u s i o nh a sb e e

16、 nc a r r i e do u t t h ep e r f o r m a n c eo ft h es y s t e ma n dc l a s s i f i c a t i o ne f f e c th a v e b e e ni m p r o v e db yt h ew a yt h a ti n t r o d u c i n gt h ed i m e n s i o no ff e a t u r es e l e c t i o na n da d d i n ge m o t i o n a ld i c t i o n a r y D i f f e r e n tc h a r a c t e r i s t i c so fc o m b i n a t i o ne x p e r i m e n th a v e b e e nd o n e ,w i t ht h er e s u l ta n a l y z i n g ,t h eo p t i m a lc o m b

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 毕业论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号