
上传人:ldj****22 文档编号:35883961 上传时间:2018-03-21 格式:PDF 页数:81 大小:2.14MB
返回 下载 相关 举报
第1页 / 共81页
第2页 / 共81页
第3页 / 共81页
第4页 / 共81页
第5页 / 共81页


1、 硕士硕士学位论文学位论文 面向汽车在线评论的情感分类 研究与应用 Research and Application about the Sentiment Classification of Automobiles Online Reviews 黄黄 鹤鹤 哈尔滨工业大学哈尔滨工业大学 2013 年年 6 月月 国内图书分类号:C931.6 学校代码:10213 国际图书分类号:681.37 密级:公开 硕士硕士学学位论文位论文 面向汽车在线评论的情感分类 研究与应用 硕 士 研 究 生 黄鹤 导 师 叶强教授 申请学位 硕士 学科 管理科学与工程 所 在 单 位 管理学院 答 辩 日 期

2、2013 年 6 月 授 予 学 位 单 位 哈尔滨工业大学 Classified Index: C931.6 U.D.C: 681.37 Dissertation for the Masters Degree RESEARCH AND APPLICATION ABOUT THE SENTIMENT CLASSIFICATION OF AUTOMOBILES ONLINE REVIEWS Candidate: Huang He Supervisor: Prof. Ye Qiang Academic Degree Applied for: Master of Management Special

3、ity: Management science and engineering Affiliation: School of Management Date of Defence: June, 2013 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学管理学硕士学位论文 - I - 摘摘 要要 纵观 Web 2.0 世界,用户原创内容(UGC, user-generated content)吸引了众多数据挖掘领域学者的目光,获取、跟踪并最大化利用这些用户原创内容也逐渐变成企业相关部门的一项任务。 随着互联

4、网技术的普及, 与过去的十几年相比,对投放的产品和服务获取市场反馈越来越容易, 越来越多的企业通过在线评论,获取市场反馈情报。因此,在线评论不仅是消费者购买决策的重要依据,同时也为企业所用,辅助与支持决策。进而如何提高 UGC 的投资回报率,使得工作更有效率,是每个企业关注的。汽车作为一种高价、不常购买的商品,比较而言消费者会倾向于把更真实的感观发布到网上,因而高效的识别出消费者对汽车的评论情感倾向并提炼出关键性的问题,对汽车企业有很大的应用意义。 本文旨在探究情感分类模型在汽车领域在线评论的效果,找出适合汽车在线评论的情感分类方法,编写汽车评论情感挖掘系统。首先,论文对国内外文本情感分类模型

5、的研究现状做了系统性地总结,并归纳出三个主要的文本情感分类算法,朴素贝叶斯(Nave Bayes)、支持向量机(SVM)、决策树 C4.5(J48);本文为研究这三种算法对汽车评论情感分类的优劣,在论文实验部分抓取两个来源的汽车在线评论数据,将大量数据规范化预处理,导入情感分类模型,对三个算法的分类性能进行比较,最后利用调试出的最优模型对测试样本进行分类,编写汽车评论情感挖掘系统。 本研究可以高效地从海量评论中获得民众对于某一产品或服务的某些特征的正负面评价。在技术导向上,本文在基于机器语言的中文文本情感分类研究上做出定量分析, 为汽车评论的情感识别建立汽车领域情感词典; 行为导向上,本研究对

6、汽车行业在线评论情感分析进行了深入的探讨,有很好的实践应用价值,为后续企业构建市场数据挖掘系统提供了一个开发的方向。 关键词:情感分类;用户原创内容;机器学习;汽车评论 哈尔滨工业大学管理学硕士学位论文 - II - Abstract Across the Web 2.0 world, were seeing a quiet-but-knee-jerk shift away from UGC in favor of professional content, tracking and collecting data, making maximum use of this content is

7、an assignment of relative enterprises. With the rapid development of Internet and informationization construction, the resources in the net increases exponentially, its easilier to get the market feedback on Internent. That is, online reviews are not only utilized for consumer decision making, but a

8、lso for the enterprise. However, how to increase return on investment of UGC, how to make more productive is the concern of every enterprise. Automobile, as a high-price, infrequently bought commodity, consumers would publish the real emotion online relatively, so the key issue here is to identify c

9、onsumers emotion inclination, it has the particularly important practical application value in the automotive field. This paper is aiming at the classification result of each sentimental classifier on the online reviews of automobile field, finding out the best fit classification, and finally buildi

10、ng and supporting a sentiment mining of Auto reviews system. At first, this article analyzes the reseach background and current situation of the text sentiment classification, and sums up three mainly models, Naive Bayes, SVM, decision tree to classify our data. In order to balance pros and cons of

11、these three methods, in our experiment, our paper divides the automobiles online reviews into two part, structured reviews and unstructured reviews. So we fetch the data from two different sources, aggregate and transform the data, and then import models, check and compare the relative index. So thi

12、s research application can efficiently obtain the positve and negative evaluation of the traits on the product or service, this can assist decision effectively. In the technical guidance, this paper gives quantitative analysis on the text categorization model based on machine learning, sets up a ful

13、l-scale automobile sentiment dictionary; in the behavior orientation, this research discusses deeply in the sentimentic classification of online reviews in the auto industry, it possesses very important value in theory and practice, it gives a guidance on the building-up of integrated online market data mining system. Keyword: sentiment classification, UGC, machine learning, automobile 哈尔滨工业大学管理学硕士学位论文 - III - 目 录 摘 要 . I ABSTRACT . II 第 1 章 绪 论 . 1 1.1 课题研究背景 . 1 1.2 国内外研究现状及分析 . 4 1.3 研究内容与研究意义. 5 1.4 论文组织结构 . 6 第 2 章 基础理论与相关技术 . 8 2.1 在线评论理论基础 .


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号