文本情感分析：让机器读懂人类情感

资源描述

《文本情感分析：让机器读懂人类情感》由会员分享，可在线阅读，更多相关《文本情感分析：让机器读懂人类情感（8页珍藏版）》请在金锄头文库上搜索。

1、文本情感分析：让机器读懂人类情感1 引言在大数据和人工智能的时代，机器能否拥有情感成为人们热议的话题。真正的人工智能系统不仅具有像人类的思考和推理能力，也需要也要能够感知和表达情感。MIT 的 Minsky （人工智能之父）早在 1985 年在“The Society of Mind”中指出“问题不在于智能机器能否拥有任何情感，而在于机器实现智能时怎么能够没有情感？”。赋予机器情感分析能力引起了社会的广泛关注，研究领域也开展了很多相关的研究工作。科幻电影她中人工智能系统和主人公谈恋爱的故事，激发了人们对机器具有人类情感的无限想象。那么，机器是怎样理解人类情感呢？通常来讲，机器理解人类情感是一

2、个多模态的感知过程，通过表情、行为、语言来理解情感。语言通常以文本的形式存在，本文主要是从文本的角度讨论情感分析的研究。2 文本情感分析定义文本情感分析（1，2 ）是自然语言处理研究的一个热点，是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。按照 Liu2对情感的定义，情感表达由四个元素构成，分别是Holder，Target，Polarity，Time，其中文本发表的时间通常可以使用简单的规则获取，因此情感分析的目标通常是从无结构的文本中自动分析出 Holder（观点持有人）、Target（评价对象）、Polarity（极性）三元素。Holder 是观点的发

3、出者；Target 是该观点评价的对象（如实体或实体的属性，或者话题）；Polarity 是所表达的情感类别，由于任务不同，情感类别体系会不同，通常包括褒贬、褒贬中、喜怒哀乐悲恐惊、情感打分（如 1-5 分）等分类体系。文本中的情感又分为显式情感及隐式情感，显式情感是指包含明显的情感词语（例如高兴、漂亮）情感文本，隐式情感是指不包含情感词语的情感文本，例如“这个桌子上面一层灰”。由于隐式情感分析难度比较大，比较依赖于背景知识及常识知识，目前许多工作集中在显示情感分析研究。目前的情感分析研究可归纳为：情感资源构建、情感元素抽取、情感分类及情感分析应用系统，具体见图 1。图 1 情感分析研究框架3

4、情感分析研究任务情感分析任务和其他自然语言处理任务一样，首先需要资源的支持，在此基础上，开展情感分析元素抽取以及文本情感分类工作，下面我们将进行简要介绍。3.1 文本情感资源构建情感资源一般包括情感词典和情感语料库。目前人工构建情感词典较多的是收集了褒贬情感词的词典，如哈佛大学 GI（General Inquiry）情感词典、匹兹堡大学提供的 OpinionFinder 主观情感词典、伊利诺伊大学 Bing Liu 提供的词典资源，而对于喜、怒、哀、乐、悲、恐、惊等情感相应的词典还比较少，英语中主要有 WordNet-Affect，随后有不少学者基于 WordNetAffect 又陆续

5、扩展到其他语言。由于是人工构建，上述词典规模基本都在几千词范围内。在中文方面，大连理工大学的情感词汇本体将情感分为七个基本大类和二十一个小类，收录情感词语 27466 条。可以看到，人工构建词典需要较大的代价，规模也会受限。（人们开始研究自动构建情感词典的方法，已有方法一般分为两种：基于词典资源和基于语料库的方法。基于词典资源的方法通常利用外部语义词典（如 WordNet）中词语之间的语义关系（如同义词、反义词、上位词关系等）生成情感词典；Hu and Liu3借助 WordNet 中的同义词和反义词信息判断形容词的情感极性；Esuli et al.4利用同义词集合的注释信息自动构建了情感词

6、典资源 SentiWordNet。基于语料库的情感词典构建方法最早源自 Hatzivassiloglou 和 McKeown5；Google 的 Velikovich et al.6在大规模互联网语料上利用上下文计算词语之间的语义关联构建情感词典，最终获得了大规模（17 万左右）的情感词典；Mohammad et al.7在 Twitter 数据上自动构建大规模情感词典，他们人工定义表情符和 hashtag 的情感种子集合，利用词语和情感种子的点互信息计算情感分值，获得了 6.2 万情感词语，67 万情感短语（Bigram ）。值得一提的是，情感分析的语料库和相关评测也对推动情感分析的进步至关

7、重要。国际TREC、NTCIR，SemEval 组织的面向不同任务的情感分析评测以及国内中文信息学会及中国计算机学会相继连续举办中文情感分析评测，促进同行的交流和学习，同时针对不同情感分析任务提供了大量的人工标注语料库。当然，人工标注语料库的领域、规模都会受到一定限制。利用 distant supervision 方法从评论网站（如 Yelp、IMDB）或社交媒体上（如 Twitter）自动获取的情感分析语料库8，为在不同领域、不同任务上开展情感分析研究提供了语料库的支持。需要指出，无论是自动构建词典还是自动构建语料库，都扩大了情感分析的研究领域，但是由于规模较大，无法直接评估其质量，需要通过

8、具体任务体现。3.2 情感元素抽取情感元素抽取旨在抽取文本中的评价发出者、评价对象和情感表达，也称为细粒度情感分析。评价发出者是文本中观点/评论的隶属者。很自然的，人们会想到评论发布者一般是由命名实体（如人名、机构名）组成，因此早期的研究工作尝试使用命名实体识别和语义角色标注技术来获取观点持有者（9， 10）。也有很多学者将评价发出者的抽取定义为分类任务，这种方法的关键在于分类器和特征的选取。例如，Choi et al.11使用 CRF 模型和抽取模板及各种特征在 MPQA 数据集上来识别句子中评价的来源。Ku et al. 12先用 SVM 来识别作者的意见，再用 CRF 来标注评价的发出者

9、，在 NTCIR7 MOAT 任务上取得了与最好系统接近的性能。虽然在产品评论及社交网络上都有明确的用户 ID，使评价发出者抽取研究淡化，但是在一些文本中存在描述第三方情感和观点的情况，需要对其进行抽取。评价对象和评价表达抽取是情感元素抽取任务的核心。评价对象是指文本中被讨论的主题，具体表现为文本中评价表达所修饰的对象；评价表达抽取主要针对显式情感表达的文本，是指文本中代表情绪、情感、意见或其他个人状态的主观表述，通常以词语或短语形式出现，如“非常漂亮”，“不高兴”。由于评价对象和评价表达紧密联系的，并且可以按照序列标注任务进行识别，尽管两者可以作为独立的任务，但采用联合识别模型会更好的结合两

10、者的信息13。目前用来抽取评价表达和评价对象的方法主要分为两种：基于句法规则匹配的方法和基于机器学习的有指导学习算法。Qiu et al.14采用了一种称为双向传播（double propagation）的算法，通过使用依存句法分析器获取情感词与评价对象的关系，并在两者之间传播信息，在迭代过程中对种子情感词进行 Bootstraping 来扩充情感词典并抽取出评价对象。基于机器学习的有指导学习算法通常将评价表达和评价对象抽取看成字符级别的序列标注（15，16 ）问题。具有代表性的机器学习的算法包括基于特征的CRF（ 17，18，19， 20）序列标注算法和基于神经网络的序列标注算法。由于前者通

11、常依赖专家撰写的特征模板、外部情感词典资源，领域通用性受限，基于神经网络的表示学习算法受到了越来越多的关注，例如，Irosy 和 Cardie21在词向量的基础上运用深层循环神经网络（ Recurrent Neural Network）结构。Liu et al.22进一步使用了基于 LSTM 的循环神经网络（RNN ），同时融入了词性（pos tagging）的分布语义表示，并且在多个数据集上证明优于 CRF 方法。需要注意的是，在实际的文本语料中，评价对象省略现象，情感的隐晦表达，都会给情感元素的抽取工作带来挑战，需要自然语言处理技术中的指代消解、隐式情感分析技术（2324）等支持。3.3

12、文本情感分类文本情感分类的目的是判断给定句子或篇章的情感类别，也称为粗粒度情感分析。文本情感分类是情感分析的最终目标，通常可以在情感元素抽取的基础上进行句子或篇章的情感分类。近年来，由于深度学习的兴起，可以越过情感元素的抽取过程，避免级联错误，使端到端的情感分析成为可能。已有的研究工作可以大体分为基于情感词典和基于特征学习方法，我们将分别从这个两角度介绍已有的相关工作。顾名思义，基于情感词典的方法通常利用情感词或情感短语及情感反转、加强等规则判断句子的情感极性。Turney25提出了一种基于搜索引擎的方法，判断每个词语和已有情感词语的相关度，随后进行文本情感分类2；Ding et al.26利

13、用否定词语和转折词语，提升了基于词典的情感分类方法；Taboada et al.27利用词语的情感强度以及情感加强和否定规则判断篇章的情感极性。基于特征学习的方法是近年来句子级和篇章级情感分类的主流方法2，Pang et al.28提出基于特征的机器学习算法解决情感分类，后续有众多学者设计复杂的特征以提高情感分类的性能。由于手工设计特征很耗时并且依赖于专家知识，越来越多的学者尝试自动地从数据中学习文本的特征表示。基于神经网络的语义组合算法被验证是一种非常有效的特征学习手段，Socher et al.29提出多个基于树结构的 Recursive Neural Network，该方法通过迭代运算的

14、方式学习变量长度的句子或短语的语义表示，在斯坦福情感分析树库（Stanford Sentiment Treebank）上验证了该方法的有效性。Kalchbrenner et al.30使用卷积神经网络学习句子的表示，在句子级情感分类任务上取得了非常出色的效果。Tai et al.31在序列化的 LSTM （Long Short-Term Memory）模型的基础上加入了句法结构的因素，该方法在句法分析的结果上进行语义组合，在句子级情感分类和文本蕴含任务上都取得了很好的效果。随着社交媒体的日益发展，用户在社交媒体上更侧重于喜怒哀乐多类别情感表达，由于多类别情感语料分布不均衡给情感分析带来一定困难

15、，尽管采取了一些解决方案3233，但是多元分类在分类性能上不及褒贬分类。4 情感分析应用系统在上述分析技术的支持下产生了大批基于情感分析的系统和应用。总体来看，它们应用在商品/服务评论分析、社交网络分析、情感机器人这三方面。传统的情感分析应用聚焦于来自消费产品和服务的评论。基于产品评论的代表性平台有 Google Shopping ，它还可以为用户提供在线购物平台的商品检索和比价服务；OpinionEQ 允许商业组织和个人按需定制产品分析服务。微博、Twitter 等社交网络服务的爆炸式发展也为研究人员带来了极大的机遇，研究人员能够通过分析大量富情感的数据来分析公众的情绪变化，并对政府管理、经

16、济、娱乐领域产生影响。从政府和管理者角度出发，联合国开发了针对全球情感波动监测的应用 Global Pulse ，北航的研究小组推出了第一个针对中文微博的在线情感系统 MoodLens ；2012 年美国大选时罗姆尼和奥巴马在 Twitter上展开了激烈宣传，借此影响普通民众及新闻从业者，成为互联网参与总统竞选典型案例。在金融应用方面，许多研究机构将情感分析技术应用于股票分析及预测系统，例如 Stock Sonar 在每只股票的价格旁边展示了每天针对该股的积极和消极的情感信息，为投资者提供即时的参考，UIC 开发的 Twitter 情感分析进行为股市的涨跌进行预测和追踪。在娱乐领域，阿里云的人工智能系统“小Ai” 在我是歌手节目中成功预测李玟夺冠，也是依靠现场数据以及社交网络上的点评数据进行分析预测，这其中都运用了对海量文本情感分析技术。可以看到，对社交媒体的情

展开阅读全文