《基于Web的评论文本倾向性分析技术研究》由会员分享,可在线阅读,更多相关《基于Web的评论文本倾向性分析技术研究(46页珍藏版)》请在金锄头文库上搜索。
1、 目 录 目目 录录 摘 要 .I Abstract . III 第一章 绪论 . 1 1.1 课题背景和研究意义 . 1 1.2 国内外相关技术及研究现状 . 1 1.3 本文主要内容及创新点 . 3 1.4 论文的组织和安排 . 4 第二章 文本倾向性分析相关技术 . 6 2.1 文本倾向性分析流程 . 6 2.2 网络爬虫技术 . 6 2.2.1 网络爬虫的构成及分类 . 6 2.2.2 网络爬虫的工作原理 . 7 2.2.3 网络爬虫的搜索策略 . 7 2.3 词法分析技术 . 8 2.3.1 中文分词技术 . 8 2.3.2 词语搭配 . 10 2.4 文本倾向性分类技术 . 12
2、2.4.1 N-gram 模型 . 12 2.4.2 贝叶斯 . 12 2.4.3 支持向量机 . 13 2.4.4 KNN . 13 2.4.5 CRFs . 14 2.5 小结 . 14 第三章 基于最大熵的评价搭配识别 . 15 3.1 评价搭配 . 15 3.2 最大熵模型 . 15 3.3 极性词表 . 16 3.4 构建最大熵特征模板 . 17 3.4.1 原子模板 . 17 3.4.2 混合模板 . 18 3.5 实验结果与分析 . 19 3.5.1 数据集 . 19 3.5.2 评价指标 . 19 3.5.3 实验结果与分析 . 20 3.6 小结 . 21 第四章 基于极性词典的网络评论文本倾向性分析 . 22 4.1 极性词典构建方法 . 22 4.1.1 极性词典相关概念 . 22 4.1.2 基础词典构建方法 . 23 4.1.3 领域情感词典构建方法 . 25 4.1.4 领域属性词典构建方法