微博情感分析评测总结

上传人:工**** 文档编号:588108429 上传时间:2024-09-07 格式:PPT 页数:28 大小:1.30MB
返回 下载 相关 举报
微博情感分析评测总结_第1页
第1页 / 共28页
微博情感分析评测总结_第2页
第2页 / 共28页
微博情感分析评测总结_第3页
第3页 / 共28页
微博情感分析评测总结_第4页
第4页 / 共28页
微博情感分析评测总结_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《微博情感分析评测总结》由会员分享,可在线阅读,更多相关《微博情感分析评测总结(28页珍藏版)》请在金锄头文库上搜索。

1、微博情感分析评测总结第一届自然语言处理与中文计算会议2012年11月2日1 1北京大学计算机科学技术研究所北京大学计算机科学技术研究所2 2苏州大学计算机科学与技术学院苏州大学计算机科学与技术学院3 3哈工大深圳研究生院计算机科学与技术学科部哈工大深圳研究生院计算机科学与技术学科部万小军1、李寿山2、徐睿峰3任务设置观点句识别情感倾向性判断针对观点句情感要素抽取针对观点句数据集来自腾讯微博数据原始数据集20话题主要是热门事件,如“三亚春节宰客”约17500条微博约32000个句子数据集数据标注三标注者对同一数据标注数据集大小2023条微博3416个句子1209个非观点句2207个观点句407正

2、面、1766负面、34其他2361个对象441正面、1910负面、10其他数据集标注标准关于观点句个人意愿、心情不是观点句,如“我感到很高兴”表达了明显观点的反问句属于观点句,如“体育竞技有不残酷的吗?”关于观点句倾向性正面、负面,其他(Other)三类,“其他”表示中性或无法确定正负的情况不进行数据集标注标准关于观点句情感对象情感对象优先从当前句子抽取,但可以跨越当前句子从前面的句子或后面的句子中抽取(前面的邻近句子优先)情感对象尽可能完整和明确,事件按细粒度标注:“ipad的屏幕很棒!”-“ipad的屏幕”“官二代陶汝坤:作案动机极其卑劣”-“作案动机”对象本身不是情感表达:”#官二代求爱

3、不成将少女毁容#这种畜生是怎么被教育出来的啊!”-“官二代”人称代词需要尽可能在当前微博内进行指代消解:“小明就读于北京大学,他是名优秀的学生。”-”小明“抽取出句子中每个情感片段所对应的情感对象:“你根本已经不是个人了,你比蛇还冷血,你比畜生还畜生。”-“你”“你”“你”参评单位34支队伍包括全国重点高校与科研机构观点句识别:53组情感倾向判断:48组情感对象抽取:22组观点句识别任务要求识别每条微博中各个句子是观点句还是非观点句评价标准准确率、召回率、F值微平均宏平均观点句识别微平均RecallPrecision1.0000.8000.6000.4000.2000.0000.5000.55

4、00.6000.6500.7000.7500.8000.8500.9000.9501.000观点句识别微平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%5.0%10.0%15.0%20.0%25.0%观点句识别宏平均RecallPrecision

5、1.0000.8000.6000.4000.2000.0000.5000.5500.6000.6500.7000.7500.8000.8500.9000.9501.000观点句识别宏平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%5.0%10.0

6、%15.0%20.0%25.0%情感倾向性判断任务要求判断微博中每条观点句的情感倾向正面、负面、其他评价标准准确率、召回率、F值微平均宏平均情感倾向性判断微平均RecallPrecision0.0000.2000.4000.6000.8001.0000.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.000情感倾向性判断微平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-

7、0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%2.0%4.0%6.0%8.0%10.0%12.0%14.0%16.0%情感倾向性判断宏平均RecallPrecision0.0000.2000.4000.6000.8001.0000.0000.1000.2000.3000.4000.5000.6000.7000.8000.9001.000情感倾向性判断宏平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20

8、-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%2.0%4.0%6.0%8.0%10.0%12.0%14.0%16.0%情感要素抽取任务要求找出微博中每条观点句作者的评价对象判断针对情感对象的观点极性评价标准精确评价宽松评价准确率、召回率、F值情感要素抽取严格评价微平均RecallPrecision0.0000.0500.1000.1500.2000.250

9、0.3000.0000.1000.2000.3000.4000.5000.600情感要素抽取严格评价微平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%情感要素抽取严格评价宏平均R

10、ecallPrecision0.0000.0500.1000.1500.2000.2500.3000.0000.0500.1000.1500.2000.2500.3000.3500.4000.4500.500情感要素抽取严格评价宏平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0

11、.950.95-1.000.0%5.0%10.0%15.0%20.0%25.0%30.0%情感要素抽取宽松评价微平均RecallPrecision0.0000.0500.1000.1500.2000.2500.3000.3500.4000.0000.1000.2000.3000.4000.5000.6000.700情感要素抽取宽松评价微平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.45-0.500.50-0.550.55-0.600.60-0

12、.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.0%5.0%10.0%15.0%20.0%25.0%情感要素抽取宽松评价宏平均RecallPrecision0.0000.0500.1000.1500.2000.2500.3000.3500.4000.0000.1000.2000.3000.4000.5000.6000.700情感要素抽取宽松评价宏平均F-measure百百分分比比0.00-0.050.05-0.100.10-0.150.15-0.200.20-0.250.25-0.300.30-0.350.35-0.400.40-0.450.

13、45-0.500.50-0.550.55-0.600.60-0.650.65-0.700.70-0.750.75-0.800.80-0.850.85-0.900.90-0.950.95-1.000.0%5.0%10.0%15.0%20.0%25.0%小结微博情感分析相当具有挑战性不同于产品评论数据,微博数据领域多样,话题广泛,表达自由本次评测中微博观点句识别、倾向性分析的最好结果F值接近于80%,情感要素抽取的最好结果精确评价F值接近于30%,比预想的结果要好,但仍有较大的提升空间本次评测的标注数据可作为相关研究的科研数据,已免费公开发布标注规范和任务设置有待进一步的改进27致谢感谢腾讯微博提供数据!感谢北京大学、苏州大学、哈工大深圳研究生院的老师和同学进行数据标注与测评!感谢评测参与单位的支持和意见反馈!28

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号