中文微博观点句识别及评价对象抽取

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网技术的迅猛发展，微博已经成为广大互联网用户展现自我、分享体验和表达观点的网络平台，越来越多的微博用户热衷于通过更新微博来表达对所关心的事物。微博上的信息包罗万象，对规模庞大且带有情感倾向的微博文本进行分析和研究，可以为潜在的消费者（政府部门、企业、个人）获取相关评论提供参考。微博情感倾向性分析已成为自然语言处理中的一个研究热点。目前国外针对英文微博的情感倾向性分析的研究开始进入应用阶段，例如在2009年的德国大选中，国外自然语言处理专家对Twitter上的100,000多条相关微博进行了分析，分析结果与大选结果一致，表明了微博能够准确的反映民意。而针对中文微博的情感倾向性分析的研究还处于起步阶段。本文在分析微博观点句识别和观点句评价对象抽取现状的基础上，确定了基于最大熵模型的微博观点句识别和基于条件随机场模型的观点句评价对象抽取作为研究方案。本文的研究内容包括以下几个方面：
　　（1）构建微博情感词典和网络用语词典；将HowNet的正面、负面情感词和正面、负面评价词作为初始的微博情感词典，并手工将一些明确表达观点的口语词也收录到情感词典中来构建微博情感词典，微博情感词典作为微博观点句识别和情感极性判断的基础。
　　（2）采用基于规则和机器学习的方法进行观点句识别和情感极性的分类；本文基于情感词位置和句法结构的依赖关系为规则提取微博文本特征，采用最大熵模型作为分类器。从微博文本中提取情感词，围绕情感词提取程度副词和依赖关系作为特征函数来训练最大熵模型，利用训练好的模型来预测微博文本是否是观点句和微博文本的情感极性。
　　（3）采用基于机器学习的方法抽取观点句评价对象；微博观点句评价对象的抽取实质就是一个序列标注的过程，以微博文本中的词作为观测序列，通过条件随机场模型为观测序列找到最可能的状态序列。本文以词、词性和词在微博文本中的结构特征作为条件随机场模型特征模板的参数，训练条件随机场模型对评价对象进行识别。
　　通过对 COAE2013任务三和任务四提供的微博语料进行训练和测试，本文微博观点句识别的测评结果中正面观点句识别 F1指标为83.31％、负面观点句识别 F1指标为83.15%，COAE2013微博观点句识别的测评结果中正面观点句识别最高F1指标为35.1%、负面观点句识别最高F1指标为39.7%，本文的评测结果与COAE2013的测评结果相比有了明显的提高，从而证明了本文研究方法的可行性和有效性。

著录项

作者
胡默之;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科计算机技术
授予学位硕士
导师姓名姚天昉;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
中文微博; 观点句识别; 评价对象抽取; 句法分析;

相似文献

中文文献
外文文献
专利

1. 中文微博观点句识别及要素抽取研究 [J] . 王冠群 ,田雪 ,黄德根 . 数据采集与处理 . 2016,第001期
2. 面向中文微博的观点句识别研究 [J] . 丁晟春 ,孟美任 ,李霄 . 情报学报 . 2014,第002期
3. 基于共现词的中文微博观点句识别 [J] . 郑诚 ,张吉赓 ,杨希 . 电脑知识与技术 . 2014,第011期
4. 基于证据理论的多分类器中文微博观点句识别 [J] . 郭云龙 ,潘玉斌 ,张泽宇 . 计算机工程 . 2014,第004期
5. 基于SVM的中文微博观点句识别算法 [J] . 杜锐 ,朱艳辉 ,鲁琳 . 湖南工业大学学报 . 2013,第002期
6. 细颗粒度观点挖掘中的观点句识别与要素抽取研究综述 [C] . CHEN Feng ,陈锋 . 2015年第六届全国知识组织与知识链接学术交流会 . 2015
7. 中文微博观点句识别及要素抽取研究 [A] . 王冠群 . 2016

中文微博观点句识别及评价对象抽取

目录

摘要

著录项

相似文献

相关主题

期刊订阅