首页> 中文学位 >中文微博观点句识别及评价对象抽取
【6h】

中文微博观点句识别及评价对象抽取

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪 论

1.1 研究背景及意义

1.2 相关研究

1.3 本文研究内容

1.4 本文组织结构

第二章 相关模型的算法

2.1 隐马尔科夫模型

2.2 最大熵模型

2.3 条件随机场

2.4 本章小结

第三章 中文微博观点句识别

3.1 微博观点句识别任务描述

3.2 微博观点句识别的思路和实现

3.3 实验过程及结果分析

3.4 本章小结

第四章 观点句评价对象抽取

4.1 观点句评价对象抽取任务描述

4.2观点句评价对象抽取的思路和实现

4.3 实验过程及结果分析

4.4 本章小结

第五章 总结与展望

5.1 本文主要工作

5.2 存在的问题及下一步工作展望

参考文献

附录

附录1 隐马尔科夫模型前向变量的公式推导

附录2 隐马尔科夫模型后向变量的公式推导

附录3 条件随机场模型参数的公式推导

致谢

攻读学位期间发表的学术论文

展开▼

摘要

随着互联网技术的迅猛发展,微博已经成为广大互联网用户展现自我、分享体验和表达观点的网络平台,越来越多的微博用户热衷于通过更新微博来表达对所关心的事物。微博上的信息包罗万象,对规模庞大且带有情感倾向的微博文本进行分析和研究,可以为潜在的消费者(政府部门、企业、个人)获取相关评论提供参考。微博情感倾向性分析已成为自然语言处理中的一个研究热点。目前国外针对英文微博的情感倾向性分析的研究开始进入应用阶段,例如在2009年的德国大选中,国外自然语言处理专家对Twitter上的100,000多条相关微博进行了分析,分析结果与大选结果一致,表明了微博能够准确的反映民意。而针对中文微博的情感倾向性分析的研究还处于起步阶段。本文在分析微博观点句识别和观点句评价对象抽取现状的基础上,确定了基于最大熵模型的微博观点句识别和基于条件随机场模型的观点句评价对象抽取作为研究方案。本文的研究内容包括以下几个方面:
  (1)构建微博情感词典和网络用语词典;将HowNet的正面、负面情感词和正面、负面评价词作为初始的微博情感词典,并手工将一些明确表达观点的口语词也收录到情感词典中来构建微博情感词典,微博情感词典作为微博观点句识别和情感极性判断的基础。
  (2)采用基于规则和机器学习的方法进行观点句识别和情感极性的分类;本文基于情感词位置和句法结构的依赖关系为规则提取微博文本特征,采用最大熵模型作为分类器。从微博文本中提取情感词,围绕情感词提取程度副词和依赖关系作为特征函数来训练最大熵模型,利用训练好的模型来预测微博文本是否是观点句和微博文本的情感极性。
  (3)采用基于机器学习的方法抽取观点句评价对象;微博观点句评价对象的抽取实质就是一个序列标注的过程,以微博文本中的词作为观测序列,通过条件随机场模型为观测序列找到最可能的状态序列。本文以词、词性和词在微博文本中的结构特征作为条件随机场模型特征模板的参数,训练条件随机场模型对评价对象进行识别。
  通过对 COAE2013任务三和任务四提供的微博语料进行训练和测试,本文微博观点句识别的测评结果中正面观点句识别 F1指标为83.31%、负面观点句识别 F1指标为83.15%,COAE2013微博观点句识别的测评结果中正面观点句识别最高F1指标为35.1%、负面观点句识别最高F1指标为39.7%,本文的评测结果与COAE2013的测评结果相比有了明显的提高,从而证明了本文研究方法的可行性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号