首页> 中文学位 >基于语义的文本倾向性分析与应用研究
【6h】

基于语义的文本倾向性分析与应用研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录、注释表

声明

1 绪 论

1.1 研究意义

1.2 国内外研究现状

1.2.1 词语倾向性分析现状

1.2.2 句子倾向性分析现状

1.2.3 文本倾向性分析现状

1.3 本文的主要工作

1.4 本文的组织结构

2 基于语义的倾向性分析理论基础

2.1 传统的文本倾向性分析方法的研究

2.2 基于语义的文本倾向性

2.2.1 语义信息

2.2.2 语义相似度和语义相关度

2.2.3 语义倾向定义

2.2.4 基于语义的文本倾向性分析

2.3 基于语义倾向的语义分析方法

2.3.1 潜在语义索引分析

2.3.2 逐点分析

2.3.3 基于HowNet的语义倾向计算

2.4 本章小结

3 基于HNC的语义相关度计算词语的原始极性算法

3.1 HNC理论概述

3.1.1 HNC理论

3.1.2 HNC理论基本内容

3.2 基于HNC的语义相关度计算方法

3.2.1 HNC语义相关度计算方法

3.2.2 HNC语义相关度计算方法的优点

3.3 基于HNC的语义相关度计算词语的原始极性计算算法

3.3.1 算法描述

3.3.2 实验测试集

3.3.3 实验分析

3.4 本章小结

4 改进的文本倾向性算法

4.1 算法整体框架

4.2 文本预处理

4.2.1 中文分词

4.2.2 去除停用词

4.2.3 提取主观性句子

4.3 基于上下文的词语的倾向性分析

4.3.1 关联词规则

4.3.2 词语倾向性分析

4.4 文本倾向性分析

4.5 实验词表

4.6 实验结果及分析

4.6.1 测试语料

4.6.2 词语极性识别测试

4.7 本章小结

5 文本倾向性分析应用实例

5.1 网络舆情理论

5.1.1 网络舆情的含义与特点

5.1.2 网络舆情监控系统概述

5.1.3 网络舆情监控系统框架

5.2 舆情关键点分析

5.2.1 热点话题发现

5.2.2 极性话题发现

5.2.3 焦点话题发现

5.2.4 敏感话题发现

5.3 实验分析

5.4 文本倾向性分析在国保情报系统中的应用

5.5 本章小结

6 总结与展望

6.1 工作总结

6.2 下一步工作展望

参考文献

致谢

论文及科研情况

展开▼

摘要

随着互联网技术的迅速发展,如今越来越多的人通过瓦联网发表他们对商品服务的意见、交流对各种事件的看法,互联网已不仅权是人们获取信息的仓库,更成为人们发表观点、交流看法的园地,对于互联网用户来说,互联网不以改变了他们的工作方式,同时也改变了他们的生活方式。通常,人们对某件事物进行评论或者表达自己的观点的时候,常常是具有倾向性的,为了能从这些丰富的信息中提取出有用的信息,文本的倾向性分析研究便应运而生了。对文本的倾向性进行分析,是现在自然语言处理中比较活跃的一个领域,其目的是判断一篇文章对评价对象所持有的倾向是支持还是反对。本文的主要工作概括如下:
   (1)分析研究了传统的文本倾向性分析方法,并指出了其中的不足。通过对语义信息和语义倾向的理论知识分析,讨论了三种基于语义倾向的语义分析方法。
   (2)提出一种基于HNC的语义相天度方法计算词语的原始极性算法。在深入研究HNC基本理论的基础上提出了基于HNC。概念基元符号体系理论的语义相关度计算方法,根据HNC理论给出了语义相关度计算策略,并实现了概念符号比较的量化计算的详细方法。最后将基于HNC的语义相关度方法运用到词语的原始极性分析上,从而可以较容易也较准确地计算出词语的原始极性。
   (3)提出一种改进算法计算词语的上下文极性。首先给出文本倾向性算法的整体框架,然后对算法的流程进行了详细的说明。由于忽略句子中的关联词有可能导致极性词的方向或者强度发生错误,所以提出基于上下文的词语的倾向性分析方法来解决这一问题。利用计算极性成分在文本中出现的广度、密度和强度的方法,根据极性词语的分布情况确定评论文本的倾向性。
   (4)在理论研究的基础上,将文本倾向性分析应用到网络舆情监控系统-国保情报系统中,实验表明,将文本倾向性分析应用到网络舆情监控系统中可提高系统的使用效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号