首页> 中文学位 >基于情感词的中文文本情感分类研究
【6h】

基于情感词的中文文本情感分类研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1论文研究的背景和意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4论文结构安排

第二章 文本情感分类相关技术

2.1文本情感分类概述

2.2 文本表示模型

2.3 常用文本特征抽取技术

2.4 文本分类算法简介

2.5 文本分类性能评估

2.6 小结

第三章 情感词词典构建

3.1 基础情感词词典构建

3.2 修饰词词典构建

3.3小结

第四章 中文文本情感特征抽取

4.1情感词静态特征识别

4.2 基于上下文的情感词动态特征识别

4.3 小结

第五章 中文文本情感分类实验系统设计及实验

5.1 实验系统框架设计

5.2 分类实验

5.3 小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

附 录一

附 录二

附 录三

附 录四

致谢

展开▼

摘要

近几年来,随着Internet的发展,人们能够方便的获得大量的信息。然而面对海量的信息资源,怎样快速有效的获取并使用其中有效的信息成为人们关注的问题。文本情感倾向性分析能够帮助人们从海量的信息中识别出文本的情感信息,以便对某事做出正确的决策。目前,文本情感分类已成为信息检索和自然语言处理领域中重要的研究方向,广泛应用于信息过滤、网络监管等信息安全领域。本文对基于情感词的中文文本情感倾向分类的情感词识别、情感倾向判断以s及情感权值计算进行了深入研究。本文的主要研究工作如下:  (1)基于中文词语语义相似度方式,提出一种中文情感词词典构建方法。利用该方法构建了两类情感词典:基础情感词词典和修饰词词典,为中文文本情感特征选择以及情感权重计算提供依据。基础情感词词典是以HowNet情感词语集为基础,对每一个基础情感词赋予一个[-1,1]的数值作为情感倾向权重。修饰词词典包括程度词词典、否定词词典以及连词词典。基础情感词典和连词词典用来识别中文情感词;程度词词典和否定词词典用于调整上下文环境中情感词的动态情感倾向。  (2)在情感词的识别方面,提出了一种基于多重情感词典的情感词识别算法。算法思想如下:a、利用基础情感词词典识别情感词;b、利用连词词典扩展文本中与基础情感词连用的情感词语;c、以已选择的情感词作为情感种子词,利用词语距离算法进一步抽取未知的情感词。并在该算法的基础上,以基础情感词词典权值为依据,计算语料库中情感词的静态特征权值。通过实验发现,该方法要优于SO-PMI、HM算法。  (3)在情感词静态特征的基础上,提出一种基于上下文环境的动态特征识别与权值计算方法。首先使用句法分析,找出修饰词与情感词之间的关系,如果是状中关系,则利用程度词词典和否定词词典计算出该情感词的语义情感倾向值。实验表明,基于情感词的上下文动态特征的情感分类性能明显优于情感词的静态特征的情感分类。最后设计了一个文本情感分类实验系统。

著录项

  • 作者

    柳位平;

  • 作者单位

    湖南工业大学;

  • 授予单位 湖南工业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 朱艳辉;
  • 年度 2010
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    情感词,情感分类,中文文本,识别算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号