首页> 中文学位 >基于情绪特征的中文微博用户性别识别
【6h】

基于情绪特征的中文微博用户性别识别

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

缩略词

第一章 绪 论

1.1 研究背景及意义

1.2 研究现状

1.3 本文的工作

1.4 本文的组织结构

第二章 微博用户性别识别综述

2.1 社交媒体用户性别识别研究

2.2 微博情绪识别研究

2.3 性别情绪差异及其在博客性别识别中的应用

2.4 本章小结

第三章 中文微博情绪识别

3.1 表情符号分析及其在微博情绪识别中的应用

3.2 多层次中文微博情绪识别

3.3 本章小结

第四章 基于情绪特征的中文微博用户性别识别

4.1 用户性别识别的情绪特征

4.2 基于情绪特征的微博用户性别识别

4.3 实验结果与分析

4.4 本章小结

第五章 基于性别倾向性词典的微博用户性别识别

5.1 微博中词汇的性别倾向性

5.2 构建性别倾向性词典

5.3 实验及结果分析

5.4 本章小结

第六章 总结与展望

参考文献

致谢

在学期间的研究成果及发表的论文

展开▼

摘要

随着社交媒体的迅猛发展,微博成为备受用户青睐的网络交流平台,微博用户性别识别逐渐成为学术界研究的热点。心理学和语言学领域的大量研究表明男性和女性在情绪表达上存在差异。然而,目前利用两性情绪差异帮助识别微博用户性别的研究较少。本文以中文微博文本为研究对象,从情绪的角度出发,分析微博文本中两性表达情绪的差异,并以两性情绪差异为特征,对中文微博用户的性别进行识别。
  首先,本文对中文微博情绪识别进行了研究,主要包括两个方面。一方面,对大量中文微博中表情符号的使用特点、分布情况和情绪表达特点进行了统计分析;根据统计数据为表情符号构建情绪向量,并利用其识别微博情绪。在两个数据集上的实验结果表明,本文建立的表情符情绪向量,有效地提高了微博情绪识别的精度。另一方面,提出了多层次中文微博情绪识别方法。本文将Ekman六类情绪按照情感极性及情绪间的相互关系组织成三层树状结构,在此基础上提出了一种多层次微博情绪识别方法。实验结果表明,该方法降低了各情绪类微博数量分布不平衡对分类结果造成的影响,提高了微博情绪识别的精度。
  其次,本文从两性表达情绪的差异出发,提出了一种基于情绪特征的中文微博用户性别识别方法。本文考虑的情绪特征包括Ekman情绪特征、情绪词特征和与情绪相关的语言风格特征。实验结果表明,本文提取的情绪特征提高了用户性别识别的精度。
  最后,本文基于微博文本中词汇的性别倾向性,对如何构建性别倾向性词典进行了探索。首先提取性别倾向性候选词。然后根据候选词在男性和女性微博中使用频率的差异,提取性别倾向性词,加入性别倾向性词典。若一个候选词在男性用户中的使用频率高于女性用户,则将该候选词作为男性倾向性词。否则,将其作为女性倾向性词。最后使用构建的性别倾向性词典,对微博用户的性别进行识别。

著录项

  • 作者

    刘宝芹;

  • 作者单位

    南京航空航天大学;

  • 授予单位 南京航空航天大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 牛耘;
  • 年度 2016
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.12;
  • 关键词

    中文微博; 性别识别; 情绪特征; 信息处理;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号