首页> 中文学位 >基于中文微博文本的人物实体关系提取与分析
【6h】

基于中文微博文本的人物实体关系提取与分析

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1研究目的和意义

1.2 国内外研究现状

1.3本文研究内容

1.4 本文章节安排

2 相关工作

2.1 基于SVM的依赖三元核提取人物社会关系

2.2 基于元学习策略的关系提取

2.3 基于词典的词语语义相似度计算工具

2.4 本章小结

3 人物互动关系提取算法

3.1 基于微博的特点改进依赖三元核

3.2 依赖三元组词项语义特征和句法特征改进方法

3.3 本章小结

4 微博人物互动关系分类

4.1关系描述词提取规则

4.2基于词典分类关系描述词

4.3本章小结

5 实验结果与分析

5.1 实验数据与工具

5.2 改进的依赖三元核(IDTK)提取人物互动关系

5.3 基于元学习策略分类人物互动关系

5.4 可视化人物关系图谱

5.5 本章小结

总结

参考文献

攻读硕士学位期间发表论文及科研成果

致谢

展开▼

摘要

随着互联网技术的发展,出现了许多方便快捷的网络社交平台,例如国外的Twitter、Face Book和国内的新浪微博,腾讯微博等,使得微博这样的社交网络服务(SNS)的网络行为变得越来越频繁,微博文本信息呈现出一种爆炸式增长的趋势,发现人物之间的社会关系、社会行为等有着重要的意义。由于微博的短文本特点,许多关系提取方法无法正常的在微博语料库中使用。基于这样的缺陷,本文的研究内容包括以下几点:
  (1)首先针对微博特点改进了基于依赖三元核的人物关系提取方法,改进内容主要涉及词项的语义相似度和句法相似度。本文利用词项相似度工具HowNet来对词项语义特征进行了分析,然后提出了词项的词性标注(POS)和语义角色(GR)二元组(POS,GR)进行词项句法特征分析,并且计算了词项信息熵以及(POS,GR)二元组的互信息熵的值来分别作为词项语义特征和句法特征的权重。本文将改进后的依赖三元核用于提取人物之间的互动关系集合(IR),并且作为元学习层的输入进行关系分析。
  (2)在获得互动关系后,经过分析发现关系种类复杂,运用在图谱上会产生很多重复、冗余节点,因此本文的元学习层运用互动关系作为输入,提出7种关系描述词提取规则和关系描述词分类算法(RKWCA),将人物社会关系大致分为了朋友,工作,家庭,敌意这四种关系,最后将人物实体作为节点,关系描述词作为属性,关系类型作为边生成可视化图谱。
  (3)本文对提出的方法进行了实验,从微博中提取出了人物的互动关系和社会关系,并且将关系描述词作为边的属性构建出了微博人物知识图谱。
  本文利用句法依赖树解决了短文本处理的问题,并且利用依赖三元核找到人物关系之间的特征,将特征通过元学习的策略学习出人物的社会关系,构建出了可视化人物知识图谱,实验证明了本文研究具有一定的实践和理论意义,提出的基于微博的关系挖掘方法是可行的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号