首页> 中文学位 >基于领域本体与主题模型融合的语义场聚类研究与应用
【6h】

基于领域本体与主题模型融合的语义场聚类研究与应用

代理获取

目录

声明

1引言

1. 1研究背景与意义

1. 2国内外研究的现状

1. 3论文主要研究目标

1. 4论文章节安排

1. 5本章小结

2领域本体的构建

2. 1本体相关知识介绍

2. 2领域本体的构建研究与实现

2. 3本章小结

3. 1主题模型

3.2 BTM主题模型

3. 3基于评论主题的本体扩展

3. 4实验设置

3. 5实验结果与分析

3. 6本章小结

4. 1基于语义场的聚类框架

4. 2语义场参数的估算

4. 3基于领域本体的聚类特征选择与变换

4. 4实验结果与分析

4. 5本章小结

5. 1总结

5. 2展望

致谢

参考文献

附录

展开▼

摘要

随着社交网络时代的到来,评论式的文本迅速发展为人们在网络中表达的主要方式。评论的出现使得人们能够自由、快捷发表观点。同时评论也成为了一种信息获取的渠道。但随着评论数量的快速增长,如何对庞大的评论信息进行组织、归纳、提高信息获取效率是目前需要解决的问题。当前针对信息组织、归纳的方法主要是应用文本聚类。传统文本聚类方法往往存在维数过高、数据稀疏、语义缺失的问题。针对传统文本聚类的问题,本文提出了一种基于领域本体与主题模型融合的语义场聚类算法并应用于旅游领域。本文的研究工作有以下几个内容:
  (1)构建面向特定领域的本体。以旅游领域为例,利用旅游领域的相关资料和文献进行分析,确定领域范围及归纳重要术语,定义旅游本体的类、关系、属性,并为旅游本体添加实例,完成旅游本体的构建,表达旅游领域的知识。
  (2)针对基于背景知识构建的领域本体存在的问题,本文研究了基于主题模型的领域本体扩展方法,通过主题模型挖掘出隐含知识补充领域本体。运用主题模型对评论建模提取隐含主题,利用Word2vec计算隐含主题与领域本体的相似度,揭示隐含主题的内涵,建立主题与领域本体的联系。在此基础上,通过主题-本体的相似度筛选主题并添加到本体完成领域本体的扩展。以旅游领域为场景,设计多组基于隐含主题的旅游本体扩展方案,选取最优的扩展领域本体的方案并验证效果。经实验证明基于主题模型扩充领域本体方法能够有效提高领域本体的领域表达能力。
  (3)针对文本特征的选取缺乏先验知识指导的问题,本文运用已构建的领域本体的辅助领域文本的特征选取、变换、降维。领域本体表达的特定领域的范围及重要概念。利用领域本体提取出具备领域性的特征,转换特征中存在的实例为本体的类,将参与聚类的特征范围限制在领域本体中,解决文本特征选取的问题。
  (4)针对传统文本聚类缺乏语义的问题,利用基于主题模型扩展的领域本体构建语义场,对文本使用基于语义场的聚类算法,并应用于旅游领域。领域本体构建的语义场不仅表征特定领域重要概念、概念的语义联系也刻画了语义的分布。将特定领域文本聚类问题转化为文本在语义场中的相互作用力大小问题。经实验证明基于主题模型扩展领域本体结合语义场的聚类方法有助于提高文本聚类效果。

著录项

  • 作者

    林晓阳;

  • 作者单位

    华南农业大学;

  • 授予单位 华南农业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 林丕源;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.09;
  • 关键词

    领域本体; 主题模型挖掘; 语义场; 文本聚类;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号