首页> 中文学位 >教育信息化领域词语的共现网络构建与分析
【6h】

教育信息化领域词语的共现网络构建与分析

代理获取

目录

文摘

英文文摘

第1章 绪论

1.1 研究背景

1.2 研究意义

1.3 本文的主要工作

1.3.1 研究思路

1.3.2 研究主要内容

1.4 本文组织结构

第2章 共现网络构建综述

2.1 网页预处理

2.1.1 文档清理

2.1.2 正文提取

2.2 词语提取

2.2.1 分词及词性标注

2.2.2 人名及机构名提取

2.2.3 关键概念提取

2.3 共现网络的构建

2.3.1 共现

2.3.2 共现网络

2.3.3 共现网络的构建

第3章 共现网络分析综述

3.1 基于图模型

3.2 图的属性

3.2.1 半径与直径

3.2.2 度分布

3.2.3 聚类系数

3.3 图的操作

3.3.1 图的遍历

3.3.2 最短路径

3.3.3 网络排名

3.3.4 顶点相似度

3.3.5 图的聚类

第4章 系统框架与实现

4.1 系统框架

4.2 共现网络的构建

4.2.1 词语提取

4.2.2 网络构建

4.3 共现网络的分析

4.3.1 词语网络结构

4.3.2 热点词语

4.3.3 词语关联度

4.3.4 词语聚类

4.4 实验结果分析

第5章 总结与展望

5.1 主要工作回顾

5.2 本文的主要贡献和创新之处

5.3 进一步研究工作展望

参考文献

在读期间发表的学术论文及研究成果

致谢

展开▼

摘要

近年来,由于计算机与网络技术的迅速发展,大量的数据信息不断涌现,怎样把这些数据信息变换为有用的知识越来越受到人们的关注。因此,有关数据挖掘、知识管理方面的研究越来越广泛,其应用也越来越深入。
   数据挖掘,总的来说,可以概括为一个在数据中发现模式的过程。传统的数据挖掘技术认为数据的属性和值都是独立的,这一假设让数据挖掘的理论分析很容易被理解,但在很多实际情况中这一假设并不适用,数据的属性和值并不独立,而是存在一定的关联。因此,将这种关联用网络或者图的形式加以描述是一种既直观明了又饱含语义信息的挖掘方式,可以称之为“基于网络模型的数据挖掘”。
   本文的研究正是采用了这种基于网络模型的数据挖掘方法,从领域语料库中发掘领域重要词语之间的关联意义,具体地,以复杂网络的相关理论为基础,分析研究从领域语料库中建立的词语共现网络,进而发现有用的知识。研究首先从领域文本语料中提取出人名、机构名及描述领域关键概念的词语;接着以句子为语义单位统计这些词语的共现信息并按一定规则构建词语共现网络;最后论文从复杂网络的相关理论出发,分析该词语网络的结构属性特征,揭示出词语网络的小世界及无尺度结构,探讨并实践了挖掘该词语网络的核心节点的四种方法,进一步从网络结构的角度来计算词语之间的关联度,并基于网络结构划分的概念实现了词语的聚类。实验结果表明使用这种有别于向量模型的方法来分析领域文本语料,尽可能地保留了词语之间的语义信息,具有一定的可行性及借鉴意义。特别地,本文基于网络模型来挖掘教育信息化领域文本语料,可以发现教育信息化领域相关词语的使用情况,获取教育信息化领域的热点词语,计算词语在语料中的关联度,实现词语的聚类。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号