首页> 中文学位 >电子政务主题词表的构建及应用研究
【6h】

电子政务主题词表的构建及应用研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

1电子政务主题词表的编制和应用进展

1.1主题检索语言与词表编制

1.2电子政务主题词表的编制及网络应用

1.2.1国外电子政务主题词表的编制及网络应用

1.2.2我国电子政务主题词表的编制

1.3本文研究的主要内容

2词表的自动构建研究

2.1词表的自动构建

2.2词表自动构建的方法

2.2.1各种语种的WordNet转换

2.2.2概念空间方法

2.2.3整合既有词表

2.2.4构建网络用的领域词表

2.2.5利用搜索引擎的方法构建词表

2.2.6利用神经网络来构建词表

2.3本章小结

3共青团电子政务词表自动编制及应用系统设计

3.1系统概述

3.2系统总体设计

3.2.1系统结构设计

3.2.2系统模块介绍

3.3试验数据描述

3.4本章小结

4共青团电子政务主题词表的构建

4.1基于N-gram方法选词

4.1.1 N-gram分词思想

4.1.2 N-gram分词算法

4.1.3选词结果分析

4.2词间关系的识别

4.2.1等同关系的识别

4.2.2等级关系的揭示

4.2.3相关关系的判断

4.2.4实例分析

4.3词表构建的难点

4.4词间关系的比较

4.5计算机自动构建的《共青团电子政务主题词表》的特点

4.6本章小结

5共青团电子政务词表应用系统中主题标引算法研究

5.1自动标引概述

5.1.1自动标引的必要性

5.1.2自动标引的方法

5.2基于《共青团电子政务主题词表》的自动标引

5.2.1标引的流程

5.2.2自动标引的算法

5.3利用N-gram方法识别未登录词

5.4本章小结

6电子政务主题词表自动构建系统及应用

6.1电子政务主题词表自动构建系统的介绍和使用

6.1.1系统的开发环境和开发工具

6.1.2系统的界面简介

6.1.3系统的使用步骤及图示

6.2共青团电子政务主题词表的浏览与检索

7结束语

参考文献

附录

致 谢

展开▼

摘要

目前,电子政务信息的组织和检索基本上是基于关键字的全文检索形式,不能满足用户的多途径检索需求,其检全率和检准率较低。因此,电子政务主题词表对于电子政务信息的组织和检索具有十分重要的意义。而传统的词表编制的方法成本高、需要花费大量的人力、物力,研究用计算机来自动构建一部词表是十分必要的。本文参照国内已出版的《综合电子政务主题词表》,提出自动构建一部面向共青团领域的专业性电子政务词表。 国外对自动构建一部关联词表研究较多,即对词与词之间相关关系的研究,而对完全用计算机来编制一部规范的主题词表则少有研究。国内对自动构建词表的研究更加滞后,更很少真正实现用计算机来自动构建一部词表。 本文对国内外自动构建关联词表的研究进行了全面的文献调查,在系统分析关联词表词间关系特点和词表自动构建的一般方法的基础上,提出用N-gram方法进行选词、用模式匹配和词典匹配的方法来识别词汇的等同关系、用字面相似度后方一致原理来揭示词汇的等级关系、用Dice测度算法来判断词汇的相关关系,从而实现计算机对电子政务词表的自动构建。然后将自动构建词表中部分词汇的词间关系与《中国分类主题词表》、《综合电子政务主题词表》进行比较,用人工对自动构建的词表加以规范处理,并分析了自动构建词表与人工编表方法的优劣。 本文用数据分析了构建的电子政务词表的性能:所收的词量范围较宽泛、参照度和关联比较高、方便用户使用,总体性能良好。但同时也存在一定问题:入口率偏低、生成的词间关系不够准确,时有冗余甚至错误的词间关系生成,这是计算机自动构建词表所难以避免的。 最后,本文对自动构建的电子政务词表进行应用测试,设计了标引、浏览和检索系统,并对标引和检索结果进行了比较和分析。实验结果表明:该词表的词间关系基本合理,具有一定的实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号