封面
声明
中文摘要
英文摘要
目录
插图索引
表格索引
第一章绪论
1 .1 语义网
1 .2 知识库和链接开放数据
1 .3 实体连接
1 .4 本文的贡献及结构
第二章国内外研究现状
2 .1 现有算法总结
2 .2 现有系统实现概述
第三章预备知识介绍
3 . 1 主题模型与LDA
3 .2 分词、词性标注与命名实体识别
3 .3 分布式计算
第四章实体连接算法与设计
4 .1 算法流程
4 .2 知识库结构
4 .3 知识库离线处理
4 .4 领域相关知识抽取
4 .5 领域主题模型训练
4 .6 文本词空间表示抽取
4 .7 实体提及抽取
4 .8 候选选择算法
第五章领域的清理和扩充
5 .1 内链接扩充
5 .2 开放分类扩充
5 .3 跨领域清理
5 .4 扩充清理结果
第六章同义词扩展算法
6 .1 相关定义
6 .2 大规模文本集合处理
6 .3 扩展算法
第七章实验结果
7 .1 实验环境和准备
7 .2 实验数据标注
7 .3 实验结果
第八章系统实现及展示
8 .1 系统编程接口设计
8 .2 系统界面设计
总结与展望
参考文献
致谢
攻读学位期间发表的学术论文目录