基于句子相似度的文本比对算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机和网络的日益普及,各类信息资源共享程度越来越高,给工作和生活带来极大的便利。人们每天都要获取和处理大量的信息,如何从海量数据中提取有价值的信息,已经成为信息技术领域的热门问题。然而,面对海量数据,现在我们又面临着另外一个相反问题:由于计算机与网络带来的极大便利,如何鉴别信息的相似性?
　　基于句子相似度的文本比对算法研究,就是在分析句子构成以及句子含义的基础上,通过某种算法,将目标文本和标准文本进行相似度计算,以得出对文本相似程度的判定,为将来进行文本比对和鉴定提供依据。
　　首先本文对现有常见的词语、句子以及文本相似度计算的关键问题进行了讨论,分析了基于向量空间模型的TF-IDF方法、基于汉明距离的文本相似度计算方法、隐性语义标引、基于属性论的文本相似度算法、基于语义理解的相似度计算以及基于知网的相似度算法。
　　其次,本文对部分相似度算法做了一定程度上的改进,希望能获得更好的相似度比较效果。文中也给出了关于句子相似度的文本比对算法的计算机实现过程,并利用相关文本进行了测试,对所用的方法进行验证。

著录项

作者
杨茂;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科信息与通信工程
授予学位硕士
导师姓名刘乃琦;
年度 2010
页码
总页数
原文格式 PDF
正文语种中文
中图分类形式语言理论;算法理论;
关键词
句子相似度; 文本比对; 相似度计算方法; 相似度算法; 信息资源共享; 计算机; 海量数据; 比对算法; 隐性语义标引; 相似度比较; 语义理解; 信息技术; 相似程度; 网络; 算法研究; 热门问题; 目标文本; 空间模型; 句子构成; 鉴别信息;

相似文献

中文文献
外文文献
专利

1. 基于句子相似度的文本主题句提取算法研究 [J] . 孔胜 ,王宇 . 情报学报 . 2011,第006期
2. 基于变系数词性空间权值定义的英文句子相似度算法研究 [J] . 黄贤英 ,张金鹏 ,赵明军 . 计算机应用研究 . 2015,第004期
3. 一种基于向量词序的句子相似度算法研究 [J] . 程志强 ,闵华松 . 计算机仿真 . 2014,第007期
4. 基于句子相似度的文档复制检测算法研究 [J] . 秦新国 . 现代图书情报技术 . 2007,第011期
5. 基于句子相似度语句定位的文本作业检测技术 [J] . 张超 ,侯青青 ,陶宏敏 . 计算机光盘软件与应用 . 2013,第004期
6. 基于句子包相似度的文本复制检测研究 [C] . WANG Yu ,王宇 ,WANG Sen . 信息系统协会中国分会第三届学术年会 . 2009
7. 基于语义相似度的中文文本相似度算法研究 [A] . 金希茜 . 2009

基于句子相似度的文本比对算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅