首页> 中文期刊> 《中文信息学报》 >中文信息检索系统的模糊匹配算法研究和实现

中文信息检索系统的模糊匹配算法研究和实现

         

摘要

在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题.本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上.实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到"子线性"的效率.

著录项

  • 来源
    《中文信息学报》 |2007年第6期|59-64|共6页
  • 作者单位

    清华大学计算机系,清华信息科学与技术国家实验室技术创新和开发部,语音和语言技术中心,北京,100084;

    清华大学计算机系,清华信息科学与技术国家实验室技术创新和开发部,语音和语言技术中心,北京,100084;

    清华大学计算机系,清华信息科学与技术国家实验室技术创新和开发部,语音和语言技术中心,北京,100084;

    清华大学计算机系,清华信息科学与技术国家实验室技术创新和开发部,语音和语言技术中心,北京,100084;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    计算机应用; 中文信息处理; 模糊匹配; 过滤算法; 动态规划;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号