首页> 中文会议>第四届全国信息检索与内容安全学术会议 >EBMT中加权的维吾尔单词哈希表构造算法

EBMT中加权的维吾尔单词哈希表构造算法

摘要

基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,需要有一个海量的实例模式库,如何从中快速地选择出一定数量的与待翻译句子比较相似的候选实例,提供给后续处理,是EBMT研究的关键技术之一.本文统计分析了维吾尔语单词字母的分布特征,设计了基于维吾尔语的散列单词倒排文件,在等概率条件下,散列表的平均查找长度为1.59:依据单词在语料中出现的频率作为权值,提出了一种新颖的解决冲突的次优树构造算法,实验证明,本算法的性能比传统的解决冲突的顺序查找算法和二分查找算法分别高出了27.5%,21.8%,证明了该散列单词倒排文件有较高的检索效率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号