首页> 中文会议>第四届全国信息检索与内容安全学术会议 >EBMT中加权的维吾尔单词哈希表构造算法

EBMT中加权的维吾尔单词哈希表构造算法

页面导航

摘要
著录项
相似文献
相关主题

摘要

基于实例的机器翻译(EBMT)是一种高效的机器翻译方法,需要有一个海量的实例模式库,如何从中快速地选择出一定数量的与待翻译句子比较相似的候选实例,提供给后续处理,是EBMT研究的关键技术之一.本文统计分析了维吾尔语单词字母的分布特征,设计了基于维吾尔语的散列单词倒排文件,在等概率条件下,散列表的平均查找长度为1.59:依据单词在语料中出现的频率作为权值,提出了一种新颖的解决冲突的次优树构造算法,实验证明,本算法的性能比传统的解决冲突的顺序查找算法和二分查找算法分别高出了27.5%,21.8%,证明了该散列单词倒排文件有较高的检索效率.

著录项

来源
《第四届全国信息检索与内容安全学术会议》|2008年|209-216|共8页
会议地点北京
作者

展开▼
作者单位

中国中文信息学会;

清华大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类翻译机;
关键词
机器翻译; 维吾尔语; 单词哈希表; 分布特征; 倒排文件; 散列单词;
入库时间 2022-08-17 11:09:00

相似文献

中文文献
外文文献
专利

1. EBMT中高效的维吾尔语单词散列表构造算法 [J] . 田生伟 ,吐尔根·依布拉音 ,禹龙 . 中文信息学报 . 2009,第004期
2. 基于维吾尔语单词清、浊音组成结构特征的连续语音单词切分算法 [J] . 木合塔尔·沙地克 ,布合力齐姑丽·瓦斯力 ,李晓 . 西北师范大学学报（自然科学版） . 2013,第004期
3. 联机手写维吾尔文单词识别中两种语言模型的比较研究 [J] . 柳玲玲 ,赵晖 . 计算机应用与软件 . 2012,第009期
4. 维吾尔文后缀树构造算法的设计与实现 [J] . 买买提依明·哈斯木 ,吾守尔·斯拉木 ,维尼拉·木沙江 . 计算机工程与应用 . 2013,第008期
5. 基于信息熵的加权频繁模式树构造算法研究 [J] . 赵旭俊 ,蔡江辉 ,马洋 . 模式识别与人工智能 . 2014,第001期
6. 基于哈希表的加权频繁项目集增量更新WHIUA算法 [C] . 怀自国 . 2014第十四届计算机应用技术交流会 . 2014
7. 基于聚类分析的手写维吾尔文档图像中单词切分技术研究 [A] . 阿依萨代提·阿卜力孜 . 2017

EBMT中加权的维吾尔单词哈希表构造算法

摘要

著录项

相似文献

相关主题

期刊订阅