用于双语科技术语对齐的汉维文可比语料库构建

彭飞; 吐尔根.依布拉音; 艾山·吾买尔; 米尔夏提·力提甫

首页> 中文期刊>新疆大学学报（自然科学版） >用于双语科技术语对齐的汉维文可比语料库构建

用于双语科技术语对齐的汉维文可比语料库构建

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

面向汉文维吾尔文(以下简称汉维)双语科技术语抽取这一应用目标,本文提出新闻科技领域的汉维可比语料库设计方案并进行实验.将网络采集的汉维语料利用机器翻译系统进行初加工后映射到向量空间中并使用LSI算法计算出各向量间的相关性,利用计算后的向量建立索引并依次计算出源文本与候选文本的相似值.本文设计两种实验进行对比,对选取的可比语料进行评估、筛选,最终达到构建汉维可比语料库的目的.%In order to realize the practical requirement of Chinese-Uyghur bilingual scientific and technical terms,this paper proposes a Chinese-Uyghur comparable corpus design for the field of news,science and technology and carries out a feasibility experiment.It is first proposed to use more mature Chinese-Uyghur machine translation system to establish the Chinese-Uyghur comparable corpus.We use the Chinese-Uyghur corpus collected on the network to map the collected corpus to the vector space and use the LSI algorithm to compute the correlation between the words.The calculated text is indexed as candidate text and then the similarity between the source text and the candidate text is calculated in turn.Furthermore,two experimental schemes are designed and compared,and the selected corpus is evaluated and screened to achieve the goal of constructing the Chinese-Uyghur comparable corpus.

著录项

来源
《新疆大学学报（自然科学版）》|2017年第3期|316-321|共6页
作者
彭飞; 吐尔根.依布拉音; 艾山·吾买尔; 米尔夏提·力提甫;
展开▼
作者单位

新疆大学信息科学与工程学院,新疆乌鲁木齐830046;

新疆大学新疆多语种信息技术重点实验室,新疆乌鲁木齐830046;

新疆大学信息科学与工程学院,新疆乌鲁木齐830046;

新疆大学新疆多语种信息技术重点实验室,新疆乌鲁木齐830046;

新疆大学信息科学与工程学院,新疆乌鲁木齐830046;

新疆大学新疆多语种信息技术重点实验室,新疆乌鲁木齐830046;

新疆大学信息科学与工程学院,新疆乌鲁木齐830046;

展开▼
原文格式 PDF
正文语种 chi
中图分类翻译机;
关键词
可比语料库; 汉维可比语料库构建; 双语术语抽取; LSI;
入库时间 2023-07-25 22:48:23

相似文献

中文文献
外文文献
专利

1. 纳-汉双语语料库构建及双语语料对齐 [J] . 赵芳婷 ,余正涛 ,线岩团 . 广西师范大学学报（自然科学版） . 2009,第001期
2. 借助汉-越双语词对齐语料构建越南语依存树库 [J] . 李发杰 ,余正涛 ,郭剑毅 . 中文信息学报 . 2015,第006期
3. 融入多特征的汉韩双语自动句对齐方法 [J] . 刘晨阳 ,唐慧丰 . 智能计算机与应用 . 2021,第001期
4. 融入双语词向量的韩汉名词短语对齐方法研究 [J] . 刘晨阳 ,赵天锐 . 智能计算机与应用 . 2021,第009期
5. 融入多特征的汉韩双语自动句对齐方法 [J] . 刘晨阳 ,唐慧丰 . 智能计算机与应用 . 2021,第001期
6. 借助汉-越双语词对齐语料构建越南语依存树库 [C] . Li Fajie ,李发杰 ,Yu Zhengtao . 中国中文信息学会2015学术年会（CIPS2015）暨第十四届全国计算语言学学术会议（CCL2015）、第三届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD2015） . 2015
7. 《蒙汉双语对齐语料库》的实验性研究与实现 [A] . 张跟兄 . 2009

用于双语科技术语对齐的汉维文可比语料库构建

摘要

著录项

相似文献

相关主题

期刊订阅