首页> 中文期刊> 《计算机系统应用》 >汉英-泰互译有声语料的数据库研究

汉英-泰互译有声语料的数据库研究

     

摘要

The development of“English Chinese-Thai Translation Audible Corpus”, in the field of Thai public opinion analysis, it solves the problem of the lack of training corpus in dictionary segmentation algorithm. In this paper, the computerized information processing technology is used to organize , standardize , process and store large amounts of collected Thai corpus, and then more than 8000 of the Thai vocabularies are finished. And then it uses the dictionary translation and manual calibration to align corpus. Finally, Thai corpus are classified and marked normally, combined with syntax characteristics and syntactic semantic features of Thai language, and then the database of English Chinese-Thai corpus is constructed, which contains about 50 thousand of the query terms.%“汉英-泰互译有声语料库”的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题。本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工与存储,统计出泰文词汇8000多个。然后利用词典翻译和人工校对其进行语料对齐。最后,结合泰文语言语法特征以及句法的语义特点,分类归纳和规范标注泰语语料,构建了5万条左右的的汉英-泰语料数据库。

著录项

  • 来源
    《计算机系统应用》 |2016年第9期|223-229|共7页
  • 作者单位

    云南民族大学 云南省高校少数民族语言文字信息化处理工程研究中心;

    昆明 650500;

    云南民族大学 电气信息工程学院;

    昆明 650500;

    云南民族大学 云南省高校少数民族语言文字信息化处理工程研究中心;

    昆明 650500;

    云南民族大学 电气信息工程学院;

    昆明 650500;

    云南民族大学 云南省高校少数民族语言文字信息化处理工程研究中心;

    昆明 650500;

    云南民族大学 云南省高校少数民族语言文字信息化处理工程研究中心;

    昆明 650500;

    云南民族大学 电气信息工程学院;

    昆明 650500;

    云南民族大学 云南省高校少数民族语言文字信息化处理工程研究中心;

    昆明 650500;

    云南民族大学 国际教育学院;

    昆明 650500;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    汉英-泰; 语料库; 互译有声; 舆情; 泰文分词;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号