首页> 外国专利> Parallel corpus creation system and parallel corpus creation method

Parallel corpus creation system and parallel corpus creation method

机译:并行语料库创建系统和并行语料库创建方法

摘要

PPROBLEM TO BE SOLVED: To provide a system capable of efficiently collecting a large amount of bilingual text data used for a statistic machine translation system. PSOLUTION: In a bilingual corpus creation system, a translation target database 4 stores text data to be translated, and a server 1 publishes a webpage that displays the text data extracted from the translation target database 4 and an input box for receiving an input of a translation sentence to the text data on the Internet. The server 1 reads the translation sentence written in the input box from a terminal connected to the Internet for the published webpage to store the translation sentence in a translation sentence database 5, determines the correctness of the translation sentence when a fixed amount of the translation sentence is stored, and stores the translation sentence determined to be correct as text data of a bilingual corpus. PCOPYRIGHT: (C)2010,JPO&INPIT
机译:

要解决的问题:提供一种能够有效地收集用于统计机器翻译系统的大量双语文本数据的系统。

解决方案:在双语语料库创建系统中,翻译目标数据库4存储要翻译的文本数据,服务器1发布显示从翻译目标数据库4提取的文本数据的网页和用于接收翻译的数据库。在互联网上将翻译语句输入文本数据。服务器1从连接到互联网的终端上为发布的网页读取输入框中写的翻译句子,以将翻译句子存储在翻译句子数据库5中,当翻译句子的数量固定时,确定翻译句子的正确性。被存储,并将被确定为正确的翻译语句存储为双语语料的文本数据。

版权:(C)2010,日本特许厅&INPIT

著录项

  • 公开/公告号JP5380938B2

    专利类型

  • 公开/公告日2014-01-08

    原文格式PDF

  • 申请/专利权人 カシオ計算機株式会社;

    申请/专利号JP20080195644

  • 发明设计人 山口 倫治;

    申请日2008-07-30

  • 分类号G06F17/28;

  • 国家 JP

  • 入库时间 2022-08-21 16:10:52

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号