要解决的问题:基于相同的发明内容,从已申请专利的专利文献中提取平行翻译的句子和平行翻译的单词,并构建用于机器翻译的翻译词典和翻译记忆库基于如此提取的信息,以较低的成本。
解决方案:将日本专利文件11及其相应的美国专利文件12制成翻译语料库1。应用从翻译语料库1中选择的彼此对应的专利文件的句子划分。通过各个标点符号,从通过句子划分获得的句子中提取参考数字,通过如此提取的参考数字的同现来提取平行翻译的句子对3,以及位于与翻译的参考数字相同的参考数字之前的名词。使提取的句子对成为并行翻译词对5。基于IPC,将并行翻译词对5累积在用于特殊领域的并行翻译字典中。
版权:(C)2005,JPO&NCIPI
公开/公告号JP2004348514A
专利类型
公开/公告日2004-12-09
原文格式PDF
申请/专利权人 PATOLIS CORP;CROSS LANGUAGE INC;
申请/专利号JP20030145840
发明设计人 HIGUCHI SHIGETO;MAKITA MITSUHARU;ISHIKAWA TETSUYA;FUJII ATSUSHI;TAKAHASHI HIROYUKI;KAWASAKI TATSUYA;
申请日2003-05-23
分类号G06F17/28;
国家 JP
入库时间 2022-08-21 22:28:52