要解决的问题:提供一种能够自动提取出现频率低的翻译单词对的双语词典准备装置,双语词典准备方法和计算机程序。
解决方案:通过本发明,双语词典准备装置100用于通过使用包括由源语言和目标语言两者表示的多个字符串对的双语语料库和现有的双语词典来新准备双语词典,包括片段对准备部分130,片段对准备部分130用于通过从字符串对中擦除在现有双语词典中注册的翻译词对来准备片段对;片段对保存部分140,用于对片段对的双语语料库中的出现次数进行计数并将其与片段对和片段对提取部分160一起保存在存储部分中,片段对提取部分160从存储部分中提取出现数等于或大于阈值的片段对并将其定义为字典注册候选翻译词对,提供了双语词典的制备方法和计算机程序。通过使用双语词典准备装置,可以自动提取出现频率低的翻译词对。
版权:(C)2007,日本特许厅&INPIT
公开/公告号JP2007249606A
专利类型
公开/公告日2007-09-27
原文格式PDF
申请/专利权人 OKI ELECTRIC IND CO LTD;
申请/专利号JP20060072062
发明设计人 SAKAMOTO HITOSHI;
申请日2006-03-16
分类号G06F17/28;
国家 JP
入库时间 2022-08-21 21:14:50