要解决的问题:自动检测(提取)朝鲜语语料库中的外来词而无需通过使用日语/韩语外来词的音素相似特征来执行翻译语料库的词素分析处理,并自动提取朝鲜语语料库中的外来词,以日文片假名作为线索。
解决方案:将韩语语料库转换为罗马字符,并根据韩语分词书写规则将罗马字符转换后的文本分为短语,然后从分词中删除与词尾相关的后置词和词缀从而获得单词,并且通过去除包括不用于外语符号的任何包括字母字符的短语,从作为外语候选词的单词中提取与罗马字符转换的日语片假名单词相似的单词作为韩文外语单词以及在现有韩语词典中注册的单词。
版权:(C)2005,JPO&NCIPI
公开/公告号JP2004280353A
专利类型
公开/公告日2004-10-07
原文格式PDF
申请/专利权人 PATOLIS CORP;CROSS LANGUAGE INC;
申请/专利号JP20030069535
申请日2003-03-14
分类号G06F17/28;
国家 JP
入库时间 2022-08-21 23:30:14