要解决的问题:提供一种复合名词提取装置,其允许提取适当的复合名词而无需事先描述复合名词列表或详细规则。
解决方案:复合名词提取器对文档数据进行词素分析,然后通过词素的语音部分信息参照语音部分连接规则,获得连续词素作为复合名词候选词的复合名词候选数据150。语素符合连接规则。复合名词提取装置参照构成复合名词候选者的每个头部语素和每个最终语素的字符串频率数据,获得头部语素的前向得分和最终语素的后向得分,并从头部中提取字符串当两个分数均大于分数设定值时,将词素变为最终词素,作为复合名词。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP2011059754A
专利类型
公开/公告日2011-03-24
原文格式PDF
申请/专利权人 DAINIPPON PRINTING CO LTD;
申请/专利号JP20090205518
发明设计人 ITO NAOYUKI;NAKAGAWA OSAMU;NISHIMURA HARUO;KOBAYASHI NORIYUKI;KOBAYASHI JUNPEI;TAMURA NAOYUKI;NISHIKAWA YUGO;
申请日2009-09-07
分类号G06F17/27;G06F17/30;
国家 JP
入库时间 2022-08-21 18:22:58