要解决的问题:在不遗漏的情况下从新添加的文本中查找要注册的单词,并在构建单词类别的术语词典时有效地执行操作。
解决方案:一种计算机系统,包括:形态分析单元,其通过对文本数据进行形态分析来获取标记序列数据;类别区分单元,其通过使用类别字典来提取未分类词来区分标记序列数据的各个标记;未分类词比较单元,其将所提取的每个未分类词与未分类词比较规则进行比较,以提取与未分类词比较规则匹配的未分类词作为注册候选单词;以及令牌序列比较单元,其对令牌序列进行比较。利用令牌序列比较规则对令牌序列数据进行提取,以提取与令牌序列比较规则匹配的令牌序列作为注册候选单词,并且包括允许单元选择允许用户选择是否在类别中注册注册候选单词的许可单元。字典。
版权:(C)2010,日本特许厅&INPIT
公开/公告号JP2010157178A
专利类型
公开/公告日2010-07-15
原文格式PDF
申请/专利权人 INTERNATL BUSINESS MACH CORP;
申请/专利号JP20090000192
申请日2009-01-05
分类号G06F17/28;G06F17/30;
国家 JP
入库时间 2022-08-21 19:05:37