词结合型未登录词识别方法研究

周蕾; 朱巧明

首页> 中文期刊> 《常熟理工学院学报》 >词结合型未登录词识别方法研究

词结合型未登录词识别方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

介绍一种基于词结合提取的未登录词识别方法.该方法对碎片分词后的文本建立二元模型，结合互信息和规则过滤提取由若干个词组合而成的未登录词(组).测试结果准确率为84.71%，召回率为72.13%%　　This paper introduces a method to extract unknown Chinese words based on compound words recogni⁃tion. This method builds a bi-gram model on the text which is processed by fragments segmentation, and it uses mutual information and regulations to combine some adjacent words to unknown words. The precision on the open test sets is 84.71% and recall is 72.13%.

著录项

来源
《常熟理工学院学报》 |2012年第4期|110-114|共5页
作者
周蕾; 朱巧明;
展开▼
作者单位

常熟理工学院计算机科学与工程学院,江苏常熟215500;

江苏省计算机信息处理技术重点实验室,江苏苏州215006;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
未登录词; 二元模型; 互信息;

相似文献

中文文献
外文文献
专利

1. 基于领域文献的未登录词识别方法研究 [J] . 徐坤 ,曹锦丹 . 情报杂志 . 2012,第001期
2. 基于统计和规则的未登录词识别方法研究 [J] . 周蕾 ,朱巧明 . 计算机工程 . 2007,第008期
3. 从ACL-SIGHAN国际分词竞赛看已知词和未登录词识别的平衡问题 [J] . 陈丽江 . 南京师范大学文学院学报 . 2005,第001期
4. 汉语未登录词识别现状及一种新识别方法介绍 [J] . 王蕾 ,杨季文 . 计算机应用与软件 . 2007,第008期
5. 混合信息双数组的未登录词动态识别模型 [J] . 陈皓宇 ,洪嘉伟 ,陈致然 . 电脑知识与技术 . 2021,第026期
6. 基于混合策略的中文生物医学领域未登录词识别研究 [C] . Sun Haixia ,孙海霞 ,Li Junlian . 中国医学科学院/北京协和医学院医学信息研究所/图书馆2012年学术年会 . 2013
7. 基于未登录词识别的汉盲翻译系统研究 [A] . 徐豪杰 . 2019

词结合型未登录词识别方法研究

摘要

著录项

相似文献

相关主题

期刊订阅