基于统计学习框架的中文新词检测方法

张海军; 栾静; 李勇; 齐向伟

首页> 中文期刊>计算机科学 >基于统计学习框架的中文新词检测方法

基于统计学习框架的中文新词检测方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Automatic detection of new words is an important foundation in Chinese information processing,but Chinese has an extremely strong word-building ability,which brings great difficulties for new Chinese word detection. This paper put forward a formal model for new word detection, through which the relations between features and detection effects can be constructed. On this basis,this paper also proposed to employ high-effective statistical learning model as a framework to integrate diffirent kinds of available features, which can make full use of the combination of features to further improve the effects of new word detection. Experiments show that the performance of statistical framework is much better than that of simple sum of single features and the method of this paper can effectively improve the result of new word detection. F value in open and closed experiment is 49. 72% and 69. 83% respectively,which reaches a better level among current studies.%新词自动检测是中文信息处理的重要基础,但中文字符极强的构词能力给新词检测带来了巨大困难.提出一种新词检测的形式化描述模型,用以建立特征和新词检测结果之间的统计联系.在此基础上提出应用统计学习模型作为框架来整合不同类型的可用特征,以充分发挥特征之间的组合作用,进一步改善新词检测效果.实验表明,统计框架方法的性能明显地优于特征的简单叠加,能有效提高新词检测效果,开放实验和封闭实验的F值分别为49.72％和69.83％,达到了目前的较好水平.

著录项

来源
《计算机科学》|2012年第2期|232-235|共4页
作者
张海军; 栾静; 李勇; 齐向伟;
展开▼
作者单位

新疆师范大学计算机科学技术学院乌鲁木齐830054;

中国科学技术大学计算机科学与技术学院合肥230027;

新疆师范大学计算机科学技术学院乌鲁木齐830054;

新疆师范大学计算机科学技术学院乌鲁木齐830054;

新疆师范大学计算机科学技术学院乌鲁木齐830054;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
统计框架; 新词检测; 重复模式; 语言知识特征; 统计特征;
入库时间 2022-08-18 04:37:53

相似文献

中文文献
外文文献
专利

1. 基于直方图统计学习的人脸检测方法 [J] . 袁泉 ,杨杰 ,杜春华 . 计算机工程 . 2008,第019期
2. 基于新词发现和Lattice-LSTM的中文医疗命名实体识别 [J] . 赵耀全 ,车超 ,张强 . 计算机应用与软件 . 2021,第001期
3. 一种基于主动学习的中文新词识别算法 [J] . 王博 ,代翔 ,时聪 . 电讯技术 . 2020,第011期
4. 基于词向量的中文新词情感倾向性分析 [J] . 杨政 ,易绵竹 . 计算机系统应用 . 2019,第010期
5. 基于改进的Prefixspan算法的中文文本新词提取方法研究 [J] . 李博涵 ,蔡永香 ,邓舒颖 . 电脑知识与技术 . 2018,第008期
6. 基于统计学习理论的电网薄弱环节识别技术框架研究 [C] . 黄霆 ,林韩 ,黄道姗 . 福建省电机工程学会第十四届学术年会 . 2014
7. 基于统一分词框架的中文新词识别方法 [A] . 秦浩伟 . 2005

基于统计学习框架的中文新词检测方法

摘要

著录项

相似文献

相关主题

期刊订阅