构建单字词表识别未登录词的方法

于童; 刘淑芬

首页> 中文期刊> 《吉林大学学报（理学版）》 >构建单字词表识别未登录词的方法

构建单字词表识别未登录词的方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Chinese word segmentation is a very important task in information processing.The present Chinese word segmentation technology mainly relies on common-word dictionary.But the dictionary has no recognition capability for unknown words.The authors brought forth a method of using double-dictionary to recognize unknown words.The process is to build a common-word dictionary and a single-word dictionary,then combine them for segmentation,solving the inefficiency in recognizing unknown words.As a result,the accuracy rate can reach above 90%.%针对目前中文分词技术主要依赖于常用词词典，而词典对未登录词识别率较低的问题，提出一种用双词典识别未登录词的方法，即构建一个常用词词典和一个单字词词典，二者相互结合进行分词，有效解决了对未登录词识别效率偏低的问题。实验表明，采用构建单字词表法对未登录词的识别准确率可达90%以上。

著录项

来源
《吉林大学学报（理学版）》 |2015年第2期|307-310|共4页
作者
于童; 刘淑芬;
展开▼
作者单位

吉林大学计算机科学与技术学院;

长春 130012;

吉林大学计算机科学与技术学院;

长春 130012;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.12;
关键词
单字词表; 未登录词; 中文分词; 双词典法;

相似文献

中文文献
外文文献
专利

1. 汉语未登录词识别现状及一种新识别方法介绍 [J] . 王蕾 ,杨季文 . 计算机应用与软件 . 2007,第008期
2. 基于未登录词识别的微博评价短语抽取方法 [J] . 汪龙庆 ,张超 ,宋晖 . 计算机应用与软件 . 2017,第006期
3. 基于领域文献的未登录词识别方法研究 [J] . 徐坤 ,曹锦丹 . 情报杂志 . 2012,第001期
4. 词结合型未登录词识别方法研究 [J] . 周蕾 ,朱巧明 . 常熟理工学院学报 . 2012,第004期
5. 基于论坛语料识别中文未登录词的方法 [J] . 都菁 ,熊海灵 . 计算机工程与设计 . 2010,第003期
6. 基于单字词转移概率的未登录词识别 [C] . 何燕 . 全国第六届计算语言学联合学术会议 . 2001
7. 一种中文未登录词识别及词典设计新方法 [A] . 魏莎莎 . 2011

构建单字词表识别未登录词的方法

摘要

著录项

相似文献

相关主题

期刊订阅