无需词典支持和切词处理的中文文档分类

周水庚; 关佶红; 胡运发

首页> 中文期刊>高技术通讯 >无需词典支持和切词处理的中文文档分类

无需词典支持和切词处理的中文文档分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

利用中文文本的N-gram信息进行中文文档分类，使中文文档分类摆脱了对词典和切词处理的依赖。实验结果表明，该方法能够取得令人满意的分类效果。%A new idea that utilizes the adjacent Chinese character-pairs information to categorize Chinese documents is proposed so that the classifiers can shake o ff the requirements of dictionaries and segmentation processing and subsequently be domain and time independent. Such a Chinese documents categorization system is implemented on the basis of Naive Bayes and kNN methods, and the experimental results show that it can achieve satisfying categorization performance.

著录项

来源
《高技术通讯》|2001年第3期|31-35|共5页
作者
周水庚; 关佶红; 胡运发;
展开▼
作者单位

复旦大学计算机系;

武汉测绘科技大学信息学院;

复旦大学计算机系;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机的应用;
关键词
中文文档分类,N-gram信息,属性选择,贝叶斯分类,kNN 法。;

相似文献

中文文献
外文文献
专利

1. 一个无需词典支持和切词处理的中文文档分类系统 [J] . 周水庚 ,关佶红 ,胡运发 . 计算机研究与发展 . 2001,第007期
2. 一种无需语句分割的中文文档自动分类方法研究及实现 [J] . 何涛 ,黄国兴 . 计算机科学 . 2004,第012期
3. 一种中文文档的非受限无词典抽词方法 [J] . 金翔宇 ,孙正兴 ,张福炎 . 中文信息学报 . 2001,第006期
4. 类义词典中的两种类型:"同义"与"同类"--《同义词词林》与《朗文多功能分类词典》比较 [J] . 宋婧婧 ,苏新春 . 辞书研究 . 2004,第004期
5. 融入分类词典的汉越混合网络神经机器翻译集外词处理方法 [J] . 车万金 ,余正涛 ,郭军军 . 中文信息学报 . 2019,第012期
6. 试论《现代汉语词典》反义词处理的层次 [C] . 李志江 . 汉语词汇学第二届国际学术讨论会暨第六届全国研讨会 . 2006
7. 汉英双语词典中文化特色词的处理方法探析——“三大汉英双语词典”的对比研究 [A] . 张静娜 . 2009

无需词典支持和切词处理的中文文档分类

摘要

著录项

相似文献

相关主题

期刊订阅