基于多特征提取的中文二元分类

韦强申

首页> 中文期刊> 《科技风》 >基于多特征提取的中文二元分类

基于多特征提取的中文二元分类

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

通过对中文文本中二元组进行分类,可以提取出文本中的中文词汇研究中文二元组的组合规律,抽取二元组的词频、邻接熵、二元组概率、互信息值、卡方值等多个特征.利用机器学习的方法将二元组分为二元词、非词和待扩展词三类,实现中文词汇的自动提取.实验分别采了用朴素贝叶斯模型和决策树算模型进行训练,利用模型预测中文二元组.抽取中文词汇.实验结果表明,决策树算模型分类效果较好,准确率70.3％,召回率73.5％,F1值71.9％.

著录项

来源
《科技风》 |2016年第2期|1113|共2页
作者
韦强申;
展开▼
作者单位

贵州师范大学数学与计算机科学学院,贵州贵阳550001;

展开▼
原文格式 PDF
正文语种 chi
中图分类
关键词
邻接熵; 互信息; 卡方值; 朴素贝叶斯模型; 决策树算模型;

相似文献

中文文献
外文文献
专利

1. 基于多特征提取的中文微博舆情分类研究 [J] . 林伟 . 中国人民公安大学学报（自然科学版） . 2016,第004期
2. 基于多特征提取和SVM分类器的纹理图像分类 [J] . 唐银凤 ,黄志明 ,黄荣娟 . 计算机应用与软件 . 2011,第006期
3. 一种基于多特征因子改进的中文文本分类算法 [J] . 叶敏 ,汤世平 ,牛振东 . 中文信息学报 . 2017,第004期
4. 基于多特征融合的中文评论情感分类算法 [J] . 陈昀 ,毕海岩 . 河北大学学报（自然科学版） . 2015,第006期
5. 基于多特征与复合分类法的中文微博情感分析 [J] . 吴维 ,肖诗斌 . 北京信息科技大学学报（自然科学版） . 2013,第004期
6. 基于多特征多分类器集成的专利自动分类研究 [C] . Jia Shanshan ,贾杉杉 ,Liu Chang . 首届数据分析与知识发现学术研讨会 . 2017
7. 基于多特征融合的中文情感分类方法研究 [A] . 张兆年 . 2012

基于多特征提取的中文二元分类

摘要

著录项

相似文献

相关主题

期刊订阅