首页> 中文期刊> 《山西大学学报(自然科学版)》 >基于汉字字频向量的中文文本自动分类系统

基于汉字字频向量的中文文本自动分类系统

         

摘要

提出了一种根据汉字统计特性和基于实例映射的中文文本自动分类方法.该方法采用汉字字频向量作为文本的表示方法.它的显著特点是引入线性最小二乘方估计(Linear Least Square Fil, LLSF)技术建立文本分类器模型,通过对训练集语料的手工分类标引以及对文本和类别间的相关性判定的学习,实现了基于全局最小错误率的汉字--类别两个向量空间的映射函数,并用该函数对测试文本进行分类.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号