首页> 中文期刊> 《计算机应用研究》 >基于词序列频率有向网的中文组合词提取算法

基于词序列频率有向网的中文组合词提取算法

         

摘要

随着人类知识体系的不断拓展和深化,很多组合词(多个词或语素组成的词)被创造出来用于表达新的概念.由于无法及时把组合词收录进词库,分词系统无法识别它们.为此,从文本中提取组合词成为智能计算领域的一个热门的研究方向.借鉴人类的认知心理模式,提出一种基于词序列频率有向网的组合词抽取算法,以识别自由文本中的组合词.算法首先建立描述文本中的词序列出现频率的有向网,然后通过独特的矩阵运算,逐步把组合词提取出来.算法的优点是无须借助专业的语言知识,在实验分析中,算法显示了较好的效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号