首页> 中文期刊> 《中文信息学报》 >面向Internet的中文新词语检测

面向Internet的中文新词语检测

         

摘要

随着社会的飞速发展,新词语不断地在日常生活中涌现出来.搜集和整理这些新词语,是中文信息处理中的一个重要研究课题.本文提出了一种自动检测新词语的方法,通过大规模地分析从Internet上采集而来的网页,建立巨大的词和字串的集合,从中自动检测新词语,而后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出采集语料中存在的新词语.根据该方法实现的系统,可以寻找不限长度和不限领域的新词语,目前正应用于<现代汉语新词语信息(电子)词典>的编纂,在实用中大大的减轻了人工查找新词语的负担.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号