首页> 中国专利> 一种中文新词语的检测方法及其检测系统

一种中文新词语的检测方法及其检测系统

摘要

本发明涉及一种中文新词语的检测方法及其检测系统。本发明基于Internet的中文新词语自动检测的方法,包括网页采集,网页信息处理和新词查找三个部分,且充分利用了从Internet采集而来的网页上的时间信息,从网页中提取时间信息和内容,对其切分并在切分的基础上查找重复串,然后存入原始数据库,再在给定时间的基础上,将原始数据库划分成给定时间以前和给定时间以后的两个数据库,将这两个数据库进行对比,得到新词候选列表,最后的结果由人工确认一下。本发明通过对比寻找某个时间点以后的新词语,可以寻找不限长度和构成的多字词与多字词组成的新词,并利用词的构成规律来滤除垃圾串,具有时效性高的特点。

著录项

  • 公开/公告号CN100555276C

    专利类型发明授权

  • 公开/公告日2009-10-28

    原文格式PDF

  • 申请/专利权人 中国科学院计算技术研究所;

    申请/专利号CN200410000651.7

  • 发明设计人 邹纲;刘群;

    申请日2004-01-15

  • 分类号G06F17/27(20060101);G06F17/30(20060101);

  • 代理机构11280 北京泛华伟业知识产权代理有限公司;

  • 代理人王凤华

  • 地址 100080 北京市海淀区中关村科学院南路6号

  • 入库时间 2022-08-23 09:03:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-06-19

    专利权的转移 IPC(主分类):G06F 17/27 变更前: 变更后: 登记生效日:20130528 申请日:20040115

    专利申请权、专利权的转移

  • 2009-10-28

    授权

    授权

  • 2005-09-14

    实质审查的生效

    实质审查的生效

  • 2005-07-20

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号