首页> 中国专利> 一种跨语种语料自动分类与检索方法

一种跨语种语料自动分类与检索方法

摘要

本发明属计算机信息处理技术领域,是一种跨语种语料自动分类与检索方法。其特点是用文本的Gram(n,s)表示以及其中的n-Gram分布特性来表示文本的特征,并由此计算文本之间的相似度;然后,根据相似度大小对文本进行自动聚类、领域分类、检索。与通常的基于字词频统计方法相比,本发明可同时处理多种语言,不需要任何词典,不需要对文本进行分词或抽词干等麻烦的预处理过程。方法的容错性、检索与分类的速度和精度等更为优越,且极易于在微机上实现。因此可广泛用于大规模多语种语料的自动聚类、邮件分类、信息过滤、电子会议以及信息检索服务等领域。

著录项

  • 公开/公告号CN1158460A

    专利类型发明专利

  • 公开/公告日1997-09-03

    原文格式PDF

  • 申请/专利权人 复旦大学;

    申请/专利号CN96116654.1

  • 发明设计人 韦雄观;吴立德;

    申请日1996-12-31

  • 分类号G06F17/30;

  • 代理机构复旦大学专利事务所;

  • 代理人陆飞

  • 地址 200433 上海市邯郸路220号

  • 入库时间 2023-12-17 13:00:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 1997-09-03

    公开

    公开

  • 1997-08-13

    实质审查请求的生效

    实质审查请求的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号