首页> 中国专利> 自然语言分词构造方法及系统、自然语言分类方法及系统

自然语言分词构造方法及系统、自然语言分类方法及系统

摘要

本申请公开了一种自然语言分词构造方法,该方法包括:获取自然语言的Ngram分词,将Ngram分词按照位置序列顺序进行非连续组合,得到组合分词。可见,在原有的Ngram分词基础之上,再将得到的Ngram分词按照位置序列顺序进行组合,通过这样的方法加大了自然语言的表达能力,进而提高自然语言的分类准确率。并且,在本方案中,进一步的对组合分词设置窗口大小,以避免产生过多的组合分词特征量,提高了对自然语言的分类速度。相应的,本发明还公开了一种自然语言分词构造系统、一种自然语言分类方法及系统,同样具有上述有益效果。

著录项

  • 公开/公告号CN107491440B

    专利类型发明专利

  • 公开/公告日2021-07-16

    原文格式PDF

  • 申请/专利权人 马上消费金融股份有限公司;

    申请/专利号CN201710852703.0

  • 发明设计人 罗欢;权圣;

    申请日2017-09-19

  • 分类号G06F40/284(20200101);G06F40/289(20200101);G06F16/33(20190101);G06F16/35(20190101);

  • 代理机构11243 北京银龙知识产权代理有限公司;

  • 代理人许静

  • 地址 401121 重庆市渝北区黄山大道中段52号渝兴广场B2栋4至8楼

  • 入库时间 2022-08-23 12:09:03

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号