首页> 中国专利> 一种无意义句子识别的方法和设备

一种无意义句子识别的方法和设备

摘要

本发明提出了一种无意义句子识别的方法和设备,其中该方法包括:获取数量超过指定数量的预先确定了有无意义的标本句子;通过对所述标本句子进行特征抽取,获取到基于分词和词性处理得到的特征的概率特征值、以及获取到各类型字词以及标点的字数及字词比例;将所述概率特征值、所述字数以及所述字词比例在逻辑斯特回归模型中训练,得到无意义句子识别模型;当接收到待判断的新句子时,对所述新句子进行特征抽取,并基于所获取到的特征和所述无意义句子识别模型确定所述新句子是否为无意义句子。以此实现了对无意义句子的识别,且还通过标点的字数及字词比例来进行训练,实现了不同场景下对无意义句子的不同标准的识别。

著录项

  • 公开/公告号CN107066447B

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 广东惠禾科技发展有限公司;

    申请/专利号CN201710255837.4

  • 发明设计人 姚佳;

    申请日2017-04-19

  • 分类号G06F40/211(20200101);

  • 代理机构11371 北京超凡志成知识产权代理事务所(普通合伙);

  • 代理人马维丽

  • 地址 518054 广东省深圳市南山区粤海街道学府路2388号怡化金融科技大厦14楼01-02单元

  • 入库时间 2022-08-23 11:37:15

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号