首页> 中国专利> 中文排比句识别方法及系统

中文排比句识别方法及系统

摘要

本发明提出一种中文排比句识别方法及系统,该方法包括以下步骤:选取目标数据集,其中,目标数据集中包括多种类型的文章;将当前文章中每两个句子构成一个句对,并对得到的句对构建不同维度的特征;根据随机森林方法构建分类模型,并将得到的特征作为模型输入,以根据预设的评价指标对特征进行筛选,得到一组最好的特征以对模型进行训练;根据训练后的模型,在新的测试测试集上对排比句进行抽取,并将抽取的句对组合成句组进行评价,以将句对的分类扩展为句组的分类。本发明能够对文章中的排比句进行有效识别和分类,进而对文章的自动打分和评价系统具有积极的促进作用。

著录项

  • 公开/公告号CN107943852B

    专利类型发明专利

  • 公开/公告日2020-10-30

    原文格式PDF

  • 申请/专利权人 首都师范大学;

    申请/专利号CN201711078736.0

  • 发明设计人 宋巍;刘彤;刘丽珍;

    申请日2017-11-06

  • 分类号G06F16/35(20190101);G06F40/205(20200101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人张润

  • 地址 100037 北京市海淀区西三环北路105号

  • 入库时间 2022-08-23 11:19:17

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号