首页> 中国专利> 一种用于中文文本定级以及计算中文文本难度评分的方法

一种用于中文文本定级以及计算中文文本难度评分的方法

摘要

本发明涉及一种用于中文文本定级以及计算中文文本难度评分的方法,进行首先文本获取及等级标注,获取具有分类标签的作为训练集的文章,然后进行特征提取,获取每篇文章所对应的全部语言学特征的特征值;再之,进行模型的建立与检验,得出预测准确率达到预期的模型,最后采用得到的模型预测文本难度。本发明适用于各种需要评价文本易读性的场景之中,采用的支持向量回归算法模型通过提高特征的维度空间来达到更好的评分效果,优于传统的线性模型。

著录项

  • 公开/公告号CN107977362B

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利权人 中山大学;

    申请/专利号CN201711309105.5

  • 发明设计人 郑子彬;林星彤;

    申请日2017-12-11

  • 分类号G06F40/289(20200101);G06F40/242(20200101);G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构44329 广东广信君达律师事务所;

  • 代理人杨晓松

  • 地址 510275 广东省广州市新港西路135号

  • 入库时间 2022-08-23 11:44:41

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号