首页> 中国专利> 基于网络新闻的时评类作文素材语料库的构建方法及系统

基于网络新闻的时评类作文素材语料库的构建方法及系统

摘要

本发明提供一种基于网络新闻的时评类作文素材语料库的构建方法及系统,涉及自然语言处理技术领域。本技术方案对原始网络语料数据先后进行清洗、预处理,以及向量化、特征提取等处理,然后利用K‑Means++策略优化算法和单边增量聚类的方法对传统K均值聚类算法进行改进,再利用改进后的K均值聚类算法对目标文本进行聚类,从而可以实现运用一个概率公式来选取K个聚类中心,通过事先设定相似度比较阈值,快速判断新增文本的主题类别,然后再根据主题类别提取主题词构建语文时评类作文写作素材语料库。本技术方案提高了构建时评类作文写作素材语料库的效率和准确率。

著录项

  • 公开/公告号CN113704464A

    专利类型发明专利

  • 公开/公告日2021-11-26

    原文格式PDF

  • 申请/专利权人 中央民族大学;

    申请/专利号CN202110759991.1

  • 发明设计人 赵小兵;李璐萍;

    申请日2021-07-05

  • 分类号G06F16/35(20190101);G06K9/62(20060101);G06N3/04(20060101);

  • 代理机构11542 北京久诚知识产权代理事务所(特殊普通合伙);

  • 代理人翟丽红

  • 地址 100081 北京市海淀区中关村南大街27号

  • 入库时间 2023-06-19 13:24:42

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号