首页> 中国专利> 基于文本聚类的线上课堂讨论短文本即时分组方法及系统

基于文本聚类的线上课堂讨论短文本即时分组方法及系统

摘要

本发明公开基于文本聚类的线上课堂讨论短文本即时分组方法及系统。该方法包括:对文本数据进行分词预处理和停用词预处理;获取各文本项关键词,统计存储于关键词表keyTable;对预处理后的文本集,进行频繁项集挖掘,过滤各子项准频繁项集,结合关键词表定义准频繁项集相似度计算规则,粗归簇;将各簇最靠近簇心的点逆映射到文本集,计算各簇内文本词集TF‑IDF值,按距离迭代更新质心至最优;将获取的K个簇,即时分组推送。本发明采用的结合关键词表定义准频繁项集相似度计算规则有效提高线上讨论短文本聚类准确度;采用准频繁项集过滤策略有效提高归簇效率,加速聚类方法;把线上课堂讨论过的文本信息内容,自动归纳成多个主题,并把文本内容按主题分组。

著录项

  • 公开/公告号CN107862070A

    专利类型发明专利

  • 公开/公告日2018-03-30

    原文格式PDF

  • 申请/专利权人 华南理工大学;

    申请/专利号CN201711170964.0

  • 发明设计人 陆以勤;夏儒斐;黄国洪;

    申请日2017-11-22

  • 分类号G06F17/30(20060101);G06F17/27(20060101);

  • 代理机构44102 广州粤高专利商标代理有限公司;

  • 代理人何淑珍

  • 地址 511458 广东省广州市南沙区环市大道南路25号华工大广州产研院

  • 入库时间 2023-06-19 04:56:43

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-24

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20171122

    实质审查的生效

  • 2018-03-30

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号