首页> 中国专利> 一种基于遗传算法的自动标注方法

一种基于遗传算法的自动标注方法

摘要

本发明提供了一种基于遗传算法的自动标注方法,包括依次执行以下步骤:步骤1,预处理:获取评论,从评论中删除长度小于两个单词的评论和所有非字母数字字符,然后取小写字母,在标记化后剔除存在于NLTK语料库中的终止词,接下来,将单词简化为词根形式;步骤2,主题建模:采用LDA主题建模方法,给定一个评论列表R={r1,r2,…,rn},获得相应的词汇D={ω1,ω2,...,ωd},话题β={β1,β2,...,βk};步骤3,基于遗传算法的主题标注:设计适合该主题标注场景的染色体结构、适应度参数以及遗传算子。本发明的有益效果是:利于开发者和用户了解应用评论。

著录项

  • 公开/公告号CN112988981B

    专利类型发明专利

  • 公开/公告日2021-10-15

    原文格式PDF

  • 申请/专利号CN202110525248.X

  • 发明设计人 高翠芸;王轩;徐增林;臧婧雅;

    申请日2021-05-14

  • 分类号G06F16/33(20190101);G06F16/31(20190101);G06N3/12(20060101);

  • 代理机构44451 深圳市添源知识产权代理事务所(普通合伙);

  • 代理人于标

  • 地址 518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区

  • 入库时间 2022-08-23 12:36:44

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号