首页> 中国专利> 一种基于众包的人类行为文本数据集的构造以及处理方法

一种基于众包的人类行为文本数据集的构造以及处理方法

摘要

本发明公开了一种基于众包的人类行为文本数据集的构造以及处理方法,首先,确定需要收集的主题对象,依据具体的要求生成任务并发布于众包平台,获得设定主题下所有可能发生的人类示例的文本数据集;对于同一个行为或事件的文本经过不同人的撰写会表现在多个句子,因此需要把描述同一事件的不同句子聚类在一起,因此,对于获取的数据集采用聚类的方式将本属于同一行为的不同文本表现聚为一类;采用关联分析技术挖掘出行为之间存在的先后关系结构;采用互信息技术学习出行为之间存在的互斥关系结构,并将人类行为存在的各种关系构造成一个情节图,即表明在某种情况下会发生什么事件,并限制其发生的方式,提高对人类行为的分析的准确性。

著录项

  • 公开/公告号CN113407716A

    专利类型发明专利

  • 公开/公告日2021-09-17

    原文格式PDF

  • 申请/专利权人 桂林电子科技大学;暨南大学;

    申请/专利号CN202110529477.9

  • 申请日2021-05-14

  • 分类号G06F16/35(20190101);G06K9/62(20060101);

  • 代理机构45134 桂林文必达专利代理事务所(特殊普通合伙);

  • 代理人张学平

  • 地址 541004 广西壮族自治区桂林市七星区金鸡路1号

  • 入库时间 2023-06-19 12:37:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-19

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号