首页> 中国专利> 提取社交媒体短文本中重要时间片段的方法

提取社交媒体短文本中重要时间片段的方法

摘要

本发明公开了一种提取社交媒体短文本中重要时间片段的方法,将文本进行时间上的划分;通过动态主题模型提取出社交媒体短文本中的主题词序列,寻找每一个主题词热度排名变化的单调区间后,将趋势相反但属于波动的单调区间或趋势相同但变化幅度较小的单调区间合并,对所有的主题词的合并后的单调区间序列按顺序取交集,计算每个交集的混乱度,排名后得到若干个从主题演变角度确定的重要时间片段;利用朴素贝叶斯分类器对划分时间段后的每条文本进行情感分析,通过情感变化幅度及阈值确定每种情感的重要时间片段取并集;计算并集里的混乱度,排名后得到若干个从情感转换角度确定的重要时间片段;对上述从两个角度确定的重要时间片段取交集即为所得。

著录项

  • 公开/公告号CN112182187A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利权人 天津大学;

    申请/专利号CN202011065511.3

  • 发明设计人 席德伟;张怡;

    申请日2020-09-30

  • 分类号G06F16/332(20190101);G06F16/33(20190101);G06F16/35(20190101);G06F16/9536(20190101);G06K9/62(20060101);

  • 代理机构12201 天津市北洋有限责任专利代理事务所;

  • 代理人李丽萍

  • 地址 300072 天津市南开区卫津路92号

  • 入库时间 2023-06-19 09:27:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-02

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号