首页> 中国专利> 一种新媒体环境下少数民族主题数据的抽取方法

一种新媒体环境下少数民族主题数据的抽取方法

摘要

本发明公开了一种从新媒体平台获取数据、对少数民族主题数据进行抽取的方法,根据新媒体数据海量、非结构化、多主题等特点,采用LDA模型对预处理后的新媒体数据进行特征抽取、主题分析、隐含主题挖掘,然后利用少数民族领域知识构建KG,用领域KG引导少数民族主题数据的抽取。本发明在采用LDA模型和KG引导数据的抽取过程中,根据不同数据规模设定参数,从而进行算法的优化,实现准确、高效、可扩展的新媒体数据抽取。

著录项

  • 公开/公告号CN109241273B

    专利类型发明专利

  • 公开/公告日2022-02-18

    原文格式PDF

  • 申请/专利权人 云南大学;

    申请/专利号CN201810969312.1

  • 申请日2018-08-23

  • 分类号G06F16/34(20190101);G06F16/36(20190101);

  • 代理机构53207 云南凌云律师事务所;

  • 代理人董建国

  • 地址 650500 云南省昆明市呈贡区云南大学信息学院

  • 入库时间 2022-08-23 13:08:19

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号