首页> 中国专利> 基于分布式网络爬虫与NLP的资本市场舆情监测方法

基于分布式网络爬虫与NLP的资本市场舆情监测方法

摘要

本发明公开一种基于分布式网络爬虫与NLP的资本市场舆情监测方法,包括基于云服务器的分布式爬虫模块和金融文本NLP分析系统;基于云服务器的分布式爬虫,实现多进程、周期更新的公开信息抓取,并可根据使用需求快速调整系统规模;构建金融分词库、正负情感词库,通过混合样本检验、模糊聚类等算法在语料库构建过程中降低了人工标注的成本,基于监督学习算法计算文本的正、负情感倾向概率,并采用自编码器算法合成情绪指数,提高了情感判断的准确率;本发明的分布式的架构避免单一节点故障造成的系统崩溃,重构的金融情感词库与文本分析算法提升了情绪指数的效度,动态反映市场情绪,为使用者提供实时的资本市场数据。

著录项

  • 公开/公告号CN112115331B

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利权人 朱彤;

    申请/专利号CN202010998668.5

  • 发明设计人 朱彤;

    申请日2020-09-21

  • 分类号G06F16/951(20190101);G06F16/35(20190101);G06F40/284(20200101);G06F40/289(20200101);G06F40/237(20200101);G06K9/62(20060101);G06N3/08(20060101);

  • 代理机构32274 南京申云知识产权代理事务所(普通合伙);

  • 代理人田沛沛;邱兴天

  • 地址 100871 北京市海淀区和园路5号北京大学

  • 入库时间 2022-08-23 11:43:34

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号