首页> 中文期刊>第四纪研究 >基于机器学习的历史气候重建论文智能识别与数据挖掘初探

基于机器学习的历史气候重建论文智能识别与数据挖掘初探

     

摘要

本文基于机器学习方法开展了从海量的气候变化研究论文中智能识别历史气候重建论文,并提取关键信息的技术研究.首先以人工标注的1450篇古气候重建论文摘要作为样本数据,对机器学习中常见的9种分类模型进行训练和精度检验,发现极端随机树模型在此类文本中具有较高的分类精度;其次,利用这一模型对ResearchGate中70万余篇气候变化相关的论文摘要进行智能分类,从中筛选出6039篇千年尺度气候重建论文摘要,并根据词云图验证了分类结果的可靠性.在此基础上,采用命名实体识别技术对6039篇论文摘要,从重建气候要素、代用资料类型和目标地区(国家)这3个维度开展了文本数据挖掘.挖掘结果表明:温度和降水是两大主要的重建要素,树轮、历史文献、沉积(含孢粉)是位居前三位的主要代用资料,这与领域专家经验基本一致;同时,重建气候要素与代用资料类型及二者的组合规律呈现鲜明的地理差异,这与区域气候特征密切相关.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号