首页> 中国专利> 一种行政处罚决定书的信息抽取方法

一种行政处罚决定书的信息抽取方法

摘要

本发明涉及一种行政处罚决定书的信息抽取方法,包括:步骤一:从行政处罚文书网爬取获取各省的行政处罚决定书;步骤二:提取html标签内步骤一中获取的行政处罚决定书的文本内容,构建原始数据集;步骤三:根据行政处罚决定书书写的规范性规则,利用正则表达式对待处理的行政处罚决定书进行数据预处理,构建数据集;步骤四:将步骤三构建的数据集输入利用步骤二构建的原始数据集训练好的信息抽取模块,输出行政处罚文书信息抽取结果。本发明提出一种对行政处罚决定书的信息抽取的方法,可以精确的获得决定书的结构化信息,便于对行政处罚决定书的理解以及类案检索、类案推荐、判决预测等下游任务的实施。

著录项

  • 公开/公告号CN113918706A

    专利类型发明专利

  • 公开/公告日2022-01-11

    原文格式PDF

  • 申请/专利权人 山东大学;

    申请/专利号CN202111201811.4

  • 发明设计人 李玉军;赵思文;贲晛烨;胡伟凤;

    申请日2021-10-15

  • 分类号G06F16/335(20190101);G06F16/35(20190101);G06F16/951(20190101);G06F40/205(20200101);G06N3/04(20060101);G06N3/08(20060101);G06N5/04(20060101);

  • 代理机构37219 济南金迪知识产权代理有限公司;

  • 代理人杨树云

  • 地址 250199 山东省济南市历城区山大南路27号

  • 入库时间 2023-06-19 13:51:08

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号