首页> 中国专利> 一种面向法院电子卷宗的案情信息自动抽取方法

一种面向法院电子卷宗的案情信息自动抽取方法

摘要

本发明公开了一种面向法院电子卷宗的案情信息自动抽取方法,该方法包括:创建案情信息抽取框架,对各类案件电子卷宗文件中案情要素进行统计分析,构建基本案情本体;根据案情本体和电子卷宗文件版面特点,定制基本案情信息抽取策略;基于XML的跨领域信息抽取工具TZIE,构建案情信息抽取框架;基于多粒度语义的法律文书构建NER模型及训练,多粒度语义单元的结合方式,采用Word2vec的Skip‑gram模型和LDA主题模型,分别训练得到司法领域词向量模型和字向量模型,结合BiLSTM‑Attention‑CRF模型的领域实体识别,在基准模型BiLSTM‑CRF中增加了Attentio机制,预测每个语义单元属于不同标签的概率,辅助优化的模型训练方式,以人工标注语料训练模型作为主任务,以人工和自动标注语料训练模型作为辅助任务。

著录项

  • 公开/公告号CN112417880A

    专利类型发明专利

  • 公开/公告日2021-02-26

    原文格式PDF

  • 申请/专利权人 太极计算机股份有限公司;

    申请/专利号CN202011369142.7

  • 发明设计人 万玉晴;王霄;

    申请日2020-11-30

  • 分类号G06F40/295(20200101);G06F40/216(20200101);G06F40/242(20200101);G06F40/30(20200101);G06F16/335(20190101);G06Q50/18(20120101);

  • 代理机构11210 北京纽乐康知识产权代理事务所(普通合伙);

  • 代理人唐忠庆

  • 地址 100102 北京市朝阳区容达路7号中国电科太极信息产业园

  • 入库时间 2023-06-19 10:00:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-23

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号