首页> 中国专利> 一种基于逐步扩展的字母类语系医疗文本关系抽取方法

一种基于逐步扩展的字母类语系医疗文本关系抽取方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

一种基于逐步扩展的字母类语系医疗文本关系抽取方法：(1)将医疗文本划分成句子，识别出句子中的实体；(2)统计每个句子中实体对的频率，将出现频率最高的少量实体对作为种子元组；(3)使用种子元组识别出匹配的五元组，通过特征选择，构建词向量生成五元组向量(4)对五元组向量聚类，选用类中心作为关系模板，抽取出符合该模板表达关系的实体对加入到种子元组中，重复(3)(4)步骤，直到迭代结束。本发明利用医疗文本中实体对上下文的语义特性，构造特征明显、利于聚类的特征向量，使用类中心作为关系模板，反复迭代抽取出医疗文本中的实体关系，算法可以在大量未标注关系的非结构化文本中使用，并保证了较高的精确率和召回率。

著录项

公开/公告号CN108427717A

专利类型发明专利
公开/公告日2018-08-21

原文格式PDF
申请/专利权人北京航空航天大学;
展开▼

申请/专利号CN201810115953.0
发明设计人罗杰;杨云龙;金豪;
展开▼

申请日2018-02-06
分类号
代理机构北京科迪生专利代理有限责任公司;
代理人杨学明
地址 100191 北京市海淀区学院路37号
入库时间 2023-06-19 06:14:36

法律信息

法律状态公告日

法律状态信息

法律状态
2018-09-14

实质审查的生效 IPC(主分类):G06F17/30 申请日:20180206

实质审查的生效
2018-08-21

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 [P] . 中国专利： CN108427717B . 2021.09.03
2. 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 [P] . 中国专利： CN108427717A . 2018-08-21
3. Method for searching a text (or alphanumeric string) database, restructuring and parsing text data (or alphanumeric string), creation/application of a natural language processing engine, and the creation/application of an automated analyzer for the creation of medical reports [P] . US11087885B2 . 2021-08-10

机译：搜索文本（或字母数字字符串）数据库，重组和解析文本数据（或字母数字字符串），创建/应用自然语言处理引擎的方法，以及用于创建医疗报告的自动分析仪的创建/应用程序
4. METHOD FOR SEARCHING A TEXT (OR ALPHANUMERIC STRING) DATABASE, RESTRUCTURING AND PARSING TEXT DATA (OR ALPHANUMERIC STRING), CREATION/APPLICATION OF A NATURAL LANGUAGE PROCESSING ENGINE, AND THE CREATION/APPLICATION OF AN AUTOMATED ANALYZER FOR THE CREATION OF MEDICAL REPORTS [P] . 美国专利： US2020194129A1 . 2020-06-18

机译：搜索文本（或字母字符串）数据库，重建和解析文本数据（或字母字符串），创建/应用自然语言处理引擎以及创建/应用自动分析仪以创建医疗报告的方法
5. Method for searching a text (or alphanumeric string) database, restructuring and parsing text data (or alphanumeric string), creation/application of a natural language processing engine, and the creation/application of an automated analyzer for the creation of medical reports [P] . 美国专利： US10504626B2 . 2019-12-10

机译：用于搜索文本（或字母数字字符串）数据库，重组和解析文本数据（或字母数字字符串），创建/应用自然语言处理引擎以及创建/应用用于创建医疗报告的自动分析器的方法