首页> 中国专利> 结肠癌肝转移精准用药临床数据推算方法和系统

结肠癌肝转移精准用药临床数据推算方法和系统

摘要

本发明提供一种结肠癌肝转移精准用药临床数据推算方法和系统,涉及医疗数据处理技术领域。本发明提供了一种结肠癌肝转移精准用药临床数据推算方法,包括获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化结肠癌肝转移精准用药临床数据推算,针对性强;数据产出结构化,可应用性强。

著录项

  • 公开/公告号CN112712863A

    专利类型发明专利

  • 公开/公告日2021-04-27

    原文格式PDF

  • 申请/专利号CN202110009019.2

  • 申请日2021-01-05

  • 分类号G16H10/20(20180101);G16H10/60(20180101);G16H20/10(20180101);G16H50/70(20180101);G06F16/33(20190101);G06F40/253(20200101);G06F40/295(20200101);G06F40/30(20200101);

  • 代理机构11542 北京久诚知识产权代理事务所(特殊普通合伙);

  • 代理人翟丽红

  • 地址 200433 上海市杨浦区翔殷路800号

  • 入库时间 2023-06-19 10:44:55

说明书

技术领域

本发明涉及医疗数据处理技术领域,具体涉及一种结肠癌肝转移精准用药临床数据推算方法和系统。

背景技术

医生对患者诊疗和治疗过程中产生的数据,包括患者的基本数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据、医疗设备和仪器数据等,以患者为中心,成为医疗数据的主要来源。

目前,针对结肠癌肝转移相关的多维临床试验数据,现有的处理模型涉及文法开发,需要将文法结果和实际应用数据结合做特有化的语义表征关联,但由于当前自然语言中存在海量的文法结构,造成搜索空间巨大,避免生成歧义输出对现有产品是一大挑战。此外,医疗数据存在敏感性,需要二次脱敏处理;医疗结构化数据需求特殊,非定制化处理模型无法满足多机构需求。

然而,医疗大数据蕴藏着丰富的有用信息。如何对结肠癌肝转移相关的多维临床试验数据进行有效挖掘和提炼,从而针对性地对患者用户的病情进行监控,以便于后续的进一步信息推荐,成为当下的热点问题。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供了一种结肠癌肝转移精准用药临床数据推算方法和系统,解决了现有技术无法深层次利用结肠癌肝转移相关的多维临床试验数据的技术问题。

(二)技术方案

为实现以上目的,本发明通过以下技术方案予以实现:

一种结肠癌肝转移精准用药临床数据推算方法,包括:

S1、获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;

S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;

S3、根据所述结果数据集,得到定向需求数据。

优选的,所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。

优选的,所述预处理包括数据清洗、数据向量化。

优选的,所述步骤S2中的自然语言处理模型的构建过程包括:

获取多条结肠癌肝转移精准用药临床试验的原始数据,并确定所述多条结肠癌肝转移精准用药临床试验的原始数据对应的结果数据集,

将所述多条结肠癌肝转移精准用药临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;

基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。

优选的,所述采用深度学习算法进行模型训练包括:

将所述一条原始数据进行实体识别并进行命名,结合语法进行分析、语义分析、标记和重组,重组后形成第一结果数据集。

优选的,所述步骤S3具体包括:根据所述结果数据集,并配合人工修正以后,得到结构化的结肠癌肝转移精准用药临床试验的定向需求数据。

一种结肠癌肝转移精准用药临床数据推算系统,包括:

获取模块,用于获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;

处理模块,用于将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;

输出模块,用于根据所述结果数据集,得到定向需求数据。

优选的,所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。

优选的,所述预处理包括数据清洗、数据向量化。

优选的,所述处理模块中自然语言处理模型的构建过程包括:

获取多条结肠癌肝转移精准用药临床试验的原始数据,并确定所述多条结肠癌肝转移精准用药临床试验的原始数据对应的结果数据集,

将所述多条结肠癌肝转移精准用药临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;

基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。

(三)有益效果

本发明提供了一种结肠癌肝转移精准用药临床数据推算方法和系统。与现有技术相比,具备以下有益效果:

本发明提供了一种结肠癌肝转移精准用药临床数据推算方法,包括获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化结肠癌肝转移精准用药临床数据推算,针对性强;数据产出结构化,可应用性强。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种结肠癌肝转移精准用药临床数据推算方法流程示意图;

图2为本发明实施例提供的结肠癌肝转移相关的多维临床试验数据进行自然语言处理示例图;

图3为本发明实施例提供的一种结肠癌肝转移精准用药临床数据推算系统结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本申请实施例通过提供一种结肠癌肝转移精准用药临床数据推算方法,解决了现有技术无法深层次利用结肠癌肝转移相关的多维临床试验数据的技术问题,实现定制化结肠癌肝转移精准用药临床数据推算,针对性强的有益效果。

本申请实施例中的技术方案为解决上述技术问题,总体思路如下:

本发明实施例提供了一种结肠癌肝转移精准用药临床数据推算方法,包括获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化结肠癌肝转移精准用药临床数据推算,针对性强;数据产出结构化,可应用性强。

为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

如图1所示,本发明实施例提供了一种结肠癌肝转移精准用药临床数据推算方法,包括:

S1、获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;

S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;

S3、根据所述结果数据集,得到定向需求数据。

本发明实施例定制化结肠癌肝转移精准用药临床数据推算,针对性强;数据产出结构化,可应用性强。

实施例1:

第一方面,如图1所示,本发明实施例提供了一种结肠癌肝转移精准用药临床数据推算方法,具体包括:

S1、获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理。

所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。

所述预处理包括数据清洗、数据向量化。

S2、将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集。

所述自然语言处理模型的构建过程包括:

获取多条结肠癌肝转移精准用药临床试验的原始数据,并确定所述多条结肠癌肝转移精准用药临床试验的原始数据对应的结果数据集,

将所述多条结肠癌肝转移精准用药临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;

基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。

所述采用深度学习算法进行模型训练包括:

将所述一条原始数据进行实体识别并进行命名,结合语法进行分析、语义分析、标记和重组,重组后形成第一结果数据集。

如图2所示,将语句实体识别并进行命名:时间性词语命名为NT(时间修饰语)、名词命名为NN(名词性主语或直接宾语)、标点符号命名为PU、形容词命名为VV(连接性状语)、动词命名为VA(动词修饰)。命名完成后,结合语法进行分析、语义分析、标记和重组。如图2中逗号前半句,分解标记后语句构成为:“今日”为NT时间修饰语,“患者”为NN名词性主语,病情同为NN名词性主语,“稳定”为当前语句结束定语VA。分解重组后,形成结果数据集:“今日稳定”、“患者稳定”、“病情稳定”。

S3、根据所述结果数据集,得到定向需求数据。具体包括:

根据所述结果数据集,并配合人工修正以后,得到结构化的结肠癌肝转移精准用药临床试验的定向需求数据。

本发明实施例结合算法模型,对结肠癌肝转移的多维临床试验数据进行关键字/词进行检索,检索过程严格遵照语句模型,通过NLP技术,将自然语言通过命名实体识别、语法分析、语义分析和标注,通过定向提取与实际数据清洗需求相结合,产出有效高质量的数据。此外,系统定制化算法,对已有结肠癌肝转移的多维临床试验数据如【病程】、【查房记录】等自然语言数据进行分析处理,结合语义语境提取出关键字词,如:疾病、病症等。

本发明实施例提供了一种针对结肠癌肝转移精准用药临床数据推算方法,该方法可与web应用系统结合,可以运行于服务器或云服务器。本领域技术人员也可以根据需求将本发明方法运行于其它应用平台,本示例方案中对此不做特殊限定。

实施例2:

第二方面,如图3所示,本发明实施例提供了一种结肠癌肝转移精准用药临床数据推算系统,具体包括:

获取模块,用于获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理。

所述原始数据包括临床试验病历数据表头和源数据,所述原始数据中设置数据识别字段用于数据查重、数据拼接或数据扩容。

所述预处理包括数据清洗、数据向量化。

处理模块,用于将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集。

所述处理模块中自然语言处理模型的构建过程包括:

获取多条结肠癌肝转移精准用药临床试验的原始数据,并确定所述多条结肠癌肝转移精准用药临床试验的原始数据对应的结果数据集,

将所述多条结肠癌肝转移精准用药临床试验的原始数据作为训练样本,将对应的结果数据集作为输出标签,构建训练数据库;

基于所述训练数据库,采用深度学习算法进行模型训练,得到所述自然语言处理模型。

输出模块,用于根据所述结果数据集,得到定向需求数据。

可以理解的是,本发明提供的结肠癌肝转移精准用药临床数据推算系统与本发明提供的结肠癌肝转移精准用药临床数据推算方法相对应,其有关内容的解释、举例和有益效果等部分可以参考结肠癌肝转移精准用药临床数据推算方法中的相应部分,此处不再赘述。

本发明实施例结合算法模型,对结肠癌肝转移的多维临床试验数据进行关键字/词进行检索,检索过程严格遵照语句模型,通过NLP技术,将自然语言通过命名实体识别、语法分析、语义分析和标注,通过定向提取与实际数据清洗需求相结合,产出有效高质量的数据。此外,系统定制化算法,对已有结肠癌肝转移的多维临床试验数据如【病程】、【查房记录】等自然语言数据进行分析处理,结合语义语境提取出关键字词,如:疾病、病症等。

综上所述,与现有技术相比,具备以下有益效果:

1、本发明实施例提供了一种结肠癌肝转移精准用药临床数据推算方法,包括获取结肠癌肝转移精准用药临床试验的原始数据并进行预处理;将所述原始数据输入预先训练好的自然语言处理模型中,得到结果数据集;根据所述结果数据集,得到定向需求数据。定制化结肠癌肝转移精准用药临床数据推算,针对性强;数据产出结构化,可应用性强。

2、本发明实施例结合算法模型,对结肠癌肝转移的多维临床试验数据进行关键字/词进行检索,检索过程严格遵照语句模型,通过NLP技术,将自然语言通过命名实体识别、语法分析、语义分析和标注,通过定向提取与实际数据清洗需求相结合,产出有效高质量的数据。此外,系统定制化算法,对已有结肠癌肝转移的多维临床试验数据如【病程】、【查房记录】等自然语言数据进行分析处理,结合语义语境提取出关键字词,如:疾病、病症等。

需要说明的是,在本文中术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号