首页> 中国专利> 一种基于区块链的医疗人工智能模型训练系统及方法

一种基于区块链的医疗人工智能模型训练系统及方法

摘要

本发明涉及一种基于区块链的医疗人工智能模型训练系统,包括:模型分发模块、参数收集模块、模型训练模块、模型同步模块、区块链基础设施、医疗人工智能模型库、用户信息库、模型更新过程库以及模型发布模块。本发明中的上述系统能够打通各医疗机构的数据孤岛,并降低各医疗机构私有数据泄露的风险。系统中只传递模型及参数,因此可在私有数据保护的情况下,让人工智能模型在更多的数据样本下学习,提高模型准确率与泛化能力。此外,在系统中模型训练更新过程可追溯,从而实现模型的安全、可信与可控。

著录项

说明书

技术领域

本发明涉及人工智能模型训练领域,特别是涉及一种基于区块链的医疗人工智能模型训练系统及方法。

背景技术

区块链是利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。去中心化的区块链技术,能够给用户提供无需第三方信任的多点交易,并能更高层次上保护用户的隐私。信任体系是区块链网络中重要的一部分,能够让用户放心地将数字资产上链,不可篡改的区块链特性更稳固了信任体系。

人工智能(深度学习)模型有别于传统统计学习模型,具有更庞大的参数量和更强的泛化能力。模型参数往往不是通过参数估计方法求出解析解,而是由数据驱动,将参数的估计转化为一个求解最优化的问题,通过梯度优化算法调整参数,最小化损失函数,从而训练模型。

人工智能模型训练需多次迭代、更新参数,实验表明这种策略可以让模型学习到更多、更有效的特征。但由于训练过程由数据驱动,这就意味着训练过程需要有大量、高质量且多样化的数据集作为支撑,在有监督学习问题中还需要对数据有相应的标注,收集这样的数据往往需要很高的成本。得益于大数据技术、众包技术的发展,以上数据方面的问题已经得到较好的解决,因此人工智能模型在许多领域都有很好的表现并赋能给各行各业。

但是在医疗行业,情况有所不同。首先,医疗数据具有隐私性、敏感性,这些数据往往封闭地储存在各家医院的信息系统中,不方便共享,于是每一个医院都形成了“数据孤岛”;其次,许多医疗数据的标注需要有较强的专业知识,标注成本往往会比普通数据更高;第三,医疗领域还对模型的准确性有较高的要求,这是因为漏检、误检代价巨大,如何让AI模型辅助医生进行诊疗,实现医疗人工智能模型真正落地应用是值得深入研究的问题。

近几年来,国内外学术界及工业界对区块链给予了高度关注,但将区块链应用于医疗人工智能模型训练的研究较少,特别是如何利用区块链技术打通数据孤岛,在私有数据保护的基础上让模型学习到更多的数据样本,提升模型准确率与泛化能力,并且让模型更安全、更可信、更可控。

发明内容

本发明的目的是提供一种基于区块链的医疗人工智能模型训练系统及方法,通过基于区块链技术中去中心化、不可篡改、定向授权等特性,打通各医疗机构的数据孤岛,在不泄露私有数据的情况下,让人工智能模型在更多的数据样本下学习,提高模型准确率与泛化能力,并且使模型训练更新过程可追溯,从而实现模型安全、可信与可控。为实现上述目的,本发明提供了如下方案:

一种基于区块链的医疗人工智能模型训练系统,所述系统包括:

模型分发模块1、参数收集模块2、模型训练模块3、模型同步模块4、区块链基础设施5、医疗人工智能模型库6、用户信息库7、模型更新过程库8以及模型发布模块9;

所述模型分发模块1与所述模型训练模块3连接;所述参数收集模块2与所述模型训练模块3连接;所述模型训练模块3与所述模型同步模块4连接;所述模型同步模块4与所述区块链基础设施5连接;所述区块链基础设施5分别与所述医疗人工智能模型库6、用户信息库7和模型更新过程库8连接;所述模型发布模块9与所述区块链基础设施5连接;

所述模型发布模块9用于人工智能企业上传基于现有医疗数据所训练的人工智能基线算法模型及其模型参数;

所述模型分发模块1用于对发起模型训练请求的医疗机构定向分发所指定的人工智能模型;

所述参数收集模块2用于接收医疗机构提交利用私有医疗数据所训练完成的人工智能模型参数;

所述模型训练模块3用于接收医疗机构进行人工智能模型训练的请求;向所述模型分发模块1提供医疗机构所指定训练的人工智能模型、接收所述参数收集模块2所收集的人工智能模型参数,还用于通知其他医疗机构依据评价策略评价新模型参数是否能够提高人工智能模型在其测试集上的准确率;

所述区块链基础设施5用于提供医疗人工智能训练模型系统应用层及数据库交互的系统底层架构;

所述模型同步模块4用于获取所述区块链基础设施5所存储的最新算法模型及对应模型参数,并向所述模型训练模块3提供最优算法模型及对应模型参数;

所述医疗人工智能模型库6用于存储各类医疗人工智能模型,以及模型对应的当前最优模型参数;

所述用户信息库7用于存储各个医疗机构的机构注册数据;

所述模型更新过程库8用于存储被系统接受的所有模型参数历史数据,根据用户需求任意溯源到某个指定阶段的算法模型所对应的模型参数。

可选的,所述模型训练模块3中,所述评价策略为决定模型参数是否能够更新到所述医疗人工智能模型库6中的准则,评价过程由系统中除模型参数提交医疗机构之外的所有医疗机构执行;所述评价策略具体包括:运用新模型参数的算法模型在所述医疗机构测试集中的准确率是否达到准确率阈值;以及支持更新的医疗机构数量在所有评价医疗机构中的占比是否达到预期值。

可选的,所述模型发布模块9中,所述人工智能企业为系统内所有医疗机构提供人工智能基线算法模型及模型参数的企业,用于根据医疗机构不同种类的医疗数据提供不同的人工智能模型,并维护人工智能模型。

可选的,所述模型分发模块1中,所述医疗机构为具备人工智能模型训练基本算力,并且存有私有的医疗数据能够为人工智能模型提供训练样本的组织机构,所述医疗机构用于为整个系统中模型训练及参数更新提供支持,且能够使用系统内的模型对新增的医疗数据进行辅助诊断。

本发明另外提供一种基于区块链的医疗人工智能模型训练方法,所述方法应用于上述的基于区块链的医疗人工智能模型训练系统,所述方法包括:

步骤一:人工智能企业通过模型发布模块9发布人工智能基线算法模型及模型参数;

步骤二:人工智能模型通过区块链基础设施5将人工智能基线算法模型及模型参数存储至医疗人工智能模型库6;

步骤三:所述区块链基础设施5创建模型初始记录,并将所述初始记录存储至模型更新过程库8;

步骤四:医疗机构通过模型训练模块3发起训练人工智能模型请求;

步骤五:所述模型训练模块3通知模型同步模块4进行模型同步;

步骤六:所述模型同步模块4判断医疗机构现有模型是否为当前系统中最新的版本;若当前模型为最新版本,执行步骤九;若当前模型非最新版本,执行步骤七;

步骤七:所述模型同步模块4通过所述区块链基础设施5,从所述医疗人工智能模型库6获取最新的算法模型及其对应的模型参数;

步骤八:所述模型训练模块3将最新的算法模型及其对应的模型参数通过所述模型分发模块1分发给请求训练的医疗机构;

步骤九:医疗机构使用自身医疗数据对算法模型进行训练,得出训练完成后的模型参数;

步骤十:医疗机构通过参数收集模块2上传训练完成的算法模型所对应的模型参数;

步骤十一:所述模型训练模块3评价医疗机构所上传的模型参数调整后的算法模型是否优于所述医疗人工智能模型库6中的算法模型;若优于医疗人工智能模型库中的算法模型,执行步骤十二;若不优于医疗人工智能模型库中的算法模型,不作后续操作;

步骤十二:所述区块链基础设施5将算法模型及模型参数存储于所述医疗人工智能模型库6;

步骤十三:所述区块链基础设施5在所述模型更新过程库8中记录模型参数更新过程记录。

可选的,所述步骤十一中,模型训练模块3评价医疗机构所上传的模型参数调整后的算法模型是否优于所述医疗人工智能模型库6中的算法模型具体包括以下步骤:

步骤A1:各医疗机构分别获取新上传的算法模型以及其模型参数,使用医疗机构自身私有的医疗数据测试集进行准确率验证,得出使用该的模型在当前测试集下的准确率;

步骤A2:各医疗机构分别依据评价策略中的准确率阈值,判定准确率是否高于阈值,若高于阈值,则在评价事务中签名;若低于阈值,则不予以签名;

步骤A3:各医疗机构提交是否签名的评价事务结果,系统收集所有医疗机构所提交的结果,依据评价策略中的签名通过占比率,判定新模型参数的人工智能模型是否优于医疗人工智能模型库中的算法模型:若签名通过占比率高于预期值,则返回优于结果;若签名通过占比率不高于预期值,则返回不优于结果;

步骤A4:若步骤A3判断新模型参数的人工智能模型优于医疗人工智能模型库中的算法模型,则系统选取各签名医疗机构中测试准确率最低的值作为新的准确率阈值,系统更新评价策略的准确率阈值。

可选的,所述步骤九中,所述对算法模型进行训练在医疗机构本地进行,无需上传医疗数据。

可选的,各医疗机构独立多次运行步骤四到步骤十三。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明通过利用区块链技术,实现了一种医疗人工智能模型训练系统,该系统的优点是:利用区块链技术打通数据孤岛,能够让模型学习到多个医疗机构更多的数据样本,提高模型的准确率和泛化能力。同时,由于所有的模型训练在医疗机构本地进行,无需上传医疗数据,因此可以更好地保护数据安全和数据隐私。利用区块链技术来存储算法模型及其参数,使得模型训练更新的过程可追溯,模型更可信、更安全。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例基于区块链的医疗人工智能模型训练系统的结构示意图;

图2为本发明实施例基于区块链的医疗人工智能模型训练方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于区块链的医疗人工智能模型训练系统及方法,通过基于区块链技术中去中心化、不可篡改、定向授权等特性,打通各医疗机构的数据孤岛,在不泄露私有数据的情况下,让人工智能模型在更多的数据样本下学习,提高模型准确率与泛化能力,并且使模型训练更新过程可追溯,从而实现模型安全、可信与可控。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明提出了一种基于区块链的医疗人工智能模型训练系统及其实现方法,通过基于区块链技术中去中心化、不可篡改、定向授权等特性,降低隐私信息泄露的可能性,提高数据的可靠性,解决了隐私数据保护的难题;在私有医疗数据隐私保护的情况下,只在系统中传递模型及参数,实现了多机构医疗数据的价值传递及数据使用的可追溯性,模型参数融合后使得训练后的模型具有更好的泛化能力;利用区块链数据溯源的特性,自动选择当前最优模型参数进行进一步训练,不断提高模型辅助诊断的准确率。

如图1所示,图1为本发明实施例基于区块链的医疗人工智能模型训练系统的结构示意图,所述系统包括:

模型分发模块1、参数收集模块2、模型训练模块3、模型同步模块4、区块链基础设施5、医疗人工智能模型库6、用户信息库7、模型更新过程库8以及模型发布模块9;

所述模型分发模块1与所述模型训练模块3连接;所述参数收集模块2与所述模型训练模块3连接;所述模型训练模块3与所述模型同步模块4连接;所述模型同步模块4与所述区块链基础设施5连接;所述区块链基础设施5分别与所述医疗人工智能模型库6、用户信息库7和模型更新过程库8连接;所述模型发布模块9与所述区块链基础设施5连接;

所述模型发布模块9用于人工智能企业上传基于现有医疗数据所训练的人工智能基线算法模型及其模型参数;

所述模型分发模块1用于对发起模型训练请求的医疗机构定向分发所指定的人工智能模型;

所述参数收集模块2用于接收医疗机构提交利用私有医疗数据所训练完成的人工智能模型参数;

所述模型训练模块3用于接收医疗机构进行人工智能模型训练的请求;向所述模型分发模块1提供医疗机构所指定训练的人工智能模型、接收所述参数收集模块2所收集的人工智能模型参数,还用于通知其他医疗机构依据评价策略评价新模型参数是否能够提高人工智能模型在其测试集上的准确率;

所述区块链基础设施5用于提供医疗人工智能训练模型系统应用层及数据库交互的系统底层架构;

所述模型同步模块4用于获取所述区块链基础设施5所存储的最新算法模型及对应模型参数,并向所述模型训练模块3提供最优算法模型及对应模型参数;

所述医疗人工智能模型库6用于存储各类医疗人工智能模型,以及模型对应的当前最优模型参数;

所述用户信息库7用于存储各个医疗机构的机构注册数据;

所述模型更新过程库8用于存储被系统接受的所有模型参数历史数据,根据用户需求任意溯源到某个指定阶段的算法模型所对应的模型参数。

具体的,所述模型训练模块3中,所述评价策略为决定模型参数是否能够更新到所述医疗人工智能模型库6中的准则,评价过程由系统中除模型参数提交医疗机构之外的所有医疗机构执行;所述评价策略具体包括:运用新模型参数的算法模型在所述医疗机构测试集中的准确率是否达到准确率阈值;以及支持更新的医疗机构数量在所有评价医疗机构中的占比是否达到预期值。

具体的,所述模型发布模块9中,所述人工智能企业为系统内所有医疗机构提供人工智能基线算法模型及模型参数的企业,用于根据医疗机构不同种类的医疗数据提供不同的人工智能模型,并维护人工智能模型。

具体的,所述模型分发模块1中,所述医疗机构为具备人工智能模型训练基本算力,并且存有私有的医疗数据能够为人工智能模型提供训练样本的组织机构,所述医疗机构用于为整个系统中模型训练及参数更新提供支持,且能够使用系统内的模型对新增的医疗数据进行辅助诊断。

本发明提出了一种基于区块链的医疗人工智能模型训练系统及其实现方法,通过全部加入到系统中的医疗机构进行模型参数的评价,并通过评价策略进行系统级控制,可有效防止某个医疗机构的作恶或数据投毒等问题。

此外,本发明中的上述系统能够打通各医疗机构的数据孤岛,并降低各医疗机构私有数据泄露的风险。系统中只传递模型及参数,因此可在私有数据保护的情况下,让人工智能模型在更多的数据样本下学习,提高模型准确率与泛化能力。此外,在系统中模型训练更新过程可追溯,从而实现模型的安全、可信与可控。

如图2所示,图2为本发明实施例基于区块链的医疗人工智能模型训练方法流程图,所述方法包括:

步骤一:人工智能企业通过模型发布模块9发布人工智能基线算法模型及模型参数。

步骤二:人工智能模型通过区块链基础设施5将人工智能基线算法模型及模型参数存储至医疗人工智能模型库6。

步骤三:所述区块链基础设施5创建模型初始记录,并将所述初始记录存储至模型更新过程库8。

步骤四:医疗机构通过模型训练模块3发起训练人工智能模型请求。

步骤五:所述模型训练模块3通知模型同步模块4进行模型同步。

步骤六:所述模型同步模块4判断医疗机构现有模型是否为当前系统中最新的版本;若当前模型为最新版本,执行步骤九;若当前模型非最新版本,执行步骤七。

步骤七:所述模型同步模块4通过所述区块链基础设施5,从所述医疗人工智能模型库6获取最新的算法模型及其对应的模型参数。

步骤八:所述模型训练模块3将最新的算法模型及其对应的模型参数通过所述模型分发模块1分发给请求训练的医疗机构。

步骤九:医疗机构使用自身医疗数据对算法模型进行训练,得出训练完成后的模型参数。

具体的,所述对算法模型进行训练在医疗机构本地进行,无需上传医疗数据,系统中仅存储模型参数。

步骤十:医疗机构通过参数收集模块2上传训练完成的算法模型所对应的模型参数。

步骤十一:所述模型训练模块3评价医疗机构所上传的模型参数调整后的算法模型是否优于所述医疗人工智能模型库6中的算法模型;若优于医疗人工智能模型库中的算法模型,执行步骤十二;若不优于医疗人工智能模型库中的算法模型,不作后续操作。

具体的,模型训练模块3评价医疗机构所上传的模型参数调整后的算法模型是否优于所述医疗人工智能模型库6中的算法模型具体包括以下步骤:

步骤A1:各医疗机构分别获取新上传的算法模型以及其模型参数,使用医疗机构自身私有的医疗数据测试集进行准确率验证,得出使用该的模型在当前测试集下的准确率;

步骤A2:各医疗机构分别依据评价策略中的准确率阈值,判定准确率是否高于阈值,若高于阈值,则在评价事务中签名;若低于阈值,则不予以签名;

步骤A3:各医疗机构提交是否签名的评价事务结果,系统收集所有医疗机构所提交的结果,依据评价策略中的签名通过占比率,判定新模型参数的人工智能模型是否优于医疗人工智能模型库中的算法模型:若签名通过占比率高于预期值,则返回优于结果;若签名通过占比率不高于预期值,则返回不优于结果;

步骤A4:若步骤A3判断新模型参数的人工智能模型优于医疗人工智能模型库中的算法模型,则系统选取各签名医疗机构中测试准确率最低的值作为新的准确率阈值,系统更新评价策略的准确率阈值。

步骤十二:所述区块链基础设施5将算法模型及模型参数存储于所述医疗人工智能模型库6。

步骤十三:所述区块链基础设施5在所述模型更新过程库8中记录模型参数更新过程记录。

具体的,本发明中的上述方法各医疗机构可独立多次运行步骤四到步骤十三,能够使得模型在更广泛的训练数据上获得更优的参数及更好的泛化能力。

实施例1:医疗人工智能模型训练系统的模型发布操作

人工智能企业C

实施例2:医疗人工智能模型训练系统的模型训练操作

医疗机构联盟U中的医疗机构H

以上所述仅为本发明的较佳实施例,并非用来限定本发明的实施范围。任何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种变动与润饰,本发明保护范围应以权利要求书所界定的保护范围为准。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号