法律状态公告日
法律状态信息
法律状态
2020-08-04
授权
授权
2018-09-04
实质审查的生效 IPC(主分类):G16H50/00 申请日:20180208
实质审查的生效
2018-08-10
公开
公开
技术领域
本发明涉及医疗大数据检测技术领域,具体地说是一种病案首页数据质量检测方法及系统。
背景技术
自卫计委要求各医院上报病案首页数据以来,病案首页数据质量就受到极大的关注,而目前病案首页数据存在着以下三个问题:医院通过人工方式核对病案首页数据,这种方式效率低下且很难识全面的识别出错误数据和不规范数据;医院现有的技术条件不能对本院的病案首页数据有一个整体的认识,无法得知本院错误数据的分布情况;医院之间彼此互不交流,病案数据处在信息孤岛中,无法反映出本院数据在全国范围内的水平。
发明内容
本发明实施例中提供了一种病案首页数据质量检测方法及系统,以解决现有技术中的核对病案首页数据效率低、无法对本院错误数据的分布情况有整体认识、病案数据无法反映在全国范围内的水平的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
本发明第一方面提供了一种病案首页数据质量检测方法,该方法包括以下步骤:
将数据导入数据库;
对导入的数据进行检测。
结合第一方面,在第一方面第一种可能的实现方式中,将数据导入数据库具体包括以下步骤:
采集医院上报的文件,将文件转化成统一格式;
将转化好的文件按照一定的分类规则存放在相应的目录中;
根据导入的数据文件为该医院生成数据库,并将数据文件的信息导入到相应的表中;
创建该医院的临时表,并将数据文件的信息导入到相应的临时表中。
结合第一方面,在第一方面第二种可能的实现方式中,所述的分类规则包括:每类医院目录下存放该医院各个年度的目录,各个年度目录下存放各个季度的目录,各个季度目录下存放医院该季度的数据文件和字典表目录,字典表目录下存放各个字典表文件目录,各个字典表文件目录下存放各个字典表文件。
结合第一方面,在第一方面第三种可能的实现方式中,在将数据导入数据库之后还包括以下步骤:
对数据进行标准化处理;
对标准化后的字段进行预处理。
结合第一方面,在第一方面第四种可能的实现方式中,所述对数据进行标准化处理包括:通过标准化字典对字段进行映射,具体包括以下步骤:
从医院对应的数据库的字段映射表中获取前232个字段;
将获取的前232个字段与标准的232个字段进行匹配,在匹配时转换为大写;
如果匹配成功,则将匹配后的数据导入到标准模板表中;如果存在不匹配的字段,则将该字段导入到字段映射表中并终止该医院后续的质检流程。
结合第一方面,在第一方面第五种可能的实现方式中,所述标准的232个字段包括卫统4-1标准232个字段。
结合第一方面,在第一方面第六种可能的实现方式中,所述对标准化后的字段进行预处理包括对代码进行标准化处理和对格式进行规范化处理。
结合第一方面,在第一方面第七种可能的实现方式中,对代码进行标准化处理的方法具体包括:根据代码表的映射关系将相应字段的本院代码转换为标准代码;
对格式进行规范化处理的方法具体包括:获取数据库中232个字段的数据格式;根据数据格式将nvarchar数据类型的字段转换为相应类型的字段,如果转换失败,则设置为空。
结合第一方面,在第一方面第八种可能的实现方式中,所述标准代码与本院代码为一对多的关系,具体为:本院代码为空或多个值,对应的标准代码为确定值;
所述的数据格式包括string、double、datetime、int。
结合第一方面,在第一方面第九种可能的实现方式中,在将相应字段的本院代码转换为标准代码时还需读取本院代码表;在读取本院代码表时,根据逗号自动将本院代码进行分组。
结合第一方面,在第一方面第十种可能的实现方式中,对导入的数据进行检测包括数据检测和质量检测。
结合第一方面,在第一方面第十一种可能的实现方式中,所述的数据检测具体包括以下步骤:
将诊断信息与手术及操作信息从病案首页标数据中分离至单独的表中;
更新诊断信息、手术及操作信息、病案属性表中的数据,准备为后期统计使用;
统计各月记录数;
将本院疾病字典表和手术及操作字典表与标准字典表进行匹配,统计匹配率。
结合第一方面,在第一方面第十二种可能的实现方式中,所述的质量检测包括根据质检规则对病案首页数据字段进行检测,并将检测结果保存在数据库中,具体包括以下步骤:
遍历所有的质检规则;
根据每一项质检规则中所涉及的病案首页内容,将病案首页内容从数据表中提取出来;
根据质检规则,判断病案首页内容是否合法。
结合第一方面,在第一方面第十三种可能的实现方式中,根据质检规则对病案首页数据字段进行检测具体包括检测数据的完整性、检测数据的标准性、检测数据的规范性;
所述的检测完整性包括检测病案首页数据填写的完整率,包括检测必填字段完整性,检测非必填字段完整性和检测组合字段完整性;
所述的检测标准性包括检测各代码的使用率、标准诊疗科目名录与本院出院科室代码匹配情况、本院疾病字典表版本匹配情况和本院手术与操作字典表版本匹配情况;
所述的检测规范性包括检测单个字段规范性、检测合字段编码逻辑、检测组合字段费用逻辑、检测组合字段时间逻辑。
结合第一方面,在第一方面第十四种可能的实现方式中,所述的检测结果包括检测结果报告和问题明细表;
所述的质量检测结果报告为整体的质量检测结果,包括质检规则的各项指标、相应问题链;所述的问题链接可链接到接到相应的问题明细表;
所述的问题明细表按照质检结果项分布,每个问题明细表均包含一个结果项记录的问题数据;问题明细表按照病案号、出生日期、入院时间和问题字段进行存储;病案号、出生日期和入院时间用来定位病案首页数据,问题字段为问题字段的数据。
本发明第二方面提供了一种病案首页数据质量检测系统,该系统包括数据导入模块,将医院数据转化成统一格式,按照分类规则导入到数据库;和,
检测模块,对医院病案首页数据进行数据检测和质量检测。
结合第二方面,在第二方面第一种可能的实现方式中,所述的系统还包括标准化模块,用于按照标准化字典对导入的数据进行标准化处理,包括代码标准化和格式规范化;还对数据文件内容进行识别,如果识别出不标准文件,则停止该医院的病案首页的质检;和,
数据统计分析模块,根据质检规则对数据进行统计分析,分析出某时间段内所有医院病案首页数据的整体情况,得出质量检测结果报告,并给出相应的问题明细表。
本发明第二方面的所述病案首页数据质量检测系统能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
由以上技术方案可见,本发明可以检测出病案首页的错误数据和不规范数据,得到检测结果和问题明细。
根据检测结果和问题明细,可以反映出本院病案首页数据质量的优势与劣势,让医院对本院的病案首页数据有一个直观的认识。
附图说明
图1为本发明病案首页数据质量检测方法流程示意图;
图2为本发明实施例将数据导入数据库的方法流程示意图;
图3为本发明实施例对数据进行标准化处理的方法流程示意图;
图4为本发明实施例数据检测的方法流程示意图;
图5为本发明实施例质量检测的方法流程示意图;
图6为本发明病案首页数据质量检测系统结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
如图1所示,病案首页数据质量检测方法,具体包括以下步骤:
S1、将数据导入数据库;
S2、对数据进行标准化处理;
S3、对标准化后的字段进行预处理;
S4、对导入的数据进行检测。
如图2所示,S1中将数据导入数据库具体包括以下步骤:
S11、采集医院上报的文件,将文件转化成统一格式;文件格式包括.xls,.xlsx,.csv,.dbf四种,通过第三方工具,将数据文件统一转换为.xlsx格式。
S12、将转化好的文件按照一定的分类规则存放在相应的目录中;分类规则包括:医院分类目录分为单个医院、放心医院协会、民营医院协会、天津医院协会。
S13、根据导入的数据文件为该医院生成数据库,并将数据文件的信息导入到相应的表中;
S14、创建该医院的临时表,并将数据文件的信息导入到相应的临时表中。共六个字典表,包括:《本院病案首页代码表》、《本院病案首页字典表-医疗机构诊疗科目名录》、《本院病案首页字典表-疾病分类与代码(ICD-10)》、《本院病案首页字典表-手术操作分类与代码(ICD-9-CM3)》、《本院病案首页字典表-形态学编码》、《本院病案首页字典表-手术分级》。
S12中的分类规则包括:每类医院目录下存放该医院各个年度的目录,各个年度目录下存放各个季度的目录,各个季度目录下存放医院该季度的数据文件和字典表目录,字典表目录下存放各个字典表文件目录,各个字典表文件目录下存放各个字典表文件。
如图3所示,S2中对数据进行标准化处理包括:通过标准化字典对字段进行映射,具体包括以下步骤:
S21、从医院对应的数据库的字段映射表中获取前232个字段。
S22、将获取的前232个字段与标准的232个字段进行匹配,在匹配时转换为大写。
S23、判断是否匹配成功;如果匹配成功,则执行S24;否则,执行S25。
S24、将匹配后的数据导入到标准模板表中。
S25、将该字段导入到字段映射表中并终止该医院后续的质检流程。只要存在不匹配的字段即为匹配不成功。
标准的232个字段包括卫统4-1标准232个字段。
S3中对标准化后的字段进行预处理包括对代码进行标准化处理和对格式进行规范化处理。
对代码进行标准化处理的方法具体包括:根据代码表的映射关系将相应字段的本院代码转换为标准代码。在将相应字段的本院代码转换为标准代码时还需读取本院代码表;在读取本院代码表时,根据逗号自动将本院代码进行分组。如表1示出了标准代码示例。
表1标准代码示例表
对格式进行规范化处理的方法具体包括:获取数据库中232个字段的数据格式;根据数据格式将nvarchar数据类型的字段转换为相应类型的字段,如果转换失败,则设置为空。
标准代码与本院代码为一对多的关系,具体为:本院代码为空或多个值,对应的标准代码为确定值;
数据格式包括string、double、datetime、int。
S4中对导入的数据进行检测包括数据检测和质量检测。
如图4所示,数据检测具体包括以下步骤:
S411、将诊断信息与手术及操作信息从病案首页标数据中分离至单独的表中;
S412、更新诊断信息、手术及操作信息、病案属性表中的数据,准备为后期统计使用;
S413、统计各月记录数;
S414、将本院疾病字典表和手术及操作字典表与标准字典表进行匹配,统计匹配率。
如图5所示,质量检测包括根据质检规则对病案首页数据字段进行检测,并将检测结果保存在数据库中,具体包括以下步骤:
S421、遍历所有的质检规则;
S422、根据每一项质检规则中所涉及的病案首页内容,将病案首页内容从数据表中提取出来;
S423、根据质检规则,判断病案首页内容是否合法。
根据质检规则对病案首页数据字段进行检测具体包括检测数据的完整性、检测数据的标准性、检测数据的规范性。
检测完整性包括检测病案首页数据填写的完整率,包括检测必填字段完整性,检测非必填字段完整性和检测组合字段完整性。必填字段共29个,包括:USERNAME,YLFKFS,ZYCS,BAH,XM,XB,CSRQ,NL,GJ,ZY,HY,RYTJ,RYSJ,RYSJS,RYKB,RYBF,CYSJ,CYSJS,CYKB,CYBF,SJZYTS,MZZD,JBBM,ZYZD,JBDM,RYBQ,L YFS,SFZZYJH,ZFY;除必填字段外,其余字段为非必填字段,组合字段主要为诊断三项(疾病名称,ICD-10编码,入院病情)和手术三项(手术及操作名称,ICD-9-CM-3编码,手术及操作日期)。
检测标准性包括检测各代码的使用率、标准诊疗科目名录与本院出院科室代码匹配情况、本院疾病字典表版本匹配情况和本院手术与操作字典表版本匹配情况。主要为17个代码表各代码的使用率,标准诊疗科目名录与本院出院科室代码匹配情况,本院疾病字典表版本匹配情况和本院手术与操作字典表版本匹配情况。17个代码表包括:医疗付费方式,性别,职业类别,婚姻,入院途径,入院病情,药物过敏,死亡患者尸检,血型,RhD血型,病案质量,手术级别,手术切口等级,手术切口愈合类别,麻醉方式,离院方式,是否有出院31天内再住院计划。
检测规范性包括检测单个字段规范性、检测合字段编码逻辑、检测组合字段费用逻辑、检测组合字段时间逻辑。
检测结果包括检测结果报告和问题明细表。
质量检测结果报告为整体的质量检测结果,包括质检规则的各项指标、相应问题链;所述的问题链接可链接到接到相应的问题明细表。
问题明细表按照质检结果项分布,每个问题明细表均包含一个结果项记录的问题数据;问题明细表按照病案号、出生日期、入院时间和问题字段进行存储;病案号、出生日期和入院时间用来定位病案首页数据,问题字段为问题字段的数据,方便用户快速定位和修改病案首页数据。
如图6所示,病案首页数据质量检测系统,包括数据导入模块,将医院数据转化成统一格式,按照分类规则导入到数据库;和,检测模块,对医院病案首页数据进行数据检测和质量检测;和,标准化模块,用于按照标准化字典对导入的数据进行标准化处理,包括代码标准化和格式规范化;还对数据文件内容进行识别,如果识别出不标准文件,则停止该医院的病案首页的质检;和,数据统计分析模块,根据质检规则对数据进行统计分析,分析出某时间段内所有医院病案首页数据的整体情况,得出质量检测结果报告,并给出相应的问题明细表。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
机译: 树型首页系统及首页管理方法
机译: 使用指纹认证装置的首页登录或财务交易系统以及使用相同方式的首页登录或财务交易方法
机译: 利用首页广告标语提供互联网首页广告的方法和系统