首页> 中国专利> 一种传染病聚集性探测与早期预警系统

一种传染病聚集性探测与早期预警系统

摘要

本发明提供了一种传染病聚集性探测与早期预警系统,包括信息采集模块,用于根据用户在数据库中的标识采集用户所需的传染病数据信息;风险等级设置模块,用于将用户分为两个以上的等级,每个等级对应相应的触发流程;处理模块,用于根据所述触发流程执行相应操作;其中,所述信息采集模块所采集的传染病数据信息传输给所述风险等级设置模块进行风险等级设置,获得相应的风险等级;针对相应的风险等级通过所述处理模块触发相应的风险等级的流程,执行相应的操作;该系统操作方便,可以方便不同背景技术的人员操作使用。

著录项

  • 公开/公告号CN103310083A

    专利类型发明专利

  • 公开/公告日2013-09-18

    原文格式PDF

  • 申请/专利权人 李晓松;段磊;冯子健;

    申请/专利号CN201210060951.9

  • 发明设计人 李晓松;段磊;冯子健;殷菲;蒋敏;

    申请日2012-03-09

  • 分类号G06F19/00(20110101);

  • 代理机构11337 北京市盛峰律师事务所;

  • 代理人赵建刚

  • 地址 610041 四川省成都市武侯区人民南路三段16号10栋1单元17号

  • 入库时间 2024-02-19 20:48:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-08

    未缴年费专利权终止 IPC(主分类):G06F19/00 授权公告日:20160803 终止日期:20180309 申请日:20120309

    专利权的终止

  • 2016-08-03

    授权

    授权

  • 2014-02-26

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20120309

    实质审查的生效

  • 2013-09-18

    公开

    公开

说明书

技术领域

本发明涉及保健监测技术领域,特别是涉及一种传染病聚集性探测与早期预警系统。

背景技术

对流行性疾病、传染病进行预防控制,有利于创造健康环境,维护社会稳定,保障国家 安全,促进人民健康。在传染病预防、疫情监测体系基础上,利用现代的统计和计算机技术 对传染病进行早期预警是当今传染病防控的有效手段。传染病统计监测(Statistical Surveillance) 是早期预警的基础和核心;同时计算机和统计软件的迅猛发展,使得统计计算大为简化,应 用更为广泛。

目前,对于传染病的统计监测,时空扫描统计量和近期异常事件探测(WSARE,What′s Strange About Recent Events)是两种应用最为广泛的统计算法。Kulldorff提出的时空扫描统计 量和时空重排扫描统计量具有良好的稳健性和较高的检验效能,是目前应用最为广泛的一种 时空聚集性探测方法。多源数据的产生促使时间-空间-人群多维探测方法的发展,恰当的统 计模型能有效地融合各种数据源,以得到一个稳健而高效的信息源。Wong等人提出了一种基 于规则的异常模式探测方法WSARE,该方法能够充分利用和挖掘多维度的症状监测数据进行 早期预警,目前已被美国RODS系统和以色列国家疾控中心采纳运用。

对于这两种统计算法的实现,目前都已经开发出了相应的免费软件。SaTScanTM用于实 现时空扫描统计量算法,该软件由Martin Kulldorff协同Information Management System Inc进 行开发。后期随着方法的发展,又由Takahashi、Yokoyama和Tango等人开发了FlexScan。WSARE 软件用于实现WSARE算法,由AUTON lab开发。

目前现有技术发明存在方法层面和应用层面的缺陷,具体如下所述:

方法层面:时空扫描统计量能够发现跨区域信号和次级信号,但尚未考虑传染病聚集的 人群分布特征,而WSARE可以纳入人口学信息进行分析,并通过基于规则的方法将最近事件 与基线分布数据相比较,发现两者间比例变化最大的亚组;但是WSARE将空间信息作为分类 变量处理,未能充分利用空间地理信息,而扫描统计量考虑了空间相关性和窗口的几何形态, 利用空间信息相对充分。因此,单独应用这两种方法进行传染病的早期预警都有局限性。

应用层面:虽然这两种算法都能通过现有的软件进行实现,但是现有的软件均为英文 界面,参数设置复杂,且对原始数据的格式有特殊要求,因此不适于普及应用。除此之外, 现有软件的结果均为文本格式,结果不直观,可读性较差。

总之,目前的传染病的统计监测系统是单机版的,而且使用操作需要拥有专业技术背景 的人员操作。

因而,目前需要本领域技术人员迫切解决的一个技术问题就是:如何找到一种新型的传 染病的统计监测系统,该系统操作简便,可以方便不同背景技术的人员操作使用。

发明内容

本发明所要解决的一个技术问题是提供一种传染病聚集性探测与早期预警系统,该系统 操作方便,可以方便不同背景技术的人员操作使用。

为了解决上述问题,本发明公开了一种传染病聚集性探测与早期预警系统,包括:

信息采集模块,用于根据用户在数据库中的标识采集用户所需的传染病数据信息;

风险等级设置模块,用于将用户分为两个以上的等级,每个等级对应相应的触发流程;

处理模块,用于根据所述触发流程执行相应操作;

其中,所述信息采集模块所采集的传染病数据信息传输给所述风险等级设置模块进行风 险等级设置,获得相应的风险等级;针对相应的风险等级通过所述处理模块触发相应的风险 等级的流程,执行相应的操作。

优选的,所述传染病聚集性探测与早期预警系统还包括:

数据预处理模块,用于通过时空扫描数据方法或近期异常事件探测方法对所述传染病数 据信息进行数据处理,获得相应的传染病预处理数据信息;其中,通过所述数据预处理模块 将所述信息采集模块所采集到的传染病数据信息进行预处理,获得相应的预处理数据,将所 获的预处理数据传输给所述风险等级设置模块进行相应的风险等级设置。

优选的,所述处理模块包括:

算法模块,用于通过时空扫描算法或近期异常事件探测方法对所述获得的相应的传染病 预处理数据信息进行计算,获得相应的计算数值。

优选的,所述算法模块包括:

时空扫描算法模块,用于通过时空扫描算法对所述获得的相应的传染病预处理数据信息 进行计算,获得相应的计算数值;

近期异常事件探测算法模块,用于通过近期异常事件探测算法对所述获得的相应的传染 病预处理数据信息进行计算,获得相应的计算数值。

优选的,所述时空扫描算法模块包括:

圆形时空扫描算法子模块,用于通过圆形时空扫描算法对所述获得的相应的传染病预处 理数据信息进行计算,获得相应的计算数值;

椭圆形时空扫描算法子模块,用于通过椭圆形时空扫描算法对所述获得的相应的传染病 预处理数据信息进行计算,获得相应的计算数值;

不规则形时空扫描算法子模块,用于通过不规则形时空扫描算法对所述获得的相应的传 染病预处理数据信息进行计算,获得相应的计算数值。

优选的,所述近期异常事件探测算法模块包括:

历史数据基线算法子模块,用于通过历史数据基线算法对所述获得的相应的传染病预处 理数据信息进行计算,获得相应的计算数值;

贝叶斯网络基线算法子模块,用于通过贝叶斯网络基线算法对所述获得的相应的传染病 预处理数据信息进行计算,获得相应的计算数值。

优选的,传染病聚集性探测与早期预警系统还包括:

可视化展示模块,用于通过时空扫描结果展示方法或近期异常事件探测方法对所述计算 模块计算处理获得的计算数值进行展示;其中,通过所述可视化展示模块将所述处理模块所 获得的处理数据给用户进行展示。

优选的,所述可视化展示模块包括:

时空扫描结果展示子模块,用于通过时空扫描结果展示方法对所述计算模块计算处理获 得的计算数值进行展示;

近期异常事件探测子模块,用于通过近期异常事件探测方法对所述计算模块计算处理获 得的计算数值进行展示。

本发明显著优点在于:

1、本发明一种传染病聚集性探测与早期预警系统将时空聚集性探测模型、地理信息系 统和Google Maps以及网络直报系统进行集成,开发一个集数据预处理、数据分析和结果可视 化展示于一体,可操作性强,功能完善的Web系统,为卫生部门及疾控机构进行传染病时空 聚集性探测与早期提供支持和服务。

2、本发明一种传染病聚集性探测与早期预警系统中所采用的D方法作为作为一种新的 时空扫描统计量被提出,通过标准模拟数据发现,当探测区域人口密度较高,疾病传播范围 较大时,D统计量的灵敏度与阳性预测值比基于泊松分布的扫描统计量大,探测效果更好。 该方法对于原始的时空扫描统计量算法是一种较好的补充。

3、本发明一种传染病聚集性探测与早期预警系统通过对于原始算法的重新编程以及默 认参数的设置,使得本软件系统相对于SaTScanTM和WSARE这两种原始软件更加容易使用, 利于其普及和推广。

4、本发明一种传染病聚集性探测与早期预警系统通过对时空聚集性探测模型和Google Maps的集成,使得专业的预警结果能够直观地展示在地图上,增加了结果的可读性,同时也 更加地美观;此外,由于本软件系统实现了数据预处理、早期预警分析以及预警结果可视化 展示的一体化处理,使得本软件系统更加人性化和智能化,大大地提高了工作效率;本软件 系统还预留了和传染病网络直报系统进行对接的接口,使得它和我国现有的传染病监测网络 具有较好的兼容性,有很强的实用性,方便本软件系统直接应用于我国的各级卫生及疾控部 门。

5、本发明一种传染病聚集性探测与早期预警系统所采用的J2EE技术是目前运用非常广 泛的技术,J2EE为搭建具有可伸缩性、灵活性、易维护性的商务系统提供了良好的机制,简 化且规范了应用系统的开发与部署,进而提高可移植性、安全与再用价值;PostgreSQL数据 库是免费的高效数据库系统,支持很多数据库特性;Jetty是一种轻量级的服务器容器,具有 高效性和易用性。B/S框架使得数据的运算与分析都在后台服务器运行,用户只需通过浏览器 便能操作所用功能。

总之,本发明提供了一种传染病聚集性探测与早期预警系统,该系统操作方便,可以方 便不同背景技术的人员操作使用。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面对实施例描述中所需要使用的附图 作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普 通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一种传染病聚集性探测与早期预警系统的实施例的结构示意图;

图2是本发明中传染病聚集性探测与早期预警系统的业务流程示意图;

图3是本发明中传染病聚集性探测与早期预警系统的业务逻辑示意图;

图4是本发明中传染病聚集性探测与早期预警系统的设计结构示意图;

图5是本发明中传染病聚集性探测与早期预警系统的模块框架示意图;

图6是本发明中近期异常事件探测算法的流程示意图。

具体实施方式

本发明实施例提供了一种传染病聚集性探测与早期预警系统,该系统操作方便,可以方 便不同背景技术的人员操作使用。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施 例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例 仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域普通技术人 员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的核心思想之一是提供了一种传染病聚集性探测与早期预警系统,包括信息采集 模块,用于根据用户在数据库中的标识采集用户所需的传染病数据信息;风险等级设置模块, 用于将用户分为两个以上的等级,每个等级对应相应的触发流程;处理模块,用于根据所述 触发流程执行相应操作;其中,所述信息采集模块所采集的传染病数据信息传输给所述风险 等级设置模块进行风险等级设置,获得相应的风险等级;针对相应的风险等级通过所述处理 模块触发相应的风险等级的流程,执行相应的操作;该系统操作方便,可以方便不同背景技 术的人员操作使用。

为了使本领域的普通技术人员更好地理解本发明,下面详细介绍传染病早期预警、时空 扫描统计量、近期异常事件探测、传染病网络直报系统、地理信息系统和J2EE架构、B/S框架、 PostgreSQL和Jetty这九个专业术语,具体如下所述:

传染病早期预警:通过收集、整理、分析目标传染病的相关信息资料,评估事件发展趋 势与危害程度,在事件发生之前或早期发出警报,使相关责任部门及事件影响目标人群及时 做出反应,预防或减少目标传染病的危害。

时空扫描统计量:是一种用于运用于疾病监测领域,可以发现传染病在时间、空间中发 病数异常升高的统计方法。最早于1997年由美国学者Kulldorff提出。具体根据扫描窗口的不 同,其可以分为圆形、椭圆形和不规则形窗口三种算法。

近期异常事件探测(WSARE,What′s Strange About Recent Events):属于一种数据挖掘 的方法,运用于传染病领域,可以发现传染病数据中蕴含的一些异常的规则,从而提示传染 病的异常发生。最早于2004年由美国学者Wong提出。根据其历史基线的构造方式,其又可以 分为历史数据基线WSARE和贝叶斯网络基线WSARE两种算法。

传染病网络直报系统:由中国疾病预防与控制中心(CDC)于2004年组织建立的,对我 国39种法定传染病进行网络实时上报和分析的疾病监测系统,是我国疾病监测领域中最为重 要的一个数据库系统。

地理信息系统(GIS,geographic information system):在计算机软硬件支持下,把各种地 理信息按照空间分布及属性,以一定的格式输入、存储、检索、更新、显示、制图、综合分 析和应用的技术系统。在传染病监测领域,可以用于展示疾病的空间分布和传播轨迹。

J2EE(Java 2Platform,Enterprise Edition)架构:J2EE是使用Java技术开发企业级应用的 一种事实上的工业标准。J2EE核心是一组技术规范与指南,其中所包含的各类组件、服务架 构及技术层次,均有共同的标准及规格,让各种依循J2EE架构的不同平台之间,存在良好的 兼容性,解决过去企业后端使用的信息产品彼此之间无法兼容,企业内部或外部难以互通的 窘境。J2EE是一个标准,而不是一个现成的产品。

B/S框架(Browser/Server,浏览器/服务器模式):是Web兴起后的一种网络结构模式, WEB浏览器是客户端最主要的应用软件。这种模式统一了客户端,将系统功能实现的核心部 分集中到服务器上,简化了系统的开发、维护和使用。客户机上只要安装一个浏览器 (Browser),服务器安装数据库,浏览器便可以通过Web Server同数据库进行数据交互。

PostgreSQL:是一种对象关系型数据库管理系统(ORDBMS)。PostgreSQL支持大部分 SQL标准并且提供了许多其他现代特性:复杂查询、外键、触发器、视图、事务完整性、多 版本并发控制。同样,PostgreSQL可以用许多方法扩展,比如,通过增加新的数据类型、函 数、操作符、聚集函数、索引方法、过程语言。

Jetty:是一个开源的servlet容器,它为基于Java的web内容(例如JSP和servlet)提供运 行环境。Jetty是使用Java语言编写的,它的API以一组JAR包的形式发布。开发人员可以将Jetty 容器实例化成一个对象,可以迅速为一些独立运行(stand-alone)的Java应用提供网络和web 连接。

参照图1,示出了本发明一种传染病聚集性探测与早期预警系统的实施例的结构示意图, 具体可以包括:

信息采集模块101,用于根据用户在数据库中的标识采集用户所需的传染病数据信息;

风险等级设置模块102,用于将用户分为两个以上的等级,每个等级对应相应的触发流 程;

处理模块103,用于根据所述触发流程执行相应操作。

其中,所述信息采集模块所采集的传染病数据信息传输给所述风险等级设置模块进行风 险等级设置,获得相应的风险等级;针对相应的风险等级通过所述处理模块触发相应的风险 等级的流程,执行相应的操作。

为了使本领域的技术人员更好地理解本发明,在本发明的优选实施例中,所述传染病聚 集性探测与早期预警系统还包括:

数据预处理模块A1,用于通过时空扫描数据方法或近期异常事件探测方法对所述传染病 数据信息进行数据处理,获得相应的传染病预处理数据信息。其中,通过所述数据预处理模 块将所述信息采集模块所采集到的传染病数据信息进行预处理,获得相应的预处理数据,将 所获的预处理数据传输给所述风险等级设置模块进行相应的风险等级设置。

为了使本领域的技术人员更好地理解本发明,在本发明的另一优选实施例中,所述传染 病聚集性探测与早期预警系统还包括:

算法模块B1,用于通过时空扫描算法或近期异常事件探测方法对所述获得的相应的传染 病预处理数据信息进行计算,获得相应的计算数值。

其中,所述算法模块B1包括:

时空扫描算法模块C1,用于通过时空扫描算法对所述获得的相应的传染病预处理数 据信息进行计算,获得相应的计算数值;

近期异常事件探测算法模块C2,用于通过近期异常事件探测算法对所述获得的相应 的传染病预处理数据信息进行计算,获得相应的计算数值。

其中,所述时空扫描算法模块C1包括:

圆形时空扫描算法子模块D1,用于通过圆形时空扫描算法对所述获得的相应的传染 病预处理数据信息进行计算,获得相应的计算数值;

椭圆形时空扫描算法子模块D2,用于通过椭圆形时空扫描算法对所述获得的相应的 传染病预处理数据信息进行计算,获得相应的计算数值;

不规则形时空扫描算法子模块D3,用于通过不规则形时空扫描算法对所述获得的相 应的传染病预处理数据信息进行计算,获得相应的计算数值。

其中,所述近期异常事件探测算法模块C2包括:

历史数据基线算法子模块E1,用于通过历史数据基线算法对所述获得的相应的传染 病预处理数据信息进行计算,获得相应的计算数值;

贝叶斯网络基线算法子模块E2,用于通过贝叶斯网络基线算法对所述获得的相应的 传染病预处理数据信息进行计算,获得相应的计算数值。

为了使本领域的技术人员更好地理解本发明,在本发明的另一优选实施例中,所述传 染病聚集性探测与早期预警系统还包括:

可视化展示模块F1,用于通过时空扫描结果展示方法或近期异常事件探测方法对所 述计算模块计算处理获得的计算数值进行展示。其中,通过所述可视化展示模块将所述处 理模块所获得的处理数据给用户进行展示。

其中,所述可视化展示模块F1包括:

时空扫描结果展示子模块G1,用于通过时空扫描结果展示方法对所述计算模块计算 处理获得的计算数值进行展示;

近期异常事件探测子模块G2,用于通过近期异常事件探测方法对所述计算模块计算 处理获得的计算数值进行展示。

为了使本领域的技术人员更好地理解本发明,在本发明的另一优选实施例中,所述传 染病聚集性探测与早期预警系统还包括:

用户管理模块H1,用于对不同等级的用户进行权限管理,获得相应的不同等级的用 户的传染病数据查询信息。

为了使本领域的技术人员更好地理解本发明,在本发明的另一优选实施例中,所述传 染病聚集性探测与早期预警系统还包括:

自定义修改和扩展模块I1,用于对所述传染病聚集性探测与早期预警系统的功能模块中 的参数进行新增、删除、调整等级的设置。

本发明的传染病聚集性探测与早期预警系统将时空聚集性探测模型、地理信息系统和 Google Maps以及网络直报系统进行集成,开发一个集数据预处理、数据分析和结果可视化 展示于一体,可操作性强,功能完善的Web系统,为卫生部门及疾控机构进行传染病时空聚 集性探测与早期提供支持和服务。

本发明的传染病聚集性探测与早期预警系统包括三大主体功能:

数据预处理:包括对原始数据(传染病病例数据、人口数据、地理经纬度数据)的导入、 清理和转换工作。处理后的原始数据将按系统设计的数据模式进行存储,满足用户的查看需 求,并方便数据分析时的查询和访问。

数据分析:利用实际传染病数据、人口数据和地理经纬度数据进行传染病时空聚集性探 测分析。主要运用的分析算法包括:前瞻性时空扫描模型算法和近期异常事件探测(WSARE) 算法。

结果可视化:将数据分析功能模块运行结果进行可视化展示,为用户提供一个直观的视 图查看功能。在真实的行政地图或卫星地图上运用Flash技术展示数据分析的结果,如:传 染病分级预警信号、统计信息、暴发轨迹等。

此外,成功开发的系统本身将成为一个基础架构稳定、扩展性好、复用性强的软件平台, 可以作为将来新应用的开发基础和平台。

本发明的传染病聚集性探测与早期预警系统具有如下优点:

1)运行稳定:系统预期将用于各个层次的疾控系统及有兴趣进行传染病聚集性探测和预 警的科研机构,系统将用于处理大量数据,并可能长时间运行,因此系统运行必须保证稳定 可靠。

2)计算速度快:为及时发现可能的传染病暴发,为实际防控赢得时间,对传染病数据的 分析必须在尽可能短的时间内完成,因此需要结合原始数据,对传染病分析算法(时空扫描 算法和近期异常事件探测(WSARE)算法)进行算法优化,保证算法执行速度满足实际业务要 求。

3)结果输出直观、美观:系统需保证用户能够直观、快速地查看结果,同时尽可能做到 结果输出美观。

4)操作简易:系统将可能用于较低级别的疾控机构,因此需保证复杂的传染病聚集性探 测方法能够在系统中简单方便地使用,易于较低学历层次的用户掌握。

5)用户界面友善:用户界面设计应简洁、大方,操作方式和窗口式布局充分考虑用户使 用方便,对用户友善。

6)数据精确度

本系统的核心是前瞻性时空扫描算法和近期异常事件探测(WSARE)算法的实现,因此为 了保证算法的精确性,所有数据都必须明确给出和精确计算,如数值型数据保留6位小数, 时间精确到毫秒等。

7)时间特性

为了提高用户的使用体验,在保证算法正确性的前提下,需要对前瞻性时空扫描算法和 近期异常事件探测(WSARE)算法进行优化。

8)适应性

在硬件设备与网络正常的情况下,服务器能承受最大的用户并发数目不低于100,达到 最大并发数时,CPU使用率平均不高于90%,内存占用率不高于80%。

9)可行性分析

Java是一门高效的面向对象语言,可以容易地优化所有算法。同时,在目前J2EE的技术 条件下,缩短响应时间是可行的。

本发明的传染病聚集性探测与早期预警系统所针对的用户对象是卫生部门或研究机构的 相关人员,且系统主要功能是算法的实现与结果的展示,因此用户需采用登录方式进入系统。 系统导航页罗列所有算法(包括圆形时空扫描、椭圆形时空扫描、不规则形时空扫描、历史 数据基线WSARE和贝叶斯网络基线WSARE),以方便用户选择和切换。所有用户页面需 要美观、大方、可操作性强。

参照图2,示出了传染病聚集性探测与早期预警系统的业务流程示意图。

从图2中可以看出:

传染病聚集性探测与早期预警系统的业务流程步骤具体如下所述:

1)收集传染病数据;

2)对收集到的传染病数据进行数据提取,数据转换,数据清洗和数据加载的数据预处理 过程,获得相应的处理后的数据信息;

3)对所获得的相应的处理后的数据信息构建数据仓库,获得相应的传染病数据仓库;

4)对所述传染病数据仓库进行相应的数据分析,获得相应的数据分析结果;

5)针对基层,研究人员和高层管理员三类用户人群,可以注册登录并查询相应的传染病 数据,获得相应的数据可视化结果;

其中,所述的数据可视化结果可以以报表和区域预报信号的形式进行表达,可以让用户 更直观地获得相应的传染病数据信息。

本发明的传染病聚集性探测与早期预警系统具有运行速度快、界面友好、可操作性强、 简单易用、系统稳定和结果输出美观的优点。

参照图3,示出了本发明中传染病聚集性探测与早期预警系统的业务逻辑示意图。

为保证传染病时空聚集性探测和早期预警集成系统开发的高效率和系统运行的稳定性和 可靠性,系统将采用J2EE架构进行设计和开发工作。基于J2EE架构的系统能够更好地实现 高效的开发,在J2EE架构下开发工作能集中在如何创建业务逻辑上,缩短了开发时间。

在开发过程中,系统将遵循功能模块化设计和开发原则。系统中的各个功能模块具有独 立性,采用“挂架式”的方式集成到系统中。各功能模块满足高内聚、低耦合的软件工程设计 原则,充分保证系统功能的可扩充性,以便将来系统升级和加入新的模块和算法。

从图3中可以看出:本发明中传染病聚集性探测与早期预警系统的业务逻辑,具体如下 所述:

1)通过可定制中间数据生成规则,原始数据(只读)转换成中间数据库(非只读);

2)通过调用指定算法进行运算以及基本统计分析的方法,中间数据库(非只读)转换成 结果数据(以报告形式输出并保存);

3)通过从地理数据、结果数据中读取指定参数的方法,结果数据(以报告形式输出并保 存)转换成可视化展示结果数据。

通过上述一步步的数据转换过程,最初的只读形式的原始数据转换成可视化展示结果数 据。

参照图4,示出了本发明中传染病聚集性探测与早期预警系统的设计结构示意图。

从图4中可以看出:本发明中传染病聚集性探测与早期预警系统的设计结构,具体如下 所述:

1)时空扫描数据预处理经过圆形时空扫描、椭圆形时空扫描和不规则形时空扫描三种方 式,最终可以获得时空扫描结果可视化展示数据。

2)近期异常事件探测通过历史数据基线与贝叶斯网络基线两种方式,获得近期异常事件 探测结果。

3)注册用户可以自由选择登录本发明的传染病聚集性探测与早期预警系统来进行时空扫 描数据预处理,获得时空扫描结果可视化展示数据的全过程;当注册用户获得所述时空扫描 结果可视化展示数据,可以自由地选择退出本发明的传染病聚集性探测与早期预警系统。

4)注册用户可以自由选择登录本发明的传染病聚集性探测与早期预警系统来进行近期异常 事件探测,获得近期异常事件探测结果的全过程;当注册用户获得所述近期异常事件探测结 果,可以自由地选择退出本发明的传染病聚集性探测与早期预警系统。

参照图5,示出了本发明中传染病聚集性探测与早期预警系统的模块框架示意图。

从图5中,可以看出:本发明中传染病聚集性探测与早期预警系统的模块框架具体可以 包括:数据预处理模块、算法模块、可视化展示模块、用户管理模块和其它功能模块。

为了本领域的普通技术人员更好地理解本发明,下面详细介绍上述模块,具体如下所述:

1)数据预处理模块:

数据预处理模块分为时空扫描数据预处理模块和近期异常事件探测(WSARE)数据预处 理模块,这两个子模块主要是从原始病例数据中提取符合筛选条件的病例,并进行格式化处 理。时空扫描数据预处理模块还同时对地理数据和人口数据进行清理和筛选。

数据预处理模块功能描述

针对人口和地理数据的预处理比较简单,仅仅是提取需要的地理数据;针对病例数据的 预处理需要根据针对的病种、地理区域、职业、年龄、最小预警尺度等参数进行筛选,提取 符合条件的病例并进行规范化,规范化的过程是指提取病例的性别、年龄、职业、病例录入 日期、现住地址编码、病种、病例分类等信息。规范化后的病例数据需要提供下载,并在日 志窗口中可查看预处理过程的汇总结果,如提取出的病例数、过滤掉的病例数、预处理成功 与否等。

数据预处理主要指对数据进行数据抽取、数据转换、数据清洗及数据加载的过程。

数据的预处理是构建数据仓库的重要一环。它从数据库中抽取数据并按照一定的要求将 数据进行转换和清洗,最后将高质量的数据装载到数据仓库中,为数据分析模块提供数据源 和决策分析。

时空扫描统计量模型所需数据的预处理

时空扫描统计量需要病例信息、人口信息、地理信息三类数据,需对这三类数据进行预 处理。

原始病例数据包含“卡片ID”、“卡片状态”、“报告医院所在地区国标编码”、“卡 片编号”、“身份证号码”、“报告时病例分类”、“姓名”、“性别”、“监护人姓名”、 “出生日期”、“发病日期”、“诊断时间”、“患者工作单位”、“现住地址”、“现住 地址国标编码”、“现住详细地址”、“职业”、“死亡日期”、“报告人”、“填卡医生”、 “医生填卡日期”、“疾病名称”、“接触者有无相同症状”、“备注”、“报告卡生成时 间”、“县区审核时间”、“地市审核时间”、“省级审核时间”、“订正终审时间”、“终 审死亡时间”、“删除时间”、“报告地区”、“报告单位”、“补卡时间”、“审核状态”、 “单位类型”、“卡片来源”37个变量。

原始人口数据包括“地区编码”、“地区名称”、“年龄”、“男性人口数”、“女性 人口数”、“产生人口信息年份”、“年龄分段”、“人口总数”。

经预处理后,系统将生成规范的病例信息文件、人口数据文件和地理数据文件,并提供 给用户下载。

预处理后的病例信息文件

预处理后的病例信息文件包含的变量为:

卡片编号:该病例在传染病网络直报系统中的唯一编码;

病例的性别、年龄、职业;

卡片录入日期:该病例进入传染病网络直报系统的日期,格式为年/月/日;

地址编码:该病例现住地址的国标编码,为8位数字;

该病例的病种及病例分类。

预处理后的人口数据文件

每一列变量为:

地区国标编码:根据最小预警尺度对原始的8位编码进行了提取,仅保留至最小预警尺 度级别,为2-8位数字;

日期:该该人口数据来源的日期;

人口数:该地区内的总人口数。

预处理后地理数据文件

每一列变量为:

地区国标编码:根据最小预警尺度对原始的8位编码进行了提取,仅保留至最小预警尺 度级别,为2-8位数字;

经度:该地区的经度,以该地区几何中心的经度确定,精确到小数点后6位。

纬度:该地区的纬度,以该地区几何中心的纬度确定,精确到小数后6位;

X坐标、Y坐标:是由经纬度坐标转换成的投影直角平面坐标,可精确到小数点后3位。

近期异常事件探测(WSARE)所需数据的预处理

近期异常事件探测(WSARE)算法仅需要病例数据,因此仅需要对病例数据进行预处理。 原始数据格式同前。预处理后的病例信息文件包含的变量为:

卡片编号:该病例在传染病网络直报系统中的唯一编码;

性别:病例的性别;

年龄:根据用户设定的分组标准对原始年龄进行了分段;

职业:病例的职业;

卡片录入日期:该病例进入传染病网络直报系统的日期,格式为年/月/日;

地址编码:该病例现住地址的国标编码,为8位数字;

该病例的病种。

2)算法模块:

算法模块包括两大类算法,时空扫描算法和近期异常事件探测(WSARE)算法。根据区域 的扫描方式,时空扫描包含三个子算法:圆形时空扫描算法、椭圆形时空扫描和不规则形时 空扫描。所有的时空扫描算法都包含LLR方法和D方法两种不同的计算方式以供选择。根据 基线构建方法,近期异常事件探测(WSARE)算法包含历史数据基线和贝叶斯网络基线两类算 法。

前瞻性时空扫描算法模块功能描述

选择不同的扫描方式(圆形、椭圆形和不规则形),读入时空扫描预处理模块规范化后 的病例数据、人口数据和地理数据,可以对蒙特卡罗迭代次数、计算方式(D方法或LLR方 法)、研究日期、预警日期等参数进行设定。在算法运行过程中,不能存在溢出等现象,并 保证结果完全正确,日志中可以查看算法是否运行成功以及成功后的结果,且算法要尽可能 高效。

近期异常事件探测(WSARE)算法模块功能描述

选择历史数据基线或贝叶斯网络基线WSARE算法,读入WSARE预处理模块规范化后 的病例数据,对蒙特卡罗迭代次数、历史数据基线、环境变量等参数进行设定。与前瞻性时 空扫描算法模块一样,需要保证算法的正确性和高效性。

算法模块首先读取预处理后生成的中间数据或用户已预处理好的数据,然后对数据进行 时空聚集性探测。时空聚集性探测模型包括前瞻性时空扫描统计量和近期异常事件探测 (WSARE)。该模块主要具有以下特点:

算法中的参数可设置、可调整;

算法运行过程中出现任何异常状况都能终止运算,能生成并输出“错误报告”;

算法性能优化良好,确保了较短的运算时间;

保证了算法的模块化,以确保新算法的载入添加;

关于预警报告的存档:

①每次预警报告提供自动按一定命名规则进行存档;

②可定义自动存档文件夹的保存期限;

③提供另存为功能;

对历史运算结果提供查看功能。

前瞻性时空扫描统计量

表格1中对算法进行了描述,具体如下所述:

表1

参数设置

根据研究需要设定预警时间段、基线长度、时间及空间窗口、蒙特卡洛模拟次数、检验 水准等,系统可根据设定的参数对数据进行聚集性探测分析,并根据检验水准报告可能的聚 集。同时系统提供一套默认参数供快捷分析用。

输出内容

软件运行基本信息;

探测时间段、区域及所用的算法;

可能存在的聚集,包括聚集区域的地理编码、坐标、角度、形状、聚集的时间段、聚集 区域的总人口数、聚集区域的总病例数、聚集区域的预期发病数、平均病例数、实际病例数 与期望病例数之比、相对危险度、最大似然比、检验统计量、蒙特卡洛排名、P值、预期再 次出现聚集的间隔时间等;

聚集性区域包含的病例信息,包括聚集区域编号、病例的卡片编号、性别、年龄、职业、 地区编码、卡片录入日期、病种、病例分类等。

聚集性区域病例的基本统计分析

对聚集性区域包含的病例的性别、年龄、职业等进行基本描述,计算其构成。

近期异常事件探测中算法参数设置

历史数据基线WSARE只需根据研究需要设定预警时间段、历史基线生成规则、最大规 则成分数、蒙特卡洛模拟次数、检验水准等。贝叶斯网络基线WSARE除设定预警时间段、 最大规则成分数、蒙特卡洛模拟次数、检验水准外,还需设定构建贝叶斯网络基线所需环境 变量,如节假日、月份、季节、星期等,用户设定后系统可提取数据中的相应信息自动生成 环境变量。系统可根据设定的参数对数据进行聚集性探测分析,并根据检验水准报告可能的 聚集。同时系统提供一套默认参数供快捷分析用。

输出内容

软件运行基本信息:包括程序运行完成时间、本次运行设定的参数、使用的算法等;

探测时间段及区域;

可能存在的聚集:包括聚集的时间、最近数据的大小、基线数据的大小、得分最小的规 则、规则得分、蒙特卡洛检验后的P值等。

3)可视化展示模块:

在结果展示方式上,近期异常事件探测(WSARE)算法的结果由于都是一条最优规则,因 此展示方式比较单一,通过提示框的方式进行表现;时空扫描算法的结果需要结合Google地 图进行展示,因此相对复杂,涉及到传染病聚集性区域的可视化,可视化参数设定,区域病 例的年龄、性别、职业分析,区域病例的下载,所有区域的列表展示,算法运行结果以及区 域病例数据下载等等。此外,还需要提供暴发轨迹查看各区域在一定时间段内的变化情况。

结果展示模块功能描述

由于近期异常事件探测(WSARE)算法的结果仅仅是一条规则,因此展示相对简单,以弹 出窗口的形式展示;前瞻性时空扫描算法模块展示需要借助Google Maps,在算法运行完成 后,需要对预警信号根据P值进行分级,不同级用不同的颜色以示区分,同时,P值越小, 其所对应的信号越强,越有意义。同时可读入各行政区域的边界信息以展示预警信号的详细 区域。所有的预警信号区域都应该在Google Maps中得到展示(包括2D、3D和2D+3D(地 图和卫星图像叠加的混合图层)三种方式),点击各个区域可以看到该区域的一些信息,如: 聚集区域的地理编码、经纬度、半径、聚集的时间段、聚集区域的总人口数、聚集区域的总 病例数、聚集区域的预期发病数、相对危险度、对数似然比、P值等。显示窗口需要提供预 警信号强弱列表,点击其中一个,可以方便定位到地图上,同时,可以查看该区域病例针对 性别、年龄和职业的统计分析,针对不同变量采用不同的统计图表描述其特征,如:年龄分 布采用条图,性别、职业分布采用饼图等。

由于近期异常事件探测(WSARE)的结果仅为一条最有意义的规则,因此该算法的结果以 弹出窗口形式展示。

本系统的结果可视化模块主要适用于前瞻性时空扫描方法。通过设置相应的可视化参数, 即可将时空扫描探测的聚集信号形象直观地呈现在地图上,同时还可以得到各个聚集信号所 包含病例人群分布(性别、职业、年龄)的分析结果以及动态的疾病暴发轨迹。

系统可视化参数设置界面提供可视化参数设置功能,可由用户自定义信号的分级数及各 级显示的颜色。

系统可根据自定义的可视化参数将不同强度的预警信号按照不同的颜色分级定位在地图 上。系统实现了以Google Maps/Satellite为基础的传染病暴发强度可视化查看功能,和传染病 暴发轨迹可视化查看功能。系统支持分级展示,并能提供预警信号的详细信息及信号所在区 域病例的基本特征分析。

通过点击可视化页面右下角的“查看暴发轨迹”选项,可以通过时间轴显示选中区域及时 间段内各个小区域中预警信号的变化。查看信号的暴发轨迹。系统支持以自动播放的方式展 示动态变化的过程,时间轴类似于视频播放软件的进度条操作。

4)用户管理模块:

用户管理模块,主要包含用户的增加、修改、删除、权限制定等。附加功能包含用户使 用系统的日志记录展示,步骤进行过程提示,预警能通过内置通讯录以手机短信及Email的 形式发送到相应责任人等。

用户登录及管理模块

为保证系统及数据安全,用户需通过验证的用户名和密码登录传染病聚集性探测与早期 预警集成系统。错误的用户名或密码将不能登录系统。

登录系统后系统提供算法导航界面,用户可根据具体需要选择时空扫描或近期异常事件 探测(WSARE)算法,并由此进入各自的数据预处理模块。

5)其它功能模块:

暴发轨迹功能描述:

当查看一次结果进行时,可按时间回溯指定预警信号的产生过程,在指定时间段内持续 关注该信号,以追溯某预警信号的过去,并关注其未来的发展趋势。

用户管理及附加功能模块功能描述:

由于本系统的重心是实现算法,因此用户管理模块相对较少,只需提供简单的用户增加、 修改和删除功能。附加功能也只需要提供接口,供进一步开发利用。

本发明的传染病聚集性探测与早期预警系统采用B/S框架,即基于Web的三层应用体系 结构,数据的运算与分析都在后台服务器运行,用户只需通过浏览器便能操作所用功能。运 用J2EE技术进行开发,并结合PostgreSQL数据库,以Jetty作为服务器。J2EE技术是目前 运用非常广泛的技术,用于解决企业级系统开发;PostgreSQL数据库是免费的高效数据库系 统,支持很多数据库特性;Jetty是一种轻量级的服务器容器,具有高效性和易用性。因此, 采用B/S架构解决方案是可行的。

本发明的传染病聚集性探测与早期预警系统的接口包括外部接口和内部接口。

本发明的传染病聚集性探测与早期预警系统的外部接口主要包括:服务器接口、客户端 PC接口、网卡接口和网络连线接口。

本发明的传染病聚集性探测与早期预警系统的系统的内部接口主要包括:PostgreSQL接 口、JAVA虚拟机接口、服务器(如IIS,TOMCAT)接口、浏览器接口。

本发明一种传染病聚集性探测与早期预警系统的运行环境控制,具体如下所述:

为了方便部署和高效访问,系统服务器端将Web服务器集成在系统中。Web服务器模块 的核心基于Jetty应用服务器。Jetty是一个符合J2EE的JSP、Servlet标准的Web及应用服务 器,采用了基于Java NIO技术的网络访问层,可以达到极高的访问效率,并且支持 Continuations技术,能够在Web环境下实现大并发度准实时地客户端/服务器交互。

根据部署情况需要,可以选用Nginx作为前端代理服务器,分担Jetty服务器的压力。在 这种方式下,如果客户端请求的是静态页面,则由Nginx服务器响应请求;如果客户端请求 动态页面,则由Jetty服务器响应请求;结合系统前端采用的GWT技术,可以让系统达到非 常高的性能。

客户端浏览器:推荐Firefox、Chrome,支持IE浏览器8.0。预装软件:Microsoft Excel 2003 版本以上。

本发明一种传染病聚集性探测与早期预警系统的运行时间:

传染病时空聚集性探测与早期预警集成系统运行时间由病例规模和监测点数量决定。分 析测试表明,系统算法具有较好的伸缩性,随着病例规模和监测点数量增长而线性增加。

考虑到传染病时空聚集性探测与早期预警集成系统的运行环境为准实时环境(通常在夜 间进行计算),系统运行时间能够满足实际运行的需求,达到设计目标。

为了使本领域的普通技术人员更好地理解本发明,下面详细介绍本发明的数据结构与程 序的关系,具体如下所述:

数据结构与程序的关系

数据描述

静态数据

本系统中需要的静态数据主要指服务器端启动服务的过程中需要加载的一些地理信息数 据,包括全国各省、地市、区县和乡镇的名称、国标编码、行政中心的经纬度、经纬度所对 应的平面X、Y坐标,以及各行政区域的边界信息(由若干个经纬度表示)。全国省级、地市 级和区县级地理数据以及边界数据包括全国省地理数据、全国地市级地理数据、全国区县级 地理数据和全国省级边界数据。

动态数据

本系统所涉及的动态数据主要包括用户在使用系统时所上传的病例数据、人口数据、地 理数据和邻接矩阵数据,数据预处理结束后所产生的病例、人口和地理格式化数据,时空扫 描算法和近期异常事件探测(WSARE)算法的运行结果数据,以及算法在运行过程中所产生的 临时数据。

原始病例数据包含“卡片ID”,“卡片状态”,“报告医院所在地区国标编码”,“卡片编号”, “身份证号码”,“报告时病例分类”,“姓名”,“性别”,“监护人姓名”,“出生日期”,“发病日 期”,“诊断时间”,“患者工作单位”,“现住地址”,“现住地址国标编码”,“现住详细地址”,“职 业”,“死亡日期”,“报告人”,“填卡医生”,“医生填卡日期”,“疾病名称”,“接触者有无相同 症状”,“备注”,“报告卡生成时间”,“县区审核时间”,“地市审核时间”,“省级审核时间”,“订 正终审时间”,“终审死亡时间”,“删除时间”,“报告地区”,“报告单位”,“补卡时间”,“审核 状态”,“单位类型”,“卡片来源”37个变量。

用户上载的人口数据包括“地区编码”,“地区名称”,“年龄”,“男性人口数”,“女性人口 数”,“产生人口信息年份”,“年龄分段”,“人口总数”。

用户上传的地理数据包括“地区国标编码”,“经度”,“纬度”,“X坐标”,“Y坐标”。

用户上载的邻接矩阵中包含与各区域相邻的区域个数及地区国标编码。

数据库操作

传染病时空聚集性探测与早期预警集成系统对数据库的管理操作,主要涉及到用户账户 的管理、数据字典的管理和算法运行过程中需要保存在数据库中的临时数据的管理。对数据 库的操作仅限于普通的增加,修改和删除。

数据词典

传染病时空聚集性探测与早期预警集成系统中数据词典主要包括:

用户账户管理中需要的民族、省、地市、区县名称;

时空扫描和近期异常事件探测(WSARE)算法要处理的若干病种名称;

数据统计分析中的职业名称。

数据读取

运行传染病时空聚集性探测与早期预警集成系统的时空扫描算法需要上传病例数据文 件、人口数据文件和地理数据文件,运行近期异常事件探测(WSARE)算法只需要上传病例数 据文件。所有的文件都只支持GBK或GB2312编码的CSV文件或与CSV格式相同的文本文 件。各种类型的文件必须按照统一格式进行编写,以便于服务器端能按照既定的读取方式解 析各种类型的数据文件。

表结构

本系统主要涉及到的数据库表如下:

①用户表t_user:

表2示出了用户表t_user的数据库表,具体如下所述:

  id  project_id   name   gender   department_id   create_time   theme   enable   ID  工程ID   姓名   性别   部门ID   创建时间   主题   是否删除

表2

②用户照片表t_user_photo:

表3示出了用户照片表t_user_photo的数据库表,具体如下所述:

  id   user_id   image   ID   用户ID   用户照片路径

表3

③用户详细信息表t_user_detail:

表4示出了用户详细信息表t_user_detail的数据库表,具体如下所述:

表4

④机构层次表t_department_level:

表5示出了机构层次表t_department_level的数据库表,具体如下所述:

  id   name   ID   名字

表5

⑤机构表t_department:

表6示出了机构表t_department的数据库表,具体如下所述:

表6

⑥数据字典类型表t_dictionary_type:

表7示出了数据字典类型表t_dictionary_type的数据库表,具体如下所述:

  id   parent_id   name   description   ID   父字典项   名   描述信息

表7

⑦数据字典表t_dictionary:

表8示出了数据字典表t_dictionary的数据库表,具体如下所述:

表8

⑧角色表t_role:

表9示出了角色表t_role的数据库表,具体如下所述:

  id   name   visible   transmit   ID   名字   是否可见   是否可传递

表9

⑨账户表t_account:

表10示出了账户表t_account的数据库表,具体如下所述:

  id   user_id   login   password   login_count   ID   账号所有人   登录名   密码   登录次数

表10

⑩机构角色表t_department_role:

表11示出了机构角色表t_department_role的数据库表,具体如下所述:

  id   department_id   role_id   ID   机构   角色

表11

账户机构角色表t_account_role:

表12示出了账户机构角色表t_account_role的数据库表,具体如下所述:

  id   account_id   department_id   role_id   enabled   ID   帐号   机构   角色   是否有效

表12

系统操作情况表t_log:

表13示出了系统操作情况表t_log的数据库表,具体如下所述:

  id   user_id   log_date   ip   action   ID   用户   日期   进入系统的IP   动作

表13 

系统登录统计表t_login_stat:

表14示出了系统登录统计表t_login_stat的数据库表,具体如下所述:

  id   department_id   count   ID   单位部门   登录次数

表14

上载临时文件表t_temp_file:

表15示出了上载临时文件表t_temp_file的数据库表,具体如下所述:

  id   name   ext   upload_time   ID   文件名   文件路径   上传时间

表15

病例临时数据表t_case_file:

表16示出了病例临时数据表t_case_file的数据库表,具体如下所述:

  id   name   ID   文件名

表16

参照图6,示出了本发明中近期异常事件探测算法的流程示意图。

从图6中,可以看出:本发明中近期异常事件探测算法包括历史数据基线WSARE和贝 叶斯网络基线WSARE两种方式,具体如下所述:

历史数据基线WSARE算法流程示意图,具体如下所述:

1)从历史数据中选取指定日期作为检测基线;

2)对比基线数据和近期数据,找出有效的数据;

3)对最佳规则进行随机测试;

4)报告最佳规则及其P值。

贝叶斯网络基线WSARE算法流程示意图,具体如下所述:

1)从历史数据中训练贝叶斯网络;

2)从贝叶斯网络中选择训练样本;

3)对比基线数据和近期数据,找出有效的数据;

4)对最佳规则进行随机测试;

5)报告最佳规则及其P值。

本发明的一种传染病聚集性探测与早期预警系统具有如下优点:

1)原始创新:本系统在时空扫描统计量的算法程序中集成了“D方法”,D方法全称为基 于超几何分布扫描统计量(D统计量),是对时空扫描统计量算法的发展,该方法由本项目组首 次提出。

2应用创新:在深入研究原始文献的基础上,本系统对于时空扫描统计量和近期异常事 件探测(WSARE)这两种算法进行了重新的编程实现,并对其中的部分算法进行了优化;除 此之外,在大量前期研究的基础之上,本软件系统还对这上述两种算法给出了默认的参数设 置,提高了其实用性。

3)集成创新:本系统成功地将时空聚集性探测模型和Google Maps进行了集成,实现了 数据预处理、早期预警分析以及预警结果可视化展示的一体化处理;与此同时,还预留了和 传染病网络直报系统进行对接的接口,方便本软件系统后期直接应用于我国的各级卫生及疾 控部门。

4)技术创新:本系统。以先进的J2EE架构进行设计和开发工作,并结合PostgreSQL数 据库,以Jetty作为服务器。于此同时,本系统还采用了B/S框架。

总之,本发明提供了一种传染病聚集性探测与早期预警系统,该系统操作方便,可以方 便不同背景技术的人员操作使用。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实 施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由 于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即 可。

以上对本发明所提供的一种传染病聚集性探测与早期预警系统进行了详细介绍,本文中 应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理 解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在 具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明 的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号