首页> 中国专利> 居委标准代码转换系统及方法

居委标准代码转换系统及方法

摘要

本发明揭示了一种居委标准代码转换系统及方法,所述系统包括:数据库模块、检索数据获取模块、匹配模块、智能学习模块。数据库模块用以存储设定数据;检索数据获取模块用以获取检索关键词;匹配模块用以将检索关键词与检索历史数据库中的历史检索数据进行匹配,若检索历史数据库中有与当前检索关键词相同的检索关键词,则输出对应的检索结果;智能学习模块用以跟踪历史检索事件中用户的行为,根据用户的行为判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各居委会对应属性在相应检索关键词下对应的权值。本发明可通过信息化手段将变更频繁的居委代码按统一标准提供给各业务系统,提高效率。

著录项

  • 公开/公告号CN104462216A

    专利类型发明专利

  • 公开/公告日2015-03-25

    原文格式PDF

  • 申请/专利权人 上海南洋万邦软件技术有限公司;

    申请/专利号CN201410621040.8

  • 发明设计人 王志崴;何峥;

    申请日2014-11-06

  • 分类号

  • 代理机构上海容慧专利代理事务所(普通合伙);

  • 代理人于晓菁

  • 地址 200030 上海市徐汇区宛平南路75号23楼

  • 入库时间 2023-12-18 08:05:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-26

    授权

    授权

  • 2015-04-22

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20141106

    实质审查的生效

  • 2015-03-25

    公开

    公开

说明书

技术领域

本发明属于电子信息技术领域,涉及一种代码转换系统,尤其涉及一种居委 标准代码转换系统;同时,本发明还涉及一种居委标准代码转换方法。

背景技术

随着中国城市信息化程度的深入,政府的各部门工作的电子化程度也不断增 加,目前作为城市最基层的居委会是直接面向市民的关键角色,很多具体的工作 和业务信息的实际管理都是以居委为主体在进行的,所以建立电子政务信息系统 的时候,以居委为层面的信息管理、政策发布和工作业务上传管理是不可避免的。

但是作为最小行政单位的居委会,也是变动最大,最难以管理的环节,实施 标准化的信息区划管理存在一定的难度。以上海为例,行政区划的国家标准代码 到街道、镇一级,居委会就是以地方标准代码为主了,而且和街道、镇的行政区 划需要国家批准不同,居委会的变更较为简单、频繁;范围和名称的变更较为普 遍。

目前相当多的政务信息的管理界面仅到街道层面处理,而涉及到居委会的各 级业务系统所采用的居委名称和区划代码也各不相同,同一个居委会在不同信息 系统中的名称和区划代码存在普遍的差异,这就造成大量的业务数据之间存在交 互的问题。

同时具体掌握居民最及时信息的居委会层面无法对系统信息进行维护,随着 民政局及下属各居委会和街道的工作的深入,随着近些年来上海城市经济和社会 事业的快速发展,人口发展也进入一个新的时期。非上海户籍人口即外来人口在 徐汇区居住、工作的数量将在今后几年内还会持续的增长;随着区城市改造的推 进和住宅条件的改善,也使户籍人口中人户分离日趋增加,人员流动和市民办事 业务的需求,对不同业务信息系统的信息交流、交互提出了更高的要求。但是不 同业务系统中居委会信息的差异对信息的交互和整合带来了一定的影响。

有鉴于此,如今迫切需要设计一种新的居委会代码解决方案,以克服现有居 委会代码更新不及时的缺陷。

发明内容

本发明所要解决的技术问题是:提供一种居委标准代码转换系统,可通过信 息化手段将变更频繁的居委代码按统一标准提供给各业务系统,各业务系统可以 不需要修改本系统中原有的代码定义方式,便可直接使用居委标准代码,可以在 此基础上实现原来较为复杂的居委会基础上的信息交互和沟通。

此外,本发明还提供一种居委标准代码转换方法,可通过信息化手段将变更 频繁的居委代码按统一标准提供给各业务系统,各业务系统可以不需要修改本系 统中原有的代码定义方式,便可直接使用居委标准代码,可以在此基础上实现原 来较为复杂的居委会基础上的信息交互和沟通。

为解决上述技术问题,本发明采用如下技术方案:

一种居委标准代码转换系统,将原有的逐个系统人工定制的工作方式通过本 系统的学习记录和匹配流程成为自动化统一方案;系统流程为接收源数据和转换 请求,通过匹配模块对源数据的分析和对比形成配对公式,最终输出标准代码数 据;通过学习模块记录过程和结果公式记录下来,并跟踪用户多次提交源数据的 转换结果确定配对权值;所述系统包括:

非标历史学习库,用以记录源数据状态和分析情况,以长度、编码方式、标 准关键字进行记录;供后续配对使用;

配对公式库,用以记录结果公式,源数据能通过配对公式转化为标准代码;

检索记忆库,用以存放用户历史所检索的居委名称,作为智能学习库和检索 数据库的桥梁;

居委会标准代码库,用以提供标准代码的基础数据库,本数据库通过自动爬 网适配器,识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代 码,以提供给各业务系统使用;

智能学习库,用以存放用户历史所转换的结果和配对权值;

初始处理模块,用以接收服务对象,第三方业务系统的非标居委名称或/和 代码,按关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相 似的案例,直接作为配比方案提供下一流程,如无相似,则自动进行初步处理, 并提供给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案 例,达到系统学习的目的;

算法匹配模块,用以根据初始处理的数据情况,从所述配对公式库中选择不 同的算法公式,比如常见的最简单转换公式:原字串+“街道”=>对应标准代码 表(将缺少“街道”的简称如“徐家汇”转化为“徐家汇街道”,获得徐家汇 街道的标准代码310104014输出);根据不同的数据分类按:中文连续、中文简 称、英文完整、英文简称、数字型、非标自定义这几种类型选择不同的配对算法, 异常情况下有提交至人工处理,通过人工干涉和处理,完成流程,并学习进入配 对公式库;

智能学习模块,用以跟踪历史申请转换事件中用户的行为,根据用户的提交 频次和人工干涉结果判断其对匹配模块提供的匹配结果的满意度(如一次配对成 功后续无提交和多次提交后还需人工干涉的配对结果权值相差极大),以此确定 匹配模块提供的匹配结果中各居委会对应属性在相应转换公式下对应的权值;综 合多次的用户行为分析,根据每次检索事件中各居委会对应属性的权值确定下次 相同检索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性 的排序;

代码转换模块,用以根据前期流程的处理结果,本模块提供转换接口,第三 方业务系统通过接口来查询、调用、转换、批处理居委会标准代码;

行政区划模型辅助处理模块,用以提供辅助的信息关联,以使系统具备一定 的扩展能力,除了对于代码的配对转换以外,还可以考虑将行政区划的信息作为 转化配对的要素进行分析;本模块将居委会的行政区划方向类描述转换为详细的 街道、门牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处 理居委行政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处 理;居委模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会 地理信息的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运 算、居委会地标代码和街道镇国标代码的混合使用;

所述算法匹配模块的分词配对方法包括如下步骤:

步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行 分析;

步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种;

步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义;

步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录;

步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示 并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型;

步骤A6、智能或人工审核干涉,形成固定解决方案;

步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容 通过积累,逐步覆盖大部分的业务类型;

所述智能学习模块智能学习的步骤包括:

步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习 库获取一级检索关键字;

步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别检 索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级 检索关键字结合分词法继续分解成下一级别学习检索,转步骤B3;

步骤B3、继续执行步骤B2;

步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给 用户,同时将一级检索关键字与结果关键字进行学习对比,学习存储到智能学习 库;经过大量学习后,以后有用户输入的关键字如果和学习结果一致,能直接检 索出结果;

步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功 越多的级别检索将优先提供给下一次的配对检索。

一种居委标准代码转换系统,所述系统包括:

数据库模块,用以存储设定数据;包括检索历史数据库、居委会标准代码数 据库;历史数据库中存储有检索关键词,以及对应的检索结果,即居委会标准代 码;居委会标准代码数据库存储有居委会标准代码及相关属性;

检索数据获取模块,用以获取检索数据,即检索关键词;

匹配模块,用以将检索关键词与检索历史数据库中的历史检索数据进行匹 配,若检索历史数据库中有与当前检索关键词相同的检索关键词,则输出对应的 检索结果;若没有相同的检索关键词或选择重新匹配,则将检索关键词与居委会 标准代码数据库进行匹配,输出相似度大于设定值的相关数据;

智能学习模块,用以跟踪历史检索事件中用户的行为,根据用户的行为判断 其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各 居委会对应属性在相应检索关键词下对应的权值;综合多次的用户行为分析,根 据每次检索事件中各居委会对应属性的权值确定下次相同检索或检索关键词相 似度在设定值范围内的相似检索中各居委会对应属性的排序。

作为本发明的一种优选方案,居委会的标准代码变化时,由于标准街道名称 不会有变更,代码都会对应街道名称进行更换,对于更换后的历史代码也不会删 除,作为历史记录以供查询。

作为本发明的一种优选方案,所述系统还包括:

算法匹配模块:根据初始处理的数据情况,从所述配对公式库中选择不同的 算法公式,根据不同的数据分类按:中文连续、中文简称、英文完整、英文简称、 数字型、非标自定义这几种类型选择不同的配对算法,异常情况下有提交至人工 处理,通过人工干涉和处理,完成流程,并学习进入配对公式库。

作为本发明的一种优选方案,所述系统还包括:

行政区划模型处理:将居委会的行政区划方向类描述转换为详细的街道、门 牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处理居委行 政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处理;居委 模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会地理信息 的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运算、居委 会地标代码和街道镇国标代码的混合使用;

作为本发明的一种优选方案,所述系统还包括:

居委会标准代码库:提供标准代码的基础数据库,本数据库通过自动爬网适 配器,通过识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代 码,以提供给各业务系统使用。

一种上述居委标准代码转换系统的转换方法,所述方法包括如下步骤:

检索数据获取步骤,检索数据获取模块获取检索数据,即检索关键词;

检索关键词匹配步骤,匹配模块将检索关键词与检索历史数据库中的历史检 索数据进行匹配,若检索历史数据库中有与当前检索关键词相同的检索关键词, 则输出对应的检索结果;若没有相同的检索关键词或选择重新匹配,则将检索关 键词与居委会标准代码数据库进行匹配,输出相似度大于设定值的相关数据;

智能学习步骤,智能学习模块跟踪历史检索事件中用户的行为,根据用户的 行为判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配 结果中各居委会对应属性在相应检索关键词下对应的权值;综合多次的用户行为 分析,根据每次检索事件中各居委会对应属性的权值确定下次相同检索或检索关 键词相似度在设定值范围内的相似检索中各居委会对应属性的排序。

作为本发明的一种优选方案,所述检索关键词匹配步骤中的分词配对方法包 括如下步骤:

步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行 分析;

步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种;

步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义;

步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录;

步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示 并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型;

步骤A6、智能或人工审核干涉,形成固定解决方案;

步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容 通过积累,逐步覆盖大部分的业务类型。

作为本发明的一种优选方案,所述智能学习步骤具体包括:

步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习 库获取一级检索关键字;

步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别检 索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级 检索关键字结合分词法继续分解成下一级别学习检索,转步骤B3;

步骤B3、继续执行步骤B2;

步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给 用户,同时将一级检索关键字与结果关键字进行学习对比,学习存储到智能学习 库;经过大量学习后,以后有用户输入的关键字如果和学习结果一致,能直接检 索出结果;

步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功 越多的级别检索将优先提供给下一次的配对检索。

本发明的有益效果在于:本发明提出的居委标准代码转换系统及方法,可把 原来行政制度作为变更依据的居委会体制,通过信息化手段将变更频繁的居委代 码按统一标准提供给各业务系统,各业务系统可以不需要修改本系统中原有的代 码定义方式,便可直接使用居委标准代码,可以在此基础上实现原来较为复杂的 居委会基础上的信息交互和沟通。

附图说明

图1为本发明居委标准代码转换系统的组成示意图。

图2为本发明中居委会标准代码库的形成示意图。

图3为本发明居委标准代码转换方法的流程图。

图4为本发明中检索词匹配步骤的流程图。

图5为本发明中智能学习步骤的流程图。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例一

建立居委会行政规划模型和其基本代码转换方法,对城市现有和将要建设的 业务信息系统是完全必要的。该模型以数据清洗处理、数据配对、标准代码库、 转换模块和接口、居委会基本信息库、行政区划信息库等模块组成,提供了一种 方便快捷的居委会行政区划代码配对和转换方法。系统学习和收集和整理常用的 业务系统名称,对其中的差异化内容进行比较和配比,使其转换成为标准代码和 名称。

系统收集和导入统计局发布的现有国标(或地方标准)代码,在行政区划有 变动的情况下,自动保留历史记录,实现历史时间轴上的行政区划回溯和对应。

这种实现方法具备通用业务接口,便于其他业务系统接入配对和获取标准区 划代码,实现数据交互。同时可以提供居委会基础信息和行政区划的地理信息的 快速应用。

系统在居委会信息和行政区划发生变更(合并、新建、更名等),可以快速 形成变更预案并记录变更历史。

请参阅图1,本发明揭示了一种居委标准代码转换系统和方法,该系统包括 初始处理模块,算法处理模块,代码转换模块,行政区划模块和相应接口。

初始处理模块:接收服务对象,第三方业务系统的非标居委名称和代码,按 关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相似的案例, 可以直接作为配比方案提供下一流程,如无相似,则自动进行初步处理,并提供 给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案例,达 到系统学习的目的。

算法匹配模块:根据初始处理的数据情况,从配对公式库中选择不同的算法 公司,比如常见的最简单转换公式:原字串+“街道”=>对应标准代码表(将缺 少“街道”的简称如“徐家汇”转化为“徐家汇街道”,获得徐家汇街道的标 准代码310104014输出),根据不同的数据分类可以按:中文连续、中文间称、 英文完整、英文简称、数字型、非标自定义等几种类型选择不同的配对算法,异 常情况下有提交人工处理机制,通过人工干涉和处理,完成流程,并学习进入配 对公式库。

代码转换模块:请参阅图3,根据前期流程的处理结果,本模块提供转换接 口,三方业务系统可以通过接口,快速方便查询、调用、转换、批处理居委会标 准代码。

居委会标准代码库:提供标准代码的基础数据库,本数据库通过自动爬网适 配器,通过定制的页面分析公式,自动从标准代码发布网站导入最新的标准代码, 以提供给各业务系统使用(可参阅图2)。

行政区划模型辅助处理:本模块将通常居委会的行政区划方向类描述,转换 为更详细的街道、门牌、楼宇为界限的信息;并可以处理居委模型所有信息的查 询、和调用;可以处理居委行政区划的合并、拆分、调整等变更,形成变更预案 供业务系统和政府部门预处理。居委模型包括以下子功能:居委会信息的代码地 标和信息系统的转换、居委会地理信息的区划划分、居委会地理信息的采集、居 委会地理信息和人口信息的运算方法、居委会地标代码和街道镇国标代码的混合 使用。

请参阅图4,算法匹配模块的分词配对方法步骤如下:

步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行 分析;

步骤A2、首先系统确定数据的编码为中文、英文和数字;

步骤A3、分析是全称、简称、业务自定义的方式

步骤A4、分析中文数据调用历史库,查询关键字符、历史匹配记录;

步骤A5、是否有类似案例,如果有,可以直接采用;如果没有,系统显示 并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型

步骤A6、智能或工审核干涉,形成固定解决方案

步骤A7、方案记录进入学习历史库,提供给下次选型,历史库的内容通过 积累,可以逐步覆盖大部分的业务类型。

此外,系统需建立三个数据库为基础:检索数据库,存放上海市各区居委名 称(通过标识街道国标区别);检索记忆库,存放用户历史所检索的居委名称(作 为智能学习库和检索数据库的桥梁);智能学习库,存放用户历史所检索的各级 关键字。

请参阅图5,智能学习模块的智能学习步骤具体包括:

步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习 库获取一级检索关键字;

步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别检 索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级 检索关键字结合分词法继续分解成下一级别学习检索;

步骤B3、继续循环步骤B2;

步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给 用户,同时将一级检索关键字与结果关键字进行学习关联,学习存储到智能学习 库。经过大量学习后,以后有用户输入其关键字如果和学习结果一致,能直接检 索出结果

步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功 越多的级别检索将优先提供给下一次的配对检索

实施例二

本发明揭示一种居委标准代码转换系统,所述系统包括:数据库模块、检索 数据获取模块、匹配模块、智能学习模块。

数据库模块用以存储设定数据;包括检索历史数据库、居委会标准代码数据 库;历史数据库中存储有检索关键词,以及对应的检索结果,即居委会标准代码; 居委会标准代码数据库存储有居委会标准代码及相关属性。

检索数据获取模块用以获取检索数据,即检索关键词。

匹配模块用以将检索关键词与检索历史数据库中的历史检索数据进行匹配, 若检索历史数据库中有与当前检索关键词相同的检索关键词,则输出对应的检索 结果;若没有相同的检索关键词或选择重新匹配,则将检索关键词与居委会标准 代码数据库进行匹配,输出相似度大于设定值的相关数据。

智能学习模块用以跟踪历史检索事件中用户的行为,根据用户的行为判断其 对匹配模块提供的匹配结果的满意度,以此确定匹配模块提供的匹配结果中各居 委会对应属性在相应检索关键词下对应的权值;综合多次的用户行为分析,根据 每次检索事件中各居委会对应属性的权值确定下次相同检索或检索关键词相似 度在设定值范围内的相似检索中各居委会对应属性的排序。

以上介绍了本发明居委标准代码转换系统的组成,本发明在揭示上述系统的 同时,还揭示一种上述居委标准代码转换系统的转换方法,所述方法包括如下步 骤:

步骤S1、检索数据获取步骤,检索数据获取模块获取检索数据,即检索关 键词;

步骤S2、检索关键词匹配步骤,匹配模块将检索关键词与检索历史数据库 中的历史检索数据进行匹配,若检索历史数据库中有与当前检索关键词相同的检 索关键词,则输出对应的检索结果;若没有相同的检索关键词或选择重新匹配, 则将检索关键词与居委会标准代码数据库进行匹配,输出相似度大于设定值的相 关数据;

步骤S3、智能学习步骤,智能学习模块跟踪历史检索事件中用户的行为, 根据用户的行为判断其对匹配模块提供的匹配结果的满意度,以此确定匹配模块 提供的匹配结果中各居委会对应属性在相应检索关键词下对应的权值;综合多次 的用户行为分析,根据每次检索事件中各居委会对应属性的权值确定下次相同检 索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性的排序。

实施例三

本发明揭示一种居委标准代码转换系统,将原有的逐个系统人工定制的工作 方式通过本系统的学习记录和匹配流程成为自动化统一方案;系统流程为接收源 数据和转换请求,通过匹配模块对源数据的分析和对比形成配对公式,最终输出 标准代码数据;通过学习模块记录过程和结果公式记录下来,并跟踪用户多次提 交源数据的转换结果确定配对权值。

所述居委标准代码转换系统包括:非标历史学习库、配对公式库、检索记忆 库、居委会标准代码库、智能学习库、初始处理模块、算法匹配模块、智能学习 模块、代码转换模块、行政区划模型辅助处理模块。

非标历史学习库用以记录源数据状态和分析情况,以长度、编码方式、标准 关键字进行记录;供后续配对使用。

配对公式库用以记录结果公式,源数据能通过配对公式转化为标准代码。

检索记忆库用以存放用户历史所检索的居委名称,作为智能学习库和检索数 据库的桥梁。

居委会标准代码库用以提供标准代码的基础数据库,本数据库通过自动爬网 适配器,识别固定的网站标识符,自动从标准代码发布网站导入最新的标准代码, 以提供给各业务系统使用。

智能学习库用以存放用户历史所转换的结果和配对权值。

初始处理模块用以接收服务对象,第三方业务系统的非标居委名称或/和代 码,按关键字、排列、词库的方式进行整理,并在非标历史库中查询,如有相似 的案例,直接作为配比方案提供下一流程,如无相似,则自动进行初步处理,并 提供给人工审核界面,在人工处理完成后记录进入历史库,作为下次处理的案例, 达到系统学习的目的。

算法匹配模块用以根据初始处理的数据情况,从所述配对公式库中选择不同 的算法公式,比如常见的最简单转换公式:原字串+“街道”=>对应标准代码表 (将缺少“街道”的简称如“徐家汇”转化为“徐家汇街道”,获得徐家汇街 道的标准代码310104014输出);根据不同的数据分类按:中文连续、中文简称、 英文完整、英文简称、数字型、非标自定义这几种类型选择不同的配对算法,异 常情况下有提交至人工处理,通过人工干涉和处理,完成流程,并学习进入配对 公式库。

智能学习模块用以跟踪历史申请转换事件中用户的行为,根据用户的提交频 次和人工干涉结果判断其对匹配模块提供的匹配结果的满意度(如一次配对成功 后续无提交和多次提交后还需人工干涉的配对结果权值相差极大),以此确定匹 配模块提供的匹配结果中各居委会对应属性在相应转换公式下对应的权值;综合 多次的用户行为分析,根据每次检索事件中各居委会对应属性的权值确定下次相 同检索或检索关键词相似度在设定值范围内的相似检索中各居委会对应属性的 排序。

代码转换模块用以根据前期流程的处理结果,本模块提供转换接口,第三方 业务系统通过接口来查询、调用、转换、批处理居委会标准代码。

行政区划模型辅助处理模块用以提供辅助的信息关联,以使系统具备一定的 扩展能力,除了对于代码的配对转换以外,还可以考虑将行政区划的信息作为转 化配对的要素进行分析;本模块将居委会的行政区划方向类描述转换为详细的街 道、门牌、楼宇为界限的信息;同时处理居委模型所有信息的查询和调用;处理 居委行政区划的合并、拆分、调整,形成变更预案供业务系统和政府部门预处理; 居委模型包括如下功能:居委会信息的代码地标和信息系统的转换、居委会地理 信息的区划划分、居委会地理信息的采集、居委会地理信息和人口信息的运算、 居委会地标代码和街道镇国标代码的混合使用。

所述算法匹配模块的分词配对方法包括如下步骤:

步骤A1、文字预处理过程、获取需要转换的原始业务系统的居委准备进行 分析;

步骤A2、首先系统确定数据的编码为中文、英文和数字中的哪一种;

步骤A3、分析数据的编码的方式,是全称、简称,还是业务自定义;

步骤A4、分析中文数据调用检索历史库,查询关键字符、历史匹配记录;

步骤A5、判断是否有类似案例,如果有,直接采用;如果没有,系统显示 并提交近似的方案,方案匹配度按编码、定义方式、业务类型的权重不同选型;

步骤A6、智能或人工审核干涉,形成固定解决方案;

步骤A7、方案记录进入学习历史库,提供给下次选型,检索历史库的内容 通过积累,逐步覆盖大部分的业务类型。

所述智能学习模块智能学习的步骤包括:

步骤B1、用户输入设定的关键字作为一级检索关键字进行检索,智能学习 库获取一级检索关键字;

步骤B2、在智能学习库中检索上一步骤所得的级别检索关键字,该级别检 索关键字是否已存在于智能学习库,存在则执行步骤B4;若不存在,则将该级 检索关键字结合分词法继续分解成下一级别学习检索,转步骤B3;

步骤B3、继续执行步骤B2;

步骤B4、将在智能学习库检索到的关键字关联搜索经验库相关记录呈现给 用户,同时将一级检索关键字与结果关键字进行学习对比,学习存储到智能学习 库;经过大量学习后,以后有用户输入的关键字如果和学习结果一致,能直接检 索出结果;

步骤B5、学习成功和配对过程也存储在记忆库中作为加权参数,配对成功 越多的级别检索将优先提供给下一次的配对检索。

综上所述,本发明提出的居委标准代码转换系统及方法,可把原来行政制度 作为变更依据的居委会体制,通过信息化手段将变更频繁的居委代码按统一标准 提供给各业务系统,各业务系统可以不需要修改本系统中原有的代码定义方式, 便可直接使用居委标准代码,可以在此基础上实现原来较为复杂的居委会基础上 的信息交互和沟通。

这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实 施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技 术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚 的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结 构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和 精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号