1.本技术涉及数据处理技术领域,尤其涉及一种营商环境分析系统、方法、计算机设备及存储介质。
背景技术:2.营商环境包括影响企业活动的社会要素、经济要素、政治要素和法律要素等方面,是一项涉及经济社会改革和对外开放众多领域的系统工程。一个地区营商环境的优劣直接影响着招商引资的多寡,同时也直接影响着区域内的经营企业,最终对经济发展状况、财税收入、社会就业情况等产生重要影响。
3.目前全球各个国家都在推动营商环境改革举措。但是,在帮助政府做好营商环境指标量化工作时,政务办公系统会产生大批量的政务基础数据,而目前政务基础数据中存在不少极值数据,目前的算法无法将这些数据找出,再加以排除,以避免其对于最终结果的影响,导致无法有效推动营商环境优化。
技术实现要素:4.本技术提供了一种营商环境分析系统、方法、计算机设备及存储介质。
5.第一方面,本技术提供了一种营商环境分析系统,所述系统包括数据获取模块、数据清洗模块以及数据展示模块;
6.所述数据获取模块用于接入政务办事系统,获取政务办事系统产生基础数据;
7.所述数据清洗模块用于对所述基础数据进行清洗计算,获得结果数据;
8.所述数据展示模块用于将所述结果数据展示在营商环境系统中。
9.可选的,所述基础数据为用户在政务办事系统中办结完成申报事项所产生的有效数据。
10.可选的,所述营商环境分析系统,还包括数据存储模块,所述数据存储模块用于接收所述数据获取模块发送的基础数据。
11.可选的,所述数据获取模块、数据存储模块以及数据清洗模块均位于与所述政务办事系统连接的云端服务器中,所述云端服务器还包括与所述数据清洗模块连接的算法服务模块,所述算法服务模块用于对所述数据清洗模块清洗处理的数据进行二次清洗及计算。
12.可选的,所述数据清洗模块为odps服务,推送至所述数据存储模块的基础数据通过odps服务进行初次清洗,形成初步基础数据。
13.第二发面,本技术还提供了一种营商环境分析方法,所述方法包括以下步骤:
14.获取政务办事系统产生基础数据;
15.将所述基础数据推送至云端服务器的中心数据仓;
16.通过odps服务对同步的所述基础数据进行初次清洗,获得初步基础数据;
17.对所述初步基础数据进行二次清洗及计算,获得结果数据;
18.将所述结果数据展示在营商环境系统中。
19.可选的,所述通过odps服务对同步的所述基础数据进行初次清洗,包括以下步骤:
20.将ddl语句以及同步脚本写入odps的数据开发项,在odps中建表;
21.将所述中心数据仓接收的基础数据同步至odps的建表中;
22.使用odps服务对所述基础数据进行逻辑处理,处理完成后的数据进行回流。
23.可选的,所述使用odps服务对所述基础数据进行逻辑处理,还包括:清除所述基础数据中的无效数据,汇总有效的基础数据并按业务分类提炼到指定的业务表中,并添加操作字段标识。
24.第三发面,本技术还提供了一种计算机设备,所述计算机设备包括:
25.存储器和处理器;
26.其中,所述存储器与所述处理器连接,用于存储程序;
27.所述处理器用于通过运行所述存储器中存储的程序,实现如本技术实施例提供的任一项所述的营商环境分析方法的步骤。
28.第四发面,本技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如本技术实施例提供的任一项所述的营商环境分析方法的步骤。
29.本技术公开的营商环境分析系统、方法、计算机设备及存储介质,通过将政务办事系统产生数据推送到在云端的大数据中心数据仓,在经过odps服务清洗数据,算法服务二次清洗、计算,再将最终结果数据展示在营商环境系统中,为营商环境优化提供数据支撑以及引导改革方向。
30.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
31.为了更清楚地说明本技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1是本技术的实施例提供的一种营商环境分析系统的系统框图;
33.图2是本技术的实施例提供的一种营商环境分析系统中云服务平台的系统框图;
34.图3是本技术的实施例提供的一种营商环境分析方法的流程图;
35.图4是本技术的实施例提供的一种营商环境分析方法中odps服务清洗数据的流程图;
36.图5是本技术的实施例提供的一种营商环境分析方法的步骤示意图。
37.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
具体实施方式
38.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本申
请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
39.附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
40.应当理解,在此本技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本技术。如在本技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
41.应当理解,为了便于清楚描述本技术实施例的技术方案,在本技术的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一回调函数和第二回调函数仅仅是为了区分不同的回调函数,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
42.还应当进理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
43.目前全球各个国家都在推动营商环境改革举措。但是,在帮助政府做好营商环境指标量化工作时,政务办公系统会产生大批量的政务基础数据,而目前政务基础数据中存在不少极值数据,目前的算法无法将这些数据找出,再加以排除,以避免其对于最终结果的影响,导致无法有效推动营商环境优化。
44.为此,本技术的实施例提供了一种营商环境分析方法、计算机设备和存储介质。可以将政务基础数据中存在的不少极值数据找出,再加以排除,避免其对于最终结果的影响。
45.需要说明的是,本技术实施例将以政府各项办事数据为例进行介绍。下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
46.参见图1所示,图1为本技术实施例提供的一种营商环境分析系统的结构框图,该营商环境分析系统包括数据获取模块201、数据清洗模块203以及数据展示模块205。
47.在本技术的实施例中,所述数据获取模块201用于接入政务办事系统10,获取政务办事系统10产生基础数据。
48.具体的,所述基础数据为用户在政务办事系统10中办结完成申报事项所产生的有效数据。
49.参见图2所示,所述政务办事系统10负责产生原始数据,企业用户在政务办事系统中申报所办事项,最终成功办结事项后产生有效数据作为基础数据。其中,所述政务办事系统10还提供有系统功能管理、用户管理、角色管理等功能为企业用户申报政务事项提供支撑。
50.所述数据清洗模块203用于对所述基础数据进行清洗计算,获得结果数据。
51.在一些实施例中,所述营商环境分析系统,还包括数据存储模块202,所述数据存储模块202用于接收所述数据获取模块201发送的基础数据。
52.其中,所述数据获取模块201、数据存储模块202以及数据清洗模块203均位于与所述政务办事系统10连接的云端服务器20中,所述云端服务器20还包括与所述数据清洗模块
203连接的算法服务模块204,所述算法服务模块204用于对所述数据清洗模块203清洗处理的数据进行二次清洗及计算。
53.在一些实施例中,所述数据清洗模块203为odps服务,推送至所述数据存储模块202的基础数据通过odps服务进行初次清洗,形成初步基础数据。
54.所述数据展示模块205用于将所述结果数据展示在营商环境系统中。
55.在进行营商环境分析时,政务办事系统10产生数据,推送到在云端服务器20的大数据中心数据仓,即数据存储模块202,在经过odps服务清洗数据,算法服务模块204二次清洗、计算,再将最终结果数据通过数据展示模块205展示在营商环境系统中。
56.在本技术的实施例中,所述政务办事系统10用于负责产生数据,所述中心数据仓用于负责归集汇总数据,odps服务初次清洗数据;算法服务做二次清洗、计算;营商环境系统负责展示结果数据。
57.在一些实施例中,所述数据展示模块205负责将最终计算得出的结果数据展示出来,还用于提供图表用作分析总结,进一步为营商环境优化提供数据支撑以及引导改革方向。
58.本技术的营商环境分析系统,通过将政务办事系统、中心数据仓以及算法服务三部分结合起来,分别实现原始数据的产生、过程数据的加工以及结果数据的展示,并且加入了odps服对基础数据初步清洗,为后续的算法服务清洗加工数据,做了前置清洗,降低了算法服务的清洗难度以及清洗压力,有助于为营商环境优化提供数据支撑以及引导改革方向。
59.请参阅图3,图3是本技术实施例提供的一种营商环境分析方法的流程图。
60.本技术实施例还提供一种营商环境分析方法,该营商环境分析方法包括步骤s10至步骤s50。
61.s10、获取政务办事系统产生基础数据;
62.s20、将所述基础数据推送至云端服务器的中心数据仓;
63.s30、通过odps服务对同步的所述基础数据进行初次清洗,获得初步基础数据。
64.s40、对所述初步基础数据进行二次清洗及计算,获得结果数据;
65.s50、将所述结果数据展示在营商环境系统中。
66.在本技术的实施例中,通过获取政务办事系统产生的大批量的政务基础数据,转化为每个指标的量化数据,再通过比较这些量化数据,反推出提高营商环境过程中的不足之处,加以改善,提高营商环境质量。
67.而目前政务基础数据中存在不少极值数据,需要将这些数据找出,再加以排除,避免其对于最终结果的影响。
68.示例性的,在本技术的实施例中,以一级指标开办企业的一个二级指标为例,将数据量化的方法,包括以下步骤:
69.1)过滤出公司注册、公章刻制、公章备案、税务登记、参保登记、公积金登记的受理时间、办结时间不为空、办结时间大于受理时间且是指定年份的数据。
70.2)找出每条数据最大的受理时间和最小的受理时间,过滤出最大受理时间和最小受理时间在同一天的数据。
71.3)计算出每条数据的最大办结时间减最小受理时间,并且过滤掉平均值大于12的
数据。
72.4)根据企业社会代码的第3到8位分组,求最大办结时间减最小受理时间的平均值,并将平均值小数取整,小数大于0.5的向上取整,小数等于0.5的不变,小数小于0.5的向下取整,整数不变。这样就得出来浙江省各省市县的开办企业时间这个指标的量化数据。
73.而本技术中,由政务办事系统产生数据,推送到在云端的大数据中心数据仓,在经过odps服务清洗数据,算法服务二次清洗、计算,再将最终结果数据展示在营商环境系统中。
74.在一些实施例中,参见图4所示,所述通过odps服务对同步的所述基础数据进行初次清洗,包括以下步骤:
75.s301、将ddl语句以及同步脚本写入odps的数据开发项,在odps中建表;
76.s302、将所述中心数据仓接收的基础数据同步至odps的建表中;
77.s303、使用odps服务对所述基础数据进行逻辑处理,处理完成后的数据进行回流。
78.在本技术的实施例中,odps服务采用阿里研发的数据处理服务,odps构架分为四层,分别是客户端、接入层、逻辑层和计算层。
79.其中,客户端:odps以restful api方式对外提供服务,用户可以通过不同的方式来使用odps的服务,包括直接通过restful api请求访问、odps sdk、odps clt(command line tool)、java集成开发环境和管理控制台等。
80.本技术是通过dataworks来操作odps的也就是管理控制台的方式政务基础数据由政务系统和大数据局的odps进行对接通过前置机推送或odps定时任务同步至中心数据仓;
81.所述接入层用于dataworks内部封装调用,本技术专利不涉及;
82.所述逻辑层用于接收用户来自客户端的操作,逐一经过请求处理器、调度器、作业执行管理器等环节最终对计算层下达执行用户操作的信息;所述计算层则是用于执行具体sql或存储过程的。
83.在本技术的实施例中,使用odps对数据进行初步清洗的工作过程如下:
84.1)在进行数据清洗之前,将数据同步到odps中;
85.2)在同步之前,首先在odps里建表,建表采用ddl语句以及同步脚本都写在数据开发里,而临时查询用于写测试sql。
86.3)使用odps的sql语法或者存储过程等手段对基础数据进行逻辑处理。
87.4)处理完成之后再做数据回流,数据回流操作与数据同步操作类似,只是源和宿不同;本技术在同步到mysql时,增加前置任务,例如:在同步到mysql之前需要先清空表或者额外添加一些标志字段等等。
88.在本技术的实施例中,同步到mysql时,与配置数据同步的任务相似,通过配置odps的定时任务实现的,配置时,数据源和目标数据相反;增加前置任务的方式也是配置odps定时任务,在数据同步的任务执行之前,配置另外的定时任务完成我们对库表的操作。例如全量操作之前,会提前对表进行清空;增量操作时,会提前处理删除一些冗余数据,或者对已有数据进行打标识处理,以便后续数据入库时做增量更新。
89.在本技术的实施例中,逻辑处理主要做的事有以下两点:1、清除无效数据,例如:状态标志位有误,或者关键字段缺失或存在无法甄别的字典值等;2、将汇总的基础数据按业务分类提炼到指定的业务表中,并且该步骤会添加一些操作相关的字段,例如:同步人、
同步时间、同步方式等等。
90.在逻辑处理时,逻辑处理前后将一些无效数据过滤掉并且数据加工到对应的业务表中。
91.所述使用odps服务对所述基础数据进行逻辑处理,还包括:清除所述基础数据中的无效数据,汇总有效的基础数据并按业务分类提炼到指定的业务表中,并添加操作字段标识。
92.参见图5所示,企业用户在政务办事系统中申报所办事项,最终成功办结事项后产生有效数据,定时将有效数据推送到在云端的大数据中心数据仓的指定库表,再将数据用odps服务进行清洗加工,形成初步基础数据,再通过算法服务进行二次清洗、计算,最后将结果数据展示在营商环境系统中。
93.本技术通过将政务办事系统10产生数据推送到在云端的大数据中心数据仓,在经过odps服务清洗数据,算法服务二次清洗、计算,再将最终结果数据展示在营商环境系统中,为营商环境优化提供数据支撑以及引导改革方向。
94.本技术实施例还提供本技术还提供了一种计算机设备,所述计算机设备包括:存储器和处理器;其中,所述存储器与所述处理器连接,用于存储程序;所述处理器用于通过运行所述存储器中存储的程序,实现如本技术实施例提供的任一项所述的营商环境分析方法的步骤:
95.获取政务办事系统10产生基础数据;
96.将所述基础数据推送至云端服务器20的中心数据仓;
97.通过odps服务对同步的所述基础数据进行初次清洗,获得初步基础数据;
98.对所述初步基础数据进行二次清洗及计算,获得结果数据;
99.将所述结果数据展示在营商环境系统中。
100.在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由asic、fpga、dsp等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
101.所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、pda等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloud computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本技术,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本技术。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、vpn网络等。
102.本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述实施例提供的营商环境分析方法的步骤:
103.获取政务办事系统10产生基础数据;
104.将所述基础数据推送至云端服务器20的中心数据仓;
105.通过odps服务对同步的所述基础数据进行初次清洗,获得初步基础数据;
106.对所述初步基础数据进行二次清洗及计算,获得结果数据;
107.将所述结果数据展示在营商环境系统中。
108.其中,所述计算机可读存储介质可以是前述任一实施例所述的计算机设备的内部存储单元,例如所述终端设备的硬盘或内存。所述计算机可读存储介质也可以是所述终端设备的外部存储设备,例如所述终端设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
109.综上所述,本技术公开的营商环境分析系统、方法、计算机设备及存储介质,通过将政务办事系统10产生数据推送到在云端的大数据中心数据仓,在经过odps服务清洗数据,算法服务二次清洗、计算,再将最终结果数据展示在营商环境系统中,为营商环境优化提供数据支撑以及引导改革方向。
110.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:1.一种营商环境分析系统,其特征在于,所述系统包括数据获取模块、数据清洗模块以及数据展示模块;所述数据获取模块用于接入政务办事系统,获取政务办事系统产生基础数据;所述数据清洗模块用于对所述基础数据进行清洗计算,获得结果数据;所述数据展示模块用于将所述结果数据展示在营商环境系统中。2.根据权利要求1所述的系统,其特征在于,所述基础数据为用户在政务办事系统中办结完成申报事项所产生的有效数据。3.根据权利要求1或2所述的系统,其特征在于,所述营商环境分析系统,还包括数据存储模块,所述数据存储模块用于接收所述数据获取模块发送的基础数据。4.根据权利要求3所述的系统,其特征在于,所述数据获取模块、数据存储模块以及数据清洗模块均位于与所述政务办事系统连接的云端服务器中,所述云端服务器还包括与所述数据清洗模块连接的算法服务模块,所述算法服务模块用于对所述数据清洗模块清洗处理的数据进行二次清洗及计算。5.根据权利要求1所述的系统,其特征在于,所述数据清洗模块为odps服务,推送至所述数据存储模块的基础数据通过odps服务进行初次清洗,形成初步基础数据。6.一种营商环境分析方法,其特征在于,应用于如权利要求1-5任一所述的营商环境分析系统中,所述营商环境分析方法包括以下步骤:获取政务办事系统产生基础数据;将所述基础数据推送至云端服务器的中心数据仓;通过odps服务对同步的所述基础数据进行初次清洗,获得初步基础数据;对所述初步基础数据进行二次清洗及计算,获得结果数据;将所述结果数据展示在营商环境系统中。7.根据权利要求6所述的方法,其特征在于,所述通过odps服务对同步的所述基础数据进行初次清洗,包括以下步骤:将ddl语句以及同步脚本写入odps的数据开发项,在odps中建表;将所述中心数据仓接收的基础数据同步至odps的建表中;使用odps服务对所述基础数据进行逻辑处理,处理完成后的数据进行回流。8.根据权利要求7所述的方法,其特征在于,所述使用odps服务对所述基础数据进行逻辑处理,还包括:清除所述基础数据中的无效数据,汇总有效的基础数据并按业务分类提炼到指定的业务表中,并添加操作字段标识。9.一种计算机设备,其特征在于,所述计算机设备包括:存储器和处理器;其中,所述存储器与所述处理器连接,用于存储程序;所述处理器用于通过运行所述存储器中存储的程序,实现如权利要求6-8中任一项所述的营商环境分析方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求6-8中任一项所述的营商环境分析方法的步骤。
技术总结本申请提供一种营商环境分析系统、方法、计算机设备及存储介质,该方法包括:获取政务办事系统产生基础数据;将所述基础数据推送至云端服务器的中心数据仓;通过ODPS服务对同步的所述基础数据进行初次清洗,获得初步基础数据;对所述初步基础数据进行二次清洗及计算,获得结果数据;将所述结果数据展示在营商环境系统中。本申请公开的营商环境分析系统、方法、计算机设备及存储介质,通过将政务办事系统产生数据推送到在云端的大数据中心数据仓,在经过ODPS服务清洗数据,算法服务二次清洗、计算,再将最终结果数据展示在营商环境系统中,为营商环境优化提供数据支撑以及引导改革方向。商环境优化提供数据支撑以及引导改革方向。商环境优化提供数据支撑以及引导改革方向。
技术研发人员:冯锐 郑怡 王晓君 刘淑颖 经博源 庄跃成 朱思橙 谈捷 刘立波
受保护的技术使用者:有谦软联(北京)信息技术有限公司
技术研发日:2022.03.29
技术公布日:2022/7/5