1.本发明涉及机器学习技术领域,尤其涉及一种基于机器学习的数据安全交换系统及方法。
背景技术:2.近年来,机器学习迅速地发展,给人们带来便利的同时,也带来极大的安全隐患.机器学习的安全与隐私问题已经成为其发展的绊脚石,机器学习模型的训练和预测均是基于大量的数据。
3.中国专利公开号:cn 108306891 a。提供一种使用待交换数据来执行机器学习的方法、设备和系统。所述设备包括:初次加密数据接收单元,被配置为分别从第一数据提供方接收第一初次加密结果数据和从第二数据提供方接收第二初次加密结果数据;初次加密数据发送单元,被配置为分别将第一初次加密结果数据发送到第二数据提供方和将第二初次加密结果数据发送到第一数据提供方;再次加密数据接收单元,被配置为分别从第一数据提供方接收第二再次加密结果数据和从第二数据提供方接收第一再次加密结果数据;以及机器学习执行单元,被配置为获取机器学习样本,并基于机器学习样本来执行机器学习。当大量影响学习的数据录入时该方法并不能很好的限制数据录入,当录入的数据存有主动引诱学习方向的数据时,并不能对该类数据进行很好的限制。
技术实现要素:4.为此,本发明提供一种基于机器学习的数据安全交换系统及方法,用以克服现有技术中当录入的数据存有主动引诱学习方向的数据时,并不能对该类数据进行很好的限制的问题。
5.为实现上述目的,本发明提供一种基于机器学习的数据安全交换系统。
6.内设数据存储模块,用以存储进行机器学习的数据,
7.自主学习模块,其与所述内设数据存储模块相连,用以对存储的数据进行自主机器学习;
8.数据抓取模块,其与外部数据库相连,用以获取外部数据的请求录入信息;
9.数据判定模块,其与所述数据抓取模块相连,用以对请求录入的数据进行安全判断,对于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块,所述自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果;
10.安全判断包括危险数据信息判断,敏感数据信息判断和解码验证。
11.进一步地,所述数据判定模块内设置有危险数据标记信息组a0,所述危险数据标记信息组a0包括:第一危险数据信息a1、第二危险数据信息a2、...第n危险数据信息an,n为正整数;
12.所述数据抓取模块与外部数据库相连,当外部数据库存有拟学习数据b0请求录入
内设数据存储模块时,所述数据抓取模块拟学习数据b0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据b0进行分析,判断拟学习数据b0是否存有危险数据信息,
13.当拟学习数据b0中存有第i危险数据信息ai时,所述数据判定模块判定拟学习数据b0存在安全风险;
14.当拟学习数据b0中不存在任何危险数据标记信息组a0内数据时,所述数据判定模块对拟学习数据b0进行二级风险分析。
15.进一步地,所述数据判定模块内设置有敏感标记信息组c0,所述敏感标记信息组c0包括,第一敏感标记c1,第二敏感标记c2,...第m敏感标记cm,m为正整数;
16.所述数据判定模块对拟学习数据b0进行进行二级风险分析,获取拟学习数据b0的敏感标记数量e,数据判定模块根据拟学习数据b0的敏感标记数量e计算拟学习数据b0的危险价值zb,zb=e
×
p,其中,p为拟学习数据危险价值计算补偿参数;
17.所述数据判定模块内设置有危险价值评价值zp,数据判定模块将危险价值zb与危险价值评价值zp进行对比,
18.当zb≤zp时,所述数据判定模块判定拟学习数据b0危险价值低;
19.当zb>zp时,所述数据判定模块判定拟学习数据b0危险价值高,拟学习数据b0存在安全风险。
20.进一步地,所述数据判定模块设置有第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2,第一预设危险价值计算补偿参数p1,第二预设危险价值计算补偿参数p2,第三预设危险价值计算补偿参数p3,数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2进行对比,
21.当e≤e1时,所述数据判定模块将第一预设危险价值计算补偿参数p1作为拟学习数据危险价值计算补偿参数p的数值;
22.当e1<e≤e2时,所述数据判定模块将第二预设危险价值计算补偿参数p2作为拟学习数据危险价值计算补偿参数p的数值;
23.当e>e2时,所述数据判定模块将第三预设危险价值计算补偿参数p3作为拟学习数据危险价值计算补偿参数p的数值。
24.进一步地,对于任一请求录入内设数据存储模块的拟学习数据b0,其自身附带唯一指定信息编码g,所述数据判定模块内设有解码程序,所述数据判定模块判定拟学习数据b0危险价值低时,数据判定模块对信息编码g进行解码,获取拟学习数据b0的请求码gz,数据判定模块对请求码gz进行验证;
25.验证成功,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;
26.验证失败,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
27.进一步地,当所述数据判定模块对请求码gz验证成功时,所述数据判定模块内根据请求码gz判断拟学习数据b0的学习等级,学习等级包括第一等级s1,第二等级s2,第三等级s3,不同等级确定不同的学习效果;
28.当所述数据判定模块判定拟学习数据b0的学习等级为第一等级s1时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为1;
29.当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.6;
30.当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.3。
31.进一步地,所述数据判定模块设置有第二等级数据量占比评价值k2和第三等级数据量占比评价值k3
32.当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述数据判定模块获取内设数据存储模块中第二等级的数据量占比z2,并将z2与第二等级数据量占比评价值k2对比,
33.当z2≤k2时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;
34.当z2>k2时,所述数据判定模块判定内设数据存储模块中第二等级的数据量占比过大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
35.进一步地,当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述数据判定模块获取内设数据存储模块中第三等级的数据量占比z3,并将z3与第三等级数据量占比评价值k3对比,
36.当z3≤k3时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;
37.当z3>k3时,所述数据判定模块判定内设数据存储模块中第三等级的数据量占比过大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
38.进一步地,当所述数据判定模块判定拟学习数据b0危险价值高时,数据判定模块对拟学习数据b0的数据来源信息进行获取,并将获取结果补充至敏感标记信息组c0中。
39.一种基于机器学习的数据安全交换方法,应用于上述基于机器学习的数据安全交换系统,包括,
40.s1,判定请求录入数据是否存在危险信息,拒绝存在危险信息的数据录入;
41.s2,判定请求录入数据的敏感信息数量,并根据敏感信息判定请求数据是否安全;
42.s3,对于危险价值低的请求数据进行指定信息编码解码,根据解码结果进行学习验证;
43.s4,对于验证成功的数据,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据;
44.s5,对录入的请求数据进行机器学习,并根据学习等级确定学习效果。
45.学习效果指在学习完成后对自学习过程的可信度和修正范围,例如,当对自主运行设备的位置进行修正时,当计算的修正值为1时,若拟学习数据b0的学习等级为第一等级s1时,则实际修正值为1,若拟学习数据b0的学习等级为第二等级s2时,则实际修正值为0.6,若拟学习数据b0的学习等级为第三等级s3时,则实际修正值为0.3。
46.与现有技术相比,本发明的有益效果在于,通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性,同时,对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。
47.进一步地,所述数据判定模块内设置有危险数据标记信息组a0,所述数据抓取模
块与外部数据库相连,当外部数据库存有拟学习数据b0请求录入内设数据存储模块时,所述数据抓取模块拟学习数据b0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据b0进行分析,判断拟学习数据b0是否存有危险数据信息,通过录入风险信息初步进行危险评判,初步快速筛选录入信息,增加数据录入判定速度。
48.进一步的,所述数据判定模块内设置有敏感标记信息组c0,所述数据判定模块对拟学习数据b0进行进行二级风险分析,获取拟学习数据b0的敏感标记数量e,数据判定模块根据拟学习数据b0的敏感标记数量e计算拟学习数据b0的危险价值zb,通过拟学习数据的敏感信息数量判定数据是否存在风险,敏感数据多时,判定风险等级高,防止危险数据录入;敏感数据低时,判定风险等级低,防止遗失数据。
49.进一步的,敏感数据越多,计算补偿参数越大,增加评判的准确性。
50.进一步的,当所述数据判定模块对请求码gz验证成功时,所述数据判定模块内根据请求码gz判断拟学习数据b0的学习等级,学习等级包括第一等级s1,第二等级s2,第三等级s3,不同等级确定不同的学习效果,通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性。
51.进一步的,所述数据判定模块设置有第二等级数据量占比评价值k2,当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述数据判定模块获取内设数据存储模块中第二等级的数据量占比z2,并将z2与第二等级数据量占比评价值k2对比,对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。
附图说明
52.图1为本实施例基于机器学习的数据安全交换系统的结构示意图;
53.图2为本实施基于机器学习的数据安全交换方法的流程图。
具体实施方式
54.为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
55.下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
56.需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
57.此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
58.请参阅图1所示,图1为本实施例基于机器学习的数据安全交换系统的结构示意
图。
59.本发明提供一种基于机器学习的数据安全交换系统。
60.内设数据存储模块,用以存储进行机器学习的数据,
61.自主学习模块,其与所述内设数据存储模块相连,用以对存储的数据进行自主机器学习;
62.数据抓取模块,其与外部数据库相连,用以获取外部数据的请求录入信息;
63.数据判定模块,其与所述数据抓取模块相连,用以对请求录入的数据进行安全判断,对于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块,所述自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果;
64.安全判断包括危险数据信息判断,敏感数据信息判断和解码验证;
65.在进行数据录入前,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据。
66.通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性,同时,对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。
67.具体而言,所述数据判定模块内设置有危险数据标记信息组a0,所述危险数据标记信息组a0包括:第一危险数据信息a1、第二危险数据信息a2、...第n危险数据信息an,n为正整数;
68.所述数据抓取模块与外部数据库相连,当外部数据库存有拟学习数据b0请求录入内设数据存储模块时,所述数据抓取模块拟学习数据b0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据b0进行分析,判断拟学习数据b0是否存有危险数据信息,
69.当拟学习数据b0中存有第i危险数据信息ai时,所述数据判定模块判定拟学习数据b0存在安全风险;
70.当拟学习数据b0中不存在任何危险数据标记信息组a0内数据时,所述数据判定模块对拟学习数据b0进行二级风险分析。
71.通过录入风险信息初步进行危险评判,初步快速筛选录入信息,增加数据录入判定速度。
72.具体而言,所述数据判定模块内设置有敏感标记信息组c0,所述敏感标记信息组c0包括,第一敏感标记c1,第二敏感标记c2,...第m敏感标记cm,m为正整数;
73.所述数据判定模块对拟学习数据b0进行进行二级风险分析,获取拟学习数据b0的敏感标记数量e,数据判定模块根据拟学习数据b0的敏感标记数量e计算拟学习数据b0的危险价值zb,zb=e
×
p,其中,p为拟学习数据危险价值计算补偿参数;
74.所述数据判定模块内设置有危险价值评价值zp,数据判定模块将危险价值zb与危险价值评价值zp进行对比,
75.当zb≤zp时,所述数据判定模块判定拟学习数据b0危险价值低;
76.当zb>zp时,所述数据判定模块判定拟学习数据b0危险价值高,拟学习数据b0存在安全风险。
77.通过拟学习数据的敏感信息数量判定数据是否存在风险,敏感数据多时,判定风险等级高,防止危险数据录入;敏感数据低时,判定风险等级低,防止遗失数据。
78.具体而言,所述数据判定模块设置有第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2,第一预设危险价值计算补偿参数p1,第二预设危险价值计算补偿参数p2,第三预设危险价值计算补偿参数p3,数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2进行对比,p1<p2<p3,e1<e2;
79.当e≤e1时,所述数据判定模块将第一预设危险价值计算补偿参数p1作为拟学习数据危险价值计算补偿参数p的数值;
80.当e1<e≤e2时,所述数据判定模块将第二预设危险价值计算补偿参数p2作为拟学习数据危险价值计算补偿参数p的数值;
81.当e>e2时,所述数据判定模块将第三预设危险价值计算补偿参数p3作为拟学习数据危险价值计算补偿参数p的数值。
82.敏感数据越多,计算补偿参数越大,增加评判的准确性。
83.具体而言,对于任一请求录入内设数据存储模块的拟学习数据b0,其自身附带唯一指定信息编码g,所述数据判定模块内设有解码程序,所述数据判定模块判定拟学习数据b0危险价值低时,数据判定模块对信息编码g进行解码,获取拟学习数据b0的请求码gz,数据判定模块对请求码gz进行验证;
84.验证成功,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;
85.验证失败,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
86.具体而言,当所述数据判定模块对请求码gz验证成功时,所述数据判定模块内根据请求码gz判断拟学习数据b0的学习等级,学习等级包括第一等级s1,第二等级s2,第三等级s3,不同等级确定不同的学习效果;
87.当所述数据判定模块判定拟学习数据b0的学习等级为第一等级s1时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为1;
88.当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.6;
89.当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.3。
90.学习等级评价由数据来源和数据中含有的敏感信息数量确定。
91.通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性。
92.具体而言,所述数据判定模块设置有第二等级数据量占比评价值k2和第三等级数据量占比评价值k3
93.当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述数据判定模块获取内设数据存储模块中第二等级的数据量占比z2,并将z2与第二等级数据量占比评价值k2对比,
94.当z2≤k2时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,
所述自主学习模块对拟学习数据b0进行机械学习;
95.当z2>k2时,所述数据判定模块判定内设数据存储模块中第二等级的数据量占比过大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
96.具体而言,当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述数据判定模块获取内设数据存储模块中第三等级的数据量占比z3,并将z3与第三等级数据量占比评价值k3对比,
97.当z3≤k3时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;
98.当z3>k3时,所述数据判定模块判定内设数据存储模块中第三等级的数据量占比过大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。
99.对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。
100.具体而言,当所述数据判定模块判定拟学习数据b0危险价值高时,数据判定模块对拟学习数据b0的数据来源信息进行获取,并将获取结果补充至敏感标记信息组c0中。不断丰富敏感信息库,使得录入的数据更加安全。
101.请继续参阅图2,图2为本实施基于机器学习的数据安全交换方法的流程图
102.本发明还公布,一种基于机器学习的数据安全交换方法,应用于上述基于机器学习的数据安全交换系统,包括,
103.s1,判定请求录入数据是否存在危险信息,拒绝存在危险信息的数据录入;
104.s2,判定请求录入数据的敏感信息数量,并根据敏感信息判定请求数据是否安全;
105.s3,对于危险价值低的请求数据进行指定信息编码解码,根据解码结果进行学习验证;
106.s4,对于验证成功的数据,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据;
107.s5,对录入的请求数据进行机器学习,并根据学习等级确定学习效果。
108.至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
技术特征:1.一种基于机器学习的数据安全交换系统,其特征在于,包括,内设数据存储模块,用以存储进行机器学习的数据,自主学习模块,其与所述内设数据存储模块相连,用以对存储的数据进行自主机器学习;数据抓取模块,其与外部数据库相连,用以获取外部数据的请求录入信息;数据判定模块,其与所述数据抓取模块相连,用以对请求录入的数据进行安全判断,对于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块,所述自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果;安全判断包括危险数据信息判断,敏感数据信息判断和解码验证;在进行数据录入前,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据。2.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块内设置有危险数据标记信息组a0,所述危险数据标记信息组a0包括:第一危险数据信息a1、第二危险数据信息a2、...第n危险数据信息an,n为正整数;所述数据抓取模块与外部数据库相连,当外部数据库存有拟学习数据b0请求录入内设数据存储模块时,所述数据抓取模块拟学习数据b0进行抓取,并将数据传递至所述数据判定模块,所述数据判定模块对拟学习数据b0进行分析,判断拟学习数据b0是否存有危险数据信息,当拟学习数据b0中存有第i危险数据信息ai时,所述数据判定模块判定拟学习数据b0存在安全风险;当拟学习数据b0中不存在任何危险数据标记信息组a0内数据时,所述数据判定模块对拟学习数据b0进行二级风险分析。3.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块内设置有敏感标记信息组c0,所述敏感标记信息组c0包括,第一敏感标记c1,第二敏感标记c2,...第m敏感标记cm,m为正整数;所述数据判定模块对拟学习数据b0进行进行二级风险分析,获取拟学习数据b0的敏感标记数量e,数据判定模块根据拟学习数据b0的敏感标记数量e计算拟学习数据b0的危险价值zb,zb=e
×
p,其中,p为拟学习数据危险价值计算补偿参数;所述数据判定模块内设置有危险价值评价值zp,数据判定模块将危险价值zb与危险价值评价值zp进行对比,当zb≤zp时,所述数据判定模块判定拟学习数据b0危险价值低;当zb>zp时,所述数据判定模块判定拟学习数据b0危险价值高,拟学习数据b0存在安全风险。4.根据权利要求1所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块设置有第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2,第一预设危险价值计算补偿参数p1,第二预设危险价值计算补偿参数p2,第三预设危险价值计算补偿参数p3,数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数e1,第二预设敏感标记数量评价参数e2进行对比,
当e≤e1时,所述数据判定模块将第一预设危险价值计算补偿参数p1作为拟学习数据危险价值计算补偿参数p的数值;当e1<e≤e2时,所述数据判定模块将第二预设危险价值计算补偿参数p2作为拟学习数据危险价值计算补偿参数p的数值;当e>e2时,所述数据判定模块将第三预设危险价值计算补偿参数p3作为拟学习数据危险价值计算补偿参数p的数值。5.根据权利要求4所述的基于机器学习的数据安全交换系统,其特征在于,对于任一请求录入内设数据存储模块的拟学习数据b0,其自身附带唯一指定信息编码g,所述数据判定模块内设有解码程序,所述数据判定模块判定拟学习数据b0危险价值低时,数据判定模块对信息编码g进行解码,获取拟学习数据b0的请求码gz,数据判定模块对请求码gz进行验证;验证成功,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;验证失败,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。6.根据权利要求5所述的基于机器学习的数据安全交换系统,其特征在于,当所述数据判定模块对请求码gz验证成功时,所述数据判定模块内根据请求码gz判断拟学习数据b0的学习等级,学习等级包括第一等级s1,第二等级s2,第三等级s3,不同等级确定不同的学习效果;当所述数据判定模块判定拟学习数据b0的学习等级为第一等级s1时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为1;当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.6;当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述自主学习模块对拟学习数据b0进行机械学习时,学习效果为0.3。7.根据权利要求6所述的基于机器学习的数据安全交换系统,其特征在于,所述数据判定模块设置有第二等级数据量占比评价值k2和第三等级数据量占比评价值k3当所述数据判定模块判定拟学习数据b0的学习等级为第二等级s2时,所述数据判定模块获取内设数据存储模块中第二等级的数据量占比z2,并将z2与第二等级数据量占比评价值k2对比,当z2≤k2时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;当z2>k2时,所述数据判定模块判定内设数据存储模块中第二等级的数据量占比过大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。8.根据权利要求7所述的基于机器学习的数据安全交换系统,其特征在于,当所述数据判定模块判定拟学习数据b0的学习等级为第三等级s3时,所述数据判定模块获取内设数据存储模块中第三等级的数据量占比z3,并将z3与第三等级数据量占比评价值k3对比,当z3≤k3时,所述数据判定模块同意拟学习数据b0录入所述内设数据存储模块,所述自主学习模块对拟学习数据b0进行机械学习;当z3>k3时,所述数据判定模块判定内设数据存储模块中第三等级的数据量占比过
大,所述数据判定模块拒绝拟学习数据b0录入所述内设数据存储模块。9.根据权利要求3所述的基于机器学习的数据安全交换系统,其特征在于,当所述数据判定模块判定拟学习数据b0危险价值高时,数据判定模块对拟学习数据b0的数据来源信息进行获取,并将获取结果补充至敏感标记信息组c0中。10.一种基于机器学习的数据安全交换方法,应用于权利要求1-9任一项所述基于机器学习的数据安全交换系统,其特征在于,包括,s1,判定请求录入数据是否存在危险信息,拒绝存在危险信息的数据录入;s2,判定请求录入数据的敏感信息数量,并根据敏感信息判定请求数据是否安全;s3,对于危险价值低的请求数据进行指定信息编码解码,根据解码结果进行学习验证;s4,对于验证成功的数据,判定数据的学习等级,并对内设数据存储模块内存储的数据占比确定是否录入请求数据;s5,对录入的请求数据进行机器学习,并根据学习等级确定学习效果。
技术总结本发明涉及机器学习技术领域,尤其涉及一种基于机器学习的数据安全交换系统,系统包括,内设数据存储模块、自主学习模块、数据抓取模块、数据判定模块,数据判定模块用以对请求录入的数据进行安全判断,对于判定合格的数据数据判定模块将请求录入的数据传递至内设数据存储模块,自主学习模块对录入的数据进行机器学习,学习过程中设置有学习等级,不同的学习等级对应不同学习效果。本发明通过设置学习等级确定不同的学习效果,减小可疑数据的学习效果的影响,增加自主学习的准确性,同时,对于低质量的学习数据设置数据占比,限定低质量数据的录入,减小低等级数据对自主学习的影响。减小低等级数据对自主学习的影响。减小低等级数据对自主学习的影响。
技术研发人员:杨莹 赵春健
受保护的技术使用者:北京国信网联科技有限公司
技术研发日:2022.04.08
技术公布日:2022/7/5