1.本发明涉及不良场景图片识别领域,具体涉及基于知识蒸馏的不良场景识 别方法及系统及设备。
背景技术:2.近年来,随着网络社交媒体的普及,网络图片的监管逐渐成为社会安全领 域的一大挑战。能够及时有效地发现识别涉及不良场景的图片,是应对该挑战 的现实需要。现有的识别不良场景的方法主要分为两类,一类是人工审核的方 式,一类是图片识别模型结合人工审核的方式。其中,人工审核的方式存在着 识别精度低、效率低下、成本较高等缺陷。其次,在不良场景识别的领域,图 片识别模型往往对数据有着很强的依赖性,而现实中不同场景的图片获取途径 比较困难,数量分布十分不均,模型的识别性能也会因此受到影响;此外,图 片识别模型的性能和其结构复杂程度是正相关的,模型的吞吐率与性能之间存 在着冲突。所以,亟需一种新的可以应对不平衡数据且有着足够吞吐率的不良 场景识别方法。在数据挖掘领域,有着许多处理样本数据分布不平衡的方法。 同时,也存在着一些压缩模型规模的方式。通过利用这些方法,图片识别模型 的性能和效率得以提升,可以更高效地识别更多的不良场景图片。
3.现在存在着大量有关图片内容检测的工作。
4.现有技术1提出了一种针对新闻场景的景别识别方法,主要包括:首先, 构建新闻场景的景别识别数据集、场景识别数据集和目标检测数据集;然后分 别训练场景识别网络和目标检测网络;最后,将图像进行编码,输入到训练后 的模型中进行识别。
5.现有技术2提出了一种场景识别方法,方法主要包括:调用场景特征提取 网络和场景预测网络,基于第一驾驶场景的第一场景序列进行场景预测,得到 第二场景序列;基于第二场景序列和第一驾驶场景的第三场景序列,训练场景 特征提取网络和场景预测网络;调用训练后的场景特征提取网络和场景分类网 络,基于第二驾驶场景的场景序列进行场景分类,得到预测类别标签;基于第 二驾驶场景的场景类别标签和预测类别标签,训练场景分类网络;获取场景识 别模型,场景识别模型包括训练后的场景特征提取网络和训练后的场景分类网 络。
6.上述基于知识蒸馏的场景识别方法都利用了有监督的图像识别模型,没有 考虑数据不平衡的情况,可能会导致模型在某个类别的性能较差。此外,上述 方法也没有考虑模型的规模和吞吐率,可能会导致模型在某些场景下难以适用。
技术实现要素:7.本发明的目的在于提供基于知识蒸馏的不良场景识别方法及系统及设备, 以解决上述问题。
8.为实现上述目的,本发明采用以下技术方案:
9.基于知识蒸馏的不良场景识别方法,包括以下步骤:
10.步骤1,不良场景图片采集及数据集构建:以网络社交媒体网站为数据源, 分别对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集
11.步骤2,不平衡数据增强:对于样本数量小于100的类别,对其训练集中 的图片分别进行增强操作,生成与其他不良场景类别数目近似的增强样本,扩 充到总数聚集;
12.步骤3,不良场景图片识别模型建立:从步骤2所构建的数据集中抽取训 练样本,构建和训练有监督的不良图片识别模型;
13.步骤4,模型规模压缩及吞吐率提升:利用知识蒸馏的方式,对训练好的模 型进行模型压缩,提升模型的吞吐率;
14.步骤5,不良场景图片识别:对于需要识别的图片p,在预处理后,输入到 步骤4中训练好的识别模型中,判断其是否是不良场景的图片。
15.进一步的,步骤1中利用网络爬虫或网络平台提供的应用程序接口分别对 不良场景进行图片爬取,不良场景包括吸烟、酗酒、吸毒和赌博。
16.进一步的,步骤2中不平衡数据增强,包括:首先对各个类别的样本进行 随机抽取,按照8∶2的比例划分训练集和验证集;之后,对于样本数量小于100 的类别,对其训练集中的图片分别进行水平翻转、垂直翻转、添加噪音、旋转 随机角度、模糊操作,生成与其他不良场景类别数目近似的增强样本,并加入 到原来的训练集中,得到新的训练集。
17.进一步的,步骤3不良场景图片识别模型建立中,根据步骤2所构建的数 据集得到训练样本数据集,利用基于交叉熵的损失函数和正则化项构建基于知 识蒸馏的有监督图像分类模型,使用y表示样本数据的标签信息,其中,对中 图片pi,yi=j表示样本pi属于第j个类别,j=0,1,2,3,4分别对应吸烟、酗酒、 吸毒、赌博、正常五个类别的图片;对于每一张图片,首先将其分辨率转化为 224
×
224,再对每一个像素值进行归一化处理;使用x表示训练数据的数据矩阵; 选取resnet152作为图像特征提取模型;在获取了每张图片的特征信息之后, 将这些信息输入到分类模型中,最终得到每张图片的类别信息;将resnet152 模型的参数标记为w
152
,交叉熵函数为ce(
·
),则训练的目的是得到将数据矩阵 x映射到标注信息矩阵y的w
152
,训练方式为:
[0018][0019]
式中α为正则化项参数,||
·
|||1为矩阵的1范数。
[0020]
进一步的,模型具体的训练过程为:
[0021]
(1)读入图片和标签信息,转换图片的分辨率并将像素点归一化,得到训 练集的数据矩阵x;
[0022]
(2)将数据矩阵输入resnet152网络,得到每张图片的类别,即:使用带权的交叉熵函数得到模型的训练误差,即:其中样本较少的类 别具有较高的权重;
[0023]
(3)通过训练误差更新模型参数,直至训练误差收敛,保存参数矩阵w
152
。
[0024]
进一步的,步骤4模型规模压缩及吞吐率提升中,主要包括:通过步骤3 得到训练好的resnet152模型,设置为教师模型;选用较小的resnet18或 resnet34作为学生模型;并且设置一个具有三层神经网络的鉴别器;记教师模 型的参数为w
t
,学生模型的参数为ws,鉴
别器的参数为wd,y∈{y
t
,ys}分别表 示概率来自于教师模型或学生模型,kl散度记为kl(
·
),二元交叉熵函数记为 bce(
·
),则训练方式为:
[0025][0026]
式中,是鉴别器误差的权重,σ表示sigmoid函数。
[0027]
进一步的,知识蒸馏的具体训练过程为:
[0028]
(1)将训练集的数据矩阵x输入到教师模型中,得到输出xw
t
;
[0029]
(2)将xw
t
与学生模型的输出概率xws进行比较,将两个概率输入到kl散 度中,得到kl误差;
[0030]
(3)鉴别器以输出概率作为输入,鉴别输入来自于哪一个模型;
[0031]
(4)通过训练误差和鉴别器误差更新学生模型的参数,通过鉴别器误差更 新鉴别器的参数,直至两个误差收敛,保留学生模型的系数矩阵ws。
[0032]
进一步的,步骤5不良场景图片识别中,对于需要识别的图片p,在预处理 后,输入到步骤4中训练好的轻量级学生模型中,判断其是否是不良场景的图 片;之后,通过有监督的不良场景识别模型,得到目标图片p的预测标签y=j, 当j∈{0,1,2,3}时,则判定该图片为不良场景图片;否则,该图片为正常图片。
[0033]
进一步的,基于知识蒸馏的不良场景图片识别系统,包括:
[0034]
不良场景图片采集及数据集构建模块,用于以网络社交媒体网站为数据源, 分别对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集
[0035]
数据增强模块,用于对于样本数量比较小的类别,对其训练集中的图片分 别进行增强操作,生成与其他不良场景类别数目近似的增强样本,扩充到总数 聚集;
[0036]
不良场景图片识别模型建立模块,用于从所构建的数据集中抽取训练样本, 构建和训练有监督的不良图片识别模型;
[0037]
模型规模压缩模块,用于利用知识蒸馏的方式,对训练好的模型进行模型 压缩,提升模型的吞吐率;
[0038]
不良场景图片识别模块,用于对于需要识别的图片p,在预处理后,输入到 步骤4中训练好的识别模型中,判断其是否是不良场景的图片。
[0039]
进一步的,一种计算机设备,包括存储器、处理器以及存储在所述存储器 中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时 实现基于知识蒸馏的不良场景图片识别方法的步骤。
[0040]
与现有技术相比,本发明有以下技术效果:
[0041]
通过获取网络平台图片中丰富的特征信息来识别不良场景图片,并使用知 识蒸馏的方法提升模型的吞吐率。首先,对吸烟、酗酒、吸毒、赌博四个不良 场景在各个网络平台上进行采集,构建不良场景和正常的数据集;其次,利用 数据增强的方式,扩充不平衡的不良场景类别图片;之后,利用所构建的数据 集训练有监督的不良场景图片识别模型;然后,利用知识蒸馏的方式压缩模型 的规模,提升模型的吞吐率;最后,利用得到的不良场景
图片识别模型对未知 的图片进行类别的识别。本发明利用数据增强、分设权重等方式处理数据不平 衡问题,基于图像特征信息提取提高模型对不同不良场景图片类别的识别能力, 并基于知识蒸馏提高模型的吞吐率,具有信息挖掘充分、性能稳健、识别效率 高等优点,使得本发明较其他不良场景识别的方法具有明显的优势。
[0042]
本发明可以在不需要人工监管的情况下使用,节约了人力物力成本,并提 高了审查效率;通过数据增强和调整误差权重的方式可以改善这种情况,提升 模型的总体识别性能。通过知识蒸馏的方式可以在较少地降低性能的同时显著 地压缩模型的规模,从而提高模型的适应能力,减少所需使用成本。
附图说明
[0043]
图1是本发明基于知识蒸馏的不良场景识别方法框图。
[0044]
图2是数据采集过程的流程图。
[0045]
图3是不平衡数据增强过程的流程图。
[0046]
图4是识别模型训练过程流程图。
[0047]
图5是模型压缩过程的流程图。
[0048]
图6是不良场景图片识别的流程图。
具体实施方式
[0049]
以下结合附图及实施例对本发明的实施方式进行详细说明。需要说明的是, 此处描述的实施例只用以解释本发明,并不用于限定本发明。此外,在不冲突 的情况下,本发明中的实施例涉及的技术特征可以相互结合。
[0050]
本发明的目的是提供一种基于知识蒸馏的不良场景识别方法,通过获取网 络平台图片中丰富的特征信息来识别不良场景图片,并使用知识蒸馏的方法提 升模型的吞吐率。首先,对吸烟、酗酒、吸毒、赌博四个不良场景在各个网络 平台上进行采集,构建不良场景和正常的数据集;其次,利用数据增强的方式, 扩充不平衡的不良场景类别图片;之后,利用所构建的数据集训练有监督的不 良场景图片识别模型;然后,利用知识蒸馏的方式压缩模型的规模,提升模型 的吞吐率;最后,利用得到的不良场景图片识别模型对未知的图片进行类别的 识别。本发明利用数据增强、分设权重等方式处理数据不平衡问题,基于图像 特征信息提取提高模型对不同不良场景图片类别的识别能力,并基于知识蒸馏 提高模型的吞吐率,具有信息挖掘充分、性能稳健、识别效率高等优点,使得 本发明较其他不良场景识别的方法具有明显的优势。
[0051]
本发明的具体实施过程包括数据采集过程、数据增强过程、模型建立过程、 模型压缩过程、不良场景识别过程。图1是本发明基于知识蒸馏的不良场景图 片识别方法框图。
[0052]
1.数据采集过程
[0053]
数据获取的具体过程如下:
[0054]
(1)通过爬虫技术,根据不良场景类别的相关关键字进行图片爬取。在爬 取时,可以使用如“smoking cigarette”、“taking drug”、“play mahjong
”ꢀ
等不良场景相关标签进行爬取;在爬取正常图片时,可以通过随机的方式对目 标网页进行爬取。
[0055]
(2)对于不良场景的图片,分别对吸烟、酗酒、吸毒、赌博四个典型的不 良场景进
行图片的爬取,并对爬取到的图片进行去重处理。得到四个类别的数 据集合
[0056]
(3)对于正常的图片,需要去除涉及不良场景的图片。并且,为了模拟真 实世界,需要保证正常图片的数目远大于不良场景图片的数目。最终得到正常 图片集合
[0057]
以上的步骤流程如图2所示,从而得到图片集合
[0058]
2.不平衡数据增强过程
[0059]
对数据采集过程所构建的数据集进行数据分析。首先对各个类别的样本进 行随机抽取,按照8:2的比例划分训练集和验证集。之后,对于样本数量比较 小的类别,对其训练集中的图片分别进行水平翻转、垂直翻转、添加噪音、旋 转随机角度、模糊等操作,生成与其他不良场景类别数目近似的增强样本,并 加入到原来的训练集中,得到新的训练集。最终,将样本数量较少的类别图片 数量扩充至原来的4-8倍,使得不良场景的各个类别数目接近一致。并且,记 录样本较少的类别,在后续模型训练时加大对应的误差权重。该过程的流程图 如图3所示。
[0060]
3.识别模型建立过程
[0061]
根据数据增强后的数据集得到训练样本数据集,利用基于交叉熵的损失函 数和正则化项构建基于知识蒸馏的有监督的图像分类模型。使用y表示样本数 据的标签信息,其中,对中图片pi,yi=j表示样本pi属于第j个类别,j= 0,1,2,3,4分别对应吸烟、酗酒、吸毒、赌博、正常五个类别的图片。对于每一 张图片,首先将其分辨率转化为224
×
224,再对每一个像素值进行归一化处理。 使用x表示训练数据的数据矩阵。选取resnet(residual network,resnet) 作为图像特征提取模型。考虑到网络层数越深,特征表达能力越强,选用 resnet152模型。在获取了每张图片的特征信息之后,将这些信息输入到分类 模型中,最终得到每张图片的类别信息。将resnet152模型的参数标记为w
152
, 交叉熵函数为ce(
·
),则训练的目的是得到可以将数据矩阵x映射到标注信息矩 阵y的w
152
,训练方式为:
[0062][0063]
式中α为正则化项参数,||
·
||1为矩阵的1范数。模型具体的训练过程为:
[0064]
(1)读入图片和标签信息,转换图片的分辨率并将像素点归一化,得到训练集 的数据矩阵x;
[0065]
(2)将数据矩阵输入resnet152网络,得到每张图片的类别,即:使用带权的交叉熵函数得到模型的训练误差,即:其中样本较少的类 别具有较高的权重;
[0066]
(3)通过训练误差更新模型参数,直至训练误差收敛,保存参数矩阵w
152
。
[0067]
上述识别模型的训练过程如图4所示。
[0068]
4.模型压缩过程
[0069]
通过步骤3得到训练好的resnet152模型,设置为老师模型;选用较小的 resnet18或resnet34作为学生模型;并且设置一个具有三层神经网络的鉴别 器。记教师模型的参数为w
t
(即步骤3中得到的w
152
,不参与训练),学生模 型的参数为ws,鉴别器的参数为wd,y∈
{y
t
,ys}分别表示概率来自于教师模型 或学生模型,kl散度记为kl(
·
),二元交叉熵函数记为bce(
·
),则训练方式为:
[0070][0071]
式中,是鉴别器误差的权重,σ表示sigmoid函数。知识蒸馏的具体 训练过程为:
[0072]
(1)将训练集的数据矩阵x输入到教师模型中,得到输出xw
t
;
[0073]
(2)将xw
t
与学生模型的输出概率xws进行比较。将两个概率输入到kl散 度中,得到kl误差;
[0074]
(3)鉴别器以输出概率作为输入,鉴别输入来自于哪一个模型;
[0075]
(4)通过训练误差和鉴别器误差更新学生模型的参数,通过鉴别器误差更 新鉴别器的参数,直至两个误差收敛,保留学生模型的系数矩阵ws。
[0076]
以上模型蒸馏过程的训练流程图如图5所示。
[0077]
5.不良场景识别过程
[0078]
对于需要识别的图片p,在预处理后,输入到步骤4中训练好的识别模型 中,判断其是否是不良场景的图片。通过有监督的不良场景识别模型系数矩阵 ws,可以得到目标图片p的预测标签y=j,当j∈{0,1,2,3}时,则判定该图片为 不良场景图片;否则,该图片为正常图片。该识别过程如图6所示。
[0079]
本发明再一实施例中,提供一种基于知识蒸馏的不良场景识别系统,能够 用于实现上述的基于知识蒸馏的不良场景识别方法,具体的,该基于知识蒸馏 的不良场景识别系统包括:
[0080]
不良场景图片采集及数据集构建模块,用于以网络社交媒体网站为数据源, 分别对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集
[0081]
数据增强模块,用于对于样本数量比较小的类别,对其训练集中的图片分 别进行增强操作,生成与其他不良场景类别数目近似的增强样本,扩充到总数 聚集;
[0082]
不良场景图片识别模型建立模块,用于从所构建的数据集中抽取训练样本, 构建和训练有监督的不良图片识别模型;
[0083]
模型规模压缩模块,用于利用知识蒸馏的方式,对训练好的模型进行模型 压缩,提升模型的吞吐率;
[0084]
不良场景图片识别模块,用于对于需要识别的图片p,在预处理后,输入到 步骤4中训练好的识别模型中,判断其是否是不良场景的图片。
[0085]
本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理 器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指 令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是 中央处理单元(central processing unit,cpu),还可以是其他通用处理器、 数字信号处理器(digital signal processor、dsp)、专用集成电路 (application specific integrated circuit,asic)、现
成可编程门阵列 (field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或 者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其 适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或 一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器 可以用于知识蒸馏的不良场景识别方法的操作。
技术特征:1.基于知识蒸馏的不良场景识别方法,其特征在于,包括以下步骤:步骤1,不良场景图片采集及数据集构建:以网络社交媒体网站为数据源,分别对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集场景进行图片爬取,并同时构建正常图片数据集,得到总数据集步骤2,不平衡数据增强:对于样本数量小于100的类别,对其训练集中的图片分别进行增强操作,生成与其他不良场景类别数目近似的增强样本,扩充到总数聚集;步骤3,不良场景图片识别模型建立:从步骤2所构建的数据集中抽取训练样本,构建和训练有监督的不良图片识别模型;步骤4,模型规模压缩及吞吐率提升:利用知识蒸馏的方式,对训练好的模型进行模型压缩,提升模型的吞吐率;步骤5,不良场景图片识别:对于需要识别的图片p,在预处理后,输入到步骤4中训练好的识别模型中,判断其是否是不良场景的图片。2.根据权利要求1中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,步骤1中利用网络爬虫或网络平台提供的应用程序接口分别对不良场景进行图片爬取,不良场景包括吸烟、酗酒、吸毒和赌博。3.根据权利要求1中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,步骤2中不平衡数据增强,包括:首先对各个类别的样本进行随机抽取,按照8:2的比例划分训练集和验证集;之后,对于样本数量小于100的类别,对其训练集中的图片分别进行水平翻转、垂直翻转、添加噪音、旋转随机角度、模糊操作,生成与其他不良场景类别数目近似的增强样本,并加入到原来的训练集中,得到新的训练集。4.根据权利要求1中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,步骤3不良场景图片识别模型建立中,根据步骤2所构建的数据集得到训练样本数据集,利用基于交叉熵的损失函数和正则化项构建基于知识蒸馏的有监督图像分类模型,使用y表示样本数据的标签信息,其中,对中图片p
i
,y
i
=j表示样本p
i
属于第j个类别,j=0,1,2,3,4分别对应吸烟、酗酒、吸毒、赌博、正常五个类别的图片;对于每一张图片,首先将其分辨率转化为224
×
224,再对每一个像素值进行归一化处理;使用x表示训练数据的数据矩阵;选取resnet152作为图像特征提取模型;在获取了每张图片的特征信息之后,将这些信息输入到分类模型中,最终得到每张图片的类别信息;将resnet152模型的参数标记为w
152
,交叉熵函数为ce(
·
),则训练的目的是得到将数据矩阵x映射到标注信息矩阵y的w
152
,训练方式为:式中α为正则化项参数,‖
·
‖1为矩阵的1范数。5.根据权利要求4中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,模型具体的训练过程为:(1)读入图片和标签信息,转换图片的分辨率并将像素点归一化,得到训练集的数据矩阵x;(2)将数据矩阵输入resnet152网络,得到每张图片的类别,即:使用带权的交叉熵函数得到模型的训练误差,即:其中样本较少的类别具有较高的权重;(3)通过训练误差更新模型参数,直至训练误差收敛,保存参数矩阵w
152
。
6.根据权利要求4中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,步骤4模型规模压缩及吞吐率提升中,主要包括:通过步骤3得到训练好的resnet152模型,设置为教师模型;选用较小的resnet18或resnet34作为学生模型;并且设置一个具有三层神经网络的鉴别器;记教师模型的参数为w
t
,学生模型的参数为w
s
,鉴别器的参数为w
d
,y∈{y
t
,y
s
}分别表示概率来自于教师模型或学生模型,kl散度记为kl(
·
),二元交叉熵函数记为bce(
·
),则训练方式为:式中,是鉴别器误差的权重,σ表示sigmoid函数。7.根据权利要求6中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,知识蒸馏的具体训练过程为:(1)将训练集的数据矩阵x输入到教师模型中,得到输出xw
t
;(2)将xw
t
与学生模型的输出概率xw
s
进行比较,将两个概率输入到kl散度中,得到kl误差;(3)鉴别器以输出概率作为输入,鉴别输入来自于哪一个模型;(4)通过训练误差和鉴别器误差更新学生模型的参数,通过鉴别器误差更新鉴别器的参数,直至两个误差收敛,保留学生模型的系数矩阵w
s
。8.根据权利要求1中所述的基于知识蒸馏的不良场景图片识别方法,其特征在于,步骤5不良场景图片识别中,对于需要识别的图片p,在预处理后,输入到步骤4中训练好的轻量级学生模型中,判断其是否是不良场景的图片;之后,通过有监督的不良场景识别模型,得到目标图片p的预测标签y=j,当j∈{0,1,2,3}时,则判定该图片为不良场景图片;否则,该图片为正常图片。9.基于知识蒸馏的不良场景图片识别系统,其特征在于,包括:不良场景图片采集及数据集构建模块,用于以网络社交媒体网站为数据源,分别对不良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集良场景进行图片爬取,并同时构建正常图片数据集,得到总数据集数据增强模块,用于对于样本数量比较小的类别,对其训练集中的图片分别进行增强操作,生成与其他不良场景类别数目近似的增强样本,扩充到总数聚集;不良场景图片识别模型建立模块,用于从所构建的数据集中抽取训练样本,构建和训练有监督的不良图片识别模型;模型规模压缩模块,用于利用知识蒸馏的方式,对训练好的模型进行模型压缩,提升模型的吞吐率;不良场景图片识别模块,用于对于需要识别的图片p,在预处理后,输入到步骤4中训练好的识别模型中,判断其是否是不良场景的图片。10.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述基于知识蒸馏的不良场景图片识别方法的步骤。
技术总结基于知识蒸馏的不良场景识别方法及系统及设备,包括以下步骤:步骤1,不良场景图片采集及数据集构建步骤2,不平衡数据增强操作步骤3,不良场景图片识别模型建立;步骤4,模型规模压缩及吞吐率提升;步骤5,不良场景图片识别:对于需要识别的图片p,在预处理后,输入到步骤4中训练好的识别模型中,判断其是否是不良场景的图片。本发明利用数据增强、分设权重等方式处理数据不平衡问题,基于图像特征信息提取提高模型对不同不良场景图片类别的识别能力,并基于知识蒸馏提高模型的吞吐率,具有信息挖掘充分、性能稳健、识别效率高等优点,使得本发明较其他不良场景识别的方法具有明显的优势。的优势。的优势。
技术研发人员:刘欢 何子豪 罗敏楠 郑庆华 张驰 刘炉林
受保护的技术使用者:西安交通大学
技术研发日:2022.01.27
技术公布日:2022/7/5