一种基于车辆数据的模型的训练方法、装置和电子设备与流程

allin2022-07-30  134



1.本发明涉及车辆领域,特别是涉及一种基于车辆数据的模型的训练方法、装置和电子设备。


背景技术:

2.随着科技的发展,车辆逐渐成为人们日常生活的一部分。电池管理系统bms为车辆上重要的组成部分,bms反馈的数据受到人们的关注。
3.由于工况较为复杂,实车数据(真实车辆的数据)通常存在大量的噪声,难以作为准确标定值使用,导致大量的实车数据无法在后续分析中进行使用。目前通常基于实验数据集对bms反馈的数据进行研究。然而,实验数据集包含的实验数据,工况覆盖度低,导致模型的准确性低。
4.因此,亟需一种模型训练的方法,用于提高模型的准确性。


技术实现要素:

5.有鉴于此,本技术提供一种基于车辆数据的模型的训练方法、装置和电子设备,用以提高模型的准确性。
6.第一方面,本技术提供一种基于车辆数据的模型的训练方法。模型包括第一网络和第二网络,该方法包括对模型进行n次训练,n=2,3

。其中,对模型进行第i次训练,i=1,2,

,n,包括:
7.利用第i训练数据训练第一网络;利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;其中:
8.当i=j=1时,第i训练数据包括第一数据集,第j训练数据包括第二数据集,其中,第一数据集的标记噪声小于第二数据集的标记噪声;
9.当i》1,且j》1时,第i训练数据包括第一数据集和第(j-1)目标数据,第j训练数据包括第(j-1)训练数据。
10.在一种可能的实现方式中,第二网络包括第一子网络和第二子网络;
11.利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n,包括:
12.利用第一子网络的第j训练数据训练第一子网络,得到第一子网络的第j数据;第一子网络的第j数据包括第一子网络的第j训练数据中第一子网络的损失函数小于第一子网络的第j阈值的数据;
13.利用第二子网络的第j训练数据训练第二子网络,得到第二子网络的第j数据;第二子网络的第j数据包括第二子网络的第j训练数据中第二子网络的损失函数小于第二子网络的第j阈值的数据;
14.融合第一子网络的第j数据和第二子网络的第j数据,得到第j目标数据;
15.其中,当j=1时,第一子网络的第j训练数据包括第三数据集,第二子网络的第j训练数据包括第四数据集,第二数据集包括第三数据集和第四数据集;
16.当j》1时,第一子网络的第j训练数据包括第二子网络的第(j-1)训练数据,第二子网络的第j训练数据包括第一子网络的第(j-1)训练数据。
17.在一种可能的实现方式中,第一子网络和第二子网络相同。
18.在一种可能的实现方式中,第一网络包括transform。
19.在一种可能的实现方式中,第一子网络包括rnn,第二子网络包括rnn。
20.在一种可能的实现方式中,第(j-1)预设值小于第j预设值,j=2,

,n。
21.第二方面,本技术提供一种基于车辆数据的模型的训练装置,模型包括第一网络和第二网络,该装置用于对模型进行n次训练,n=2,3

。该装置包括第一训练单元和第二训练单元。
22.该装置用于对模型进行第i次训练,i=1,2,

,n,具体包括:
23.第一训练单元用于利用第i训练数据训练第一网络;第二训练单元用于利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;
24.其中,当i=j=1时,第i训练数据包括第一数据集,第j训练数据包括第二数据集,其中,第一数据集的标记噪声小于第二数据集的标记噪声;
25.当i》1,且j》1时,第i训练数据包括第一数据集和第(j-1)目标数据,第j训练数据包括第(j-1)训练数据。
26.在一种可能的实现方式中,第二网络包括第一子网络和第二子网络;
27.第二训练单元包括第一子训练单元、第二子训练单元和数据融合单元,其中:
28.第一子训练单元,用于利用第一子网络的第j训练数据训练第一子网络,得到第一子网络的第j数据;第一子网络的第j数据包括第一子网络的第j训练数据中第一子网络的损失函数小于第一子网络的第j阈值的数据;
29.第二子训练单元,用于利用第二子网络的第j训练数据训练第二子网络,得到第二子网络的第j数据;第二子网络的第j数据包括第二子网络的第j训练数据中第二子网络的损失函数小于第二子网络的第j阈值的数据;
30.其中,当j=1时,第一子网络的第j训练数据包括第三数据集,第二子网络的第j训练数据包括第四数据集,第二数据集包括第三数据集和第四数据集;
31.当j》1时,第一子网络的第j训练数据包括第二子网络的第(j-1)训练数据,第二子网络的第j训练数据包括第一子网络的第(j-1)训练数据;
32.数据融合单元,用于融合第一子网络的第j数据和第二子网络的第j数据,得到第j目标数据。
33.在一种可能的实现方式中,第一子网络和第二子网络相同。
34.第三方面,本技术提供一种电子设备,电子设备包括处理器和存储器,其中,存储器存储有代码,处理器用于调用存储器中存储的代码,以执行以上任一的方法。
35.第四方面,本技术提供一种计算机可读存储介质,计算机可读存储介质用于存储计算机程序,计算机程序用于执行以上任一的方法。
36.采用本技术的技术方案,利用第二网络筛选出标记噪声较小的训练数据;由于第
一数据集本身即为标记噪声较小的训练数据,利用第二网络筛选出来训练数据,以及第一数据集训练第一网络。采用本实施例的技术方案,较为有效地利用了标记噪声较大的训练数据(例如实车数据),对标记噪声较小的训练数据(例如实验数据,覆盖较少的车况)进行补充,使得训练得到的模型能够较好地应用在实际场景,也即提高模型的准确性。
附图说明
37.图1是本技术实施例提供的基于车辆数据的模型的训练方法的流程图;
38.图2为本技术实施例提供的模型的训练数据的示意图;
39.图3为本技术实施例提供的基于车辆数据的模型的训练装置的结构示意图。
具体实施方式
40.由于工况较为复杂,实车数据(真实车辆的数据)通常存在大量的噪声,难以作为准确标定值使用,导致大量的实车数据无法在后续分析中进行使用。目前通常基于实验数据集对bms反馈的数据进行研究。然而,实验数据集包含的实验数据,工况覆盖度低,导致模型的准确性低。因此,亟需一种模型训练的方法,用于提高模型的准确性。
41.基于此,在申请人提供的本技术的实施例中,带训练的模型包括第一网络和第二网络。训练方法包括对模型进行n次训练,n=2,3

。对模型进行第i次训练,i=1,2,

,n,包括以下过程:利用第i训练数据训练第一网络;利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;其中:当i=j=1时,第i训练数据包括第一数据集,第j训练数据包括第二数据集,其中,第一数据集的标记噪声小于第二数据集的标记噪声;当i》1,且j》1时,第i训练数据包括第一数据集和第(j-1)目标数据。
42.利用第二网络筛选出标记噪声较小的训练数据;由于第一数据集本身即为标记噪声较小的训练数据,利用第二网络筛选出来训练数据,以及第一数据集训练第一网络。采用本实施例的技术方案,较为有效地利用了标记噪声较大的训练数据(例如实车数据),对标记噪声较小的训练数据(例如实验数据,覆盖较少的车况)进行补充,使得训练得到的模型能够较好地应用在实际场景,也即提高模型的准确性。
43.为了便于理解本技术实施例提供的技术方案,首先对本技术实施例常见的应用场景进行介绍。
44.由于工况较为复杂,实车数据(真实车辆的数据)通常存在大量的噪声,难以作为准确标定值使用,导致大量的实车数据无法在后续分析中进行使用。
45.bms反馈的数据例如有:vin号(车架号,属于国标数据),时刻,电压,电流,温度,速度,加速度,soc,soh

一些对于数据噪声的解释:机器学习与深度神经网络的成功依赖于高质量标记的训练数据。训练数据中存在标记错误(标记噪声,即noisy labels)会大大降低模型在干净测试数据上的准确性。不幸的是,大型数据集几乎总是包含带有不正确或不准确的标签。
46.利用机器学习或深度学习及类似的人工智能数据模型算法,在训练过程与评估模型准确性的过程中,需要较为准确的标签。如果标签的准确性较低,则模型得到的预测结果的准确性较低。例如,对于电池容量soh预估任务来说,如果电池容量的标签的准确性较低,
也即soh的标签存在误差,则电池容量预估模型无法获得准确且有说服力的结果。
47.以下对电池容量预估任务进行简单地介绍。
48.近年来随着电动汽车的飞速发展,对于锂离子电池的老化机理、劣化规律的研究越来越多,有很多关于soh估算的方法、研究成果相继被发表出来,如离线测试法、电化学阻抗谱分析法、神经网络估算法、模糊逻辑估算法、粒子滤波估算法、寿命模型估算法等等。
49.容量预估任务即soh计算与预估。电池的老化是一个渐变的、复杂的过程。尽管如此,我们还是希望找到一些可以量化的指标,对电池的劣化程度进行描述。选择这样的指标的原则有两点:第一,指标典型,能够反映出电池老化的程度;第二,具有可操作性。例如,虽然电池的剩余循环次数能够反映电池老化的程度,但是用电池的剩余循环次数来定义老化程度就具有不可操作性。
50.为了便于理解本技术实施例提供的技术方案,下面结合附图对本技术实施例提供的一种基于车辆数据的模型的训练方法、装置和电子设备进行说明。
51.虽然附图中显示了本技术的示例性实施例,然而应当理解,可以以各种形式实现本技术而不应被这里阐述的实施例所限制。基于本技术中的实施例,本领域技术人员在没有作出创造性贡献前提下所获得的其他实施例,都属于本技术的保护范围。
52.在本技术的权利要求书和说明书以及说明书附图中,术语“包括”和“具有”以及它们的任何变形,目的在于覆盖不排他的包含。
53.本技术提供了一种基于车辆数据的模型的训练方法。
54.请参阅图1,图1是本技术实施例提供的基于车辆数据的模型的训练方法的流程图。
55.在本实施例中,用于训练的模型包括第一网络和第二网络。
56.本实施例中的基于车辆数据的模型的训练方法对该模型进行多次训练,也即对模型进行n次训练,n=2,3


57.如图1所示,图1示出了第i次训练的过程,i=1,2,

,n。
58.本技术实施例中的基于车辆数据的模型的训练方法包括s101-s102。
59.首先利用第i训练数据训练第一网络;利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n。
60.当i=j=1时,也即对于模型的第一次训练,包括s101。
61.s101、利用第一数据集训练第一网络;利用第j训练数据训练第二网络,得到第j目标数据,第j训练数据为第二数据集,j=1;第一数据集的标记噪声小于第二数据集的标记噪声。
62.第一数据集和第二数据集均包括训练数据。训练数据为车辆数据和车辆数据对应的标签。
63.训练数据中可能会存在标记错误,也即存在标记噪声(noisy labels)。标记噪声会降低模型在干净测试数据上的准确性。通常大型数据集会包含带有不正确或不准确的标签,例如,实车数据对应较为复杂的工况,以实车数据作为训练数据,得到的模型的准确性可能较低。
64.第一网络和第二网络均有各自网络的损失函数。
65.第j目标数据可以是第二数据集中的部分或全部数据;对于第二数据集中的训练数据,第二网络的损失函数小于第一预设值的训练数据,即为第一目标数据。
66.在本实施例中,第一次训练和后续轮次的训练所利用的训练数据通常是不同的。
67.当i》1时,也即对于模型第i次训练,i=2,3,

,n,包括s102。
68.s102、利用第一数据集和第(j-1)目标数据训练第一网络;利用第(j-1)训练数据训练第二网络,得到第j目标数据;第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,j=2,

,n。
69.得到第j目标数据,也即在用于训练第二网络的训练数据中,筛选出标记噪声较小的训练数据(依据第二子网络的损失函数)。
70.用于第一次训练第二网络的第二数据集的标记噪声较大,然而在第二数据集中,也存在标记噪声相对较小的数据,上述筛选过程也即得到这一部分标记噪声相对较小的数据。
71.利用第二网络筛选出标记噪声较小的训练数据;由于第一数据集本身即为标记噪声较小的训练数据,利用第二网络筛选出来训练数据,以及第一数据集训练第一网络。采用本实施例的技术方案,较为有效地利用了标记噪声较大的训练数据(例如实车数据),对标记噪声较小的训练数据(例如实验数据,覆盖较少的车况)进行补充,使得大量实车数据得以在分析与模型训练中使用,从而使得训练得到的模型能够较好地应用在实际场景,提高模型的准确性。
72.下面根据具体的实现方式进行说明。
73.本技术实施例还提供了一种基于车辆数据的模型的训练方法。
74.以电池容量预估任务为例,本技术实施例中的模型的输入为车辆数据,模型的输出为电池容量的预估结果。
75.模型包括第一网络和第二网络,第二网络包括第一子网络和第二子网络。
76.第一子网络和第二子网络均为rnn。
77.可以理解地是,模型分为两层,第一层为第一网络,第二层由两个对称的网络组成。
78.下面对本技术实施例中的模型的训练进行说明。本实施例中的基于车辆数据的模型的训练方法包括s201-s210。
79.s201、获取第一数据集和第二数据集。
80.训练数据用于训练网络,第一数据集用于训练第一网络,第二数据集用于训练第二网络。
81.第一数据集包括:第一车辆数据以及第一车辆数据的标签;第二数据集包括:第二车辆数据以及第二车辆数据的标签。
82.以电池容量预估任务为例,第一车辆数据的标签和第二车辆数据的标签可以为电池容量。
83.第一数据集的标记噪声小于第二数据集。
84.训练数据中可能会存在标记错误,也即存在标记噪声(noisy labels)。标记噪声会降低模型在干净测试数据上的准确性。通常大型数据集会包含带有不正确或不准确的标签,例如,实车数据对应较为复杂的工况,以实车数据作为训练数据,得到的模型的准确性
可能较低。
85.在一种可能的实现方式中,第一数据集可以为实验数据,第二数据集可以为实车数据。
86.实车数据对应较为复杂的工况,标记噪声较大;实验数据的工况覆盖率较低,标记噪声较小。
87.以soh预估任务为例,实车数据的标记噪声大,是指在整个实车数据soh分布上,噪声的平均值和方差大。
88.第一数据集的标记噪声较小,也可以理解为第一数据集的精度较高;第二数据集的标记噪声较大,也可以理解为第二数据集的精度较低。
89.第二网络包括第一子网络和第二子网络,因此,第二数据集可以用于分别训练第一子网络和第二子网络;或者,第二数据集可以包括两部分,两部分可以分别用于训练第一子网络和第二子网络。
90.利用第一数据集和第二数据集,分别对第一网络和第二网络进行训练。下面以第一网络的训练轮次为三、第一子网络的训练轮次为三,以及第二子网络的训练轮次为三为例,对模型的训练过程进行说明。
91.可以理解地是,上述训练轮次还可以是其他取值。
92.s202、利用第一数据集对第一网络进行第一次训练。
93.第一数据集的标记噪声较小。
94.相比于第二网络来说,第一网络可以是较为复杂的网络。在一种可能的实现方式中,第一网络为transform。
95.由于第一数据集的标记噪声较小,第二网络可以使用信息提取能力较高的网络,也即通过较为复杂的网络对标记噪声较小的数据进行较高精度的训练。对于深度神经网络来说,通常在训练数据质量较高的情况下,使用更加复杂的网络大概率有更好的效果。
96.参见图2,图2为本技术实施例提供的模型的训练数据的示意图。
97.由上至下分别为三次训练过程。
98.第一数据集的标记噪声较小,在图2中第一数据集示出为低噪声数据集i。
99.s203、利用第三数据集对第一子网络进行第一次训练,得到第一目标训练数据。
100.第二数据集包括第三数据集和第四数据集。由于第二数据集的标记噪声大于第一数据集,第三数据集和第四数据集的标记噪声大于第一数据集。
101.第二网络包括第一子网络和第二子网络。
102.第二数据集用于训练第二网络。在本实施例中,第三数据集用于训练第一子网络,第四数据集用于训练第二子网络。
103.在一种可能的实现方式中,第二数据集可以用于分别训练第一子网络和第二子网络。
104.在第三数据集中,确定第一子网络的损失函数小于第一预设值的训练数据,得到第一目标训练数据。
105.第一目标训练数据包括车辆数据和车辆数据的标签。
106.第一目标训练数据,也即在第二数据集中标记噪声较小的训练数据(依据第一子网络的损失函数)。
107.s204、利用第四数据集对第二子网络进行第一次训练,得到第二目标训练数据。
108.在第四数据集中,确定第二子网络的损失函数小于第二预设值的训练数据,得到第二目标训练数据。
109.第二目标训练数据包括车辆数据和车辆数据的标签。
110.第二目标训练数据,也即在第二数据集中标记噪声较小的训练数据(依据第二子网络的损失函数)。
111.s202-s203也即在训练第一子网络和第二子网络的过程中,得到训练数据(第二数据集,也即第三数据集和第四数据集)中标记噪声较小的训练数据。
112.第二数据集的标记噪声较大,也即车辆数据的标签和准确的标签的差距较大。然而在第二数据集中,也存在车辆数据的标签和准确的标签的差距较小的数据。
113.上述第一目标训练数据和第二目标训练数据,可以理解为置信度高的训练数据(可以称为置信数据),也即标记噪声小的训练数据。
114.上述得到第一目标数据和第二目标数据的过程,可以理解为从第二数据集中筛选得到置信数据的过程。
115.上述第一数据集为标记噪声较小的训练数据,可以理解为本身即为置信数据。
116.本实施例对于s202-s204的顺序不做限定。
117.在一种可能的实现方式中,第一子网络为rnn,第二子网络为rnn。
118.由于第二数据集的标记噪声大于第一数据集,例如第二数据集为实车数据。
119.相比于第一网络来说,第一子网络和第二子网络可以具有较简单的结构。
120.对于深度神经网络来说,通常在训练数据质量较高的情况下,使用更加复杂的网络大概率有更好的效果。在利用标记噪声较大的实车数据时,使用比较简单的网络,尽可能保证提取一些粗略但起码准确可用的信息量。这是因为神经网络算法在优化模型参数的过程中会优先拟合容易拟合的样本。若是第二网络中使用复杂的结构,则网络会越来越向各有各信息量的噪声学习,这样提取到的信息量基本不可用,使得模型的预估准确性较低。简单的网络模型,认为个体损失小的样本即为噪声数据集中质量较高的样本。
121.如图2所示,由于第二数据集的标记噪声较大,第二数据集包括第三数据集和第四数据集。在图2中第三数据集示出为高噪声数据集i,用于训练第一子网络;第四数据集示出为高噪声数据集ii,用于训练第二子网络。
122.s205、利用第一数据集、第一目标训练数据和第二目标训练数据,对第一网络进行第二次训练。
123.第一数据集、第一目标训练数据和第二目标训练数据为置信数据。
124.s205即为利用置信数据对第一网络进行训练。
125.第一数据集为实验数据,标记噪声较小,对应的工况较少;第一目标训练数据和第二目标训练数据均为实车数据,标记噪声较小,对应的工况较多。
126.在训练第一网络的过程中,训练数据包括标记噪声较小的实验数据,还包括置信度较高(标记噪声较小)的实车数据。
127.如图2所示,将第一目标训练数据和第二目标训练数据加入到用于训练第一网络的数据中(也即来自图2虚线框a加入,形成低噪声数据集ii)。也即,对于第一网络的第二次训练来说,训练数据为低噪声数据集ii。
128.s206、利用第四数据集对第一子网络进行第二次训练,得到第三目标训练数据。
129.s206即为利用置信数据对第一子网络进行训练。
130.在第四数据集中,确定第一子网络的损失函数小于第三预设值的训练数据,得到第三目标训练数据。
131.得到的第三目标训练数据可以理解为置信数据。
132.对于第三目标训练数据的说明,类似于s203中第一目标训练数据的说明,这里不再赘述。
133.如图2所示,在图2中第四数据集示出为高噪声数据集ii,用于对第一子网络进行第二次训练。
134.s207、利用第三数据集对第二子网络进行第二次训练。
135.s207即为利用置信数据对第二子网络进行训练。
136.在第第三数据集中,确定第二子网络的损失函数小于第四预设值的训练数据,得到第四目标训练数据。
137.得到的第四目标训练数据可以理解为置信数据。
138.对于第四目标训练数据的说明,类似于s204中第二目标训练数据的说明,这里不再赘述。
139.如图2所示,在图2中第三数据集示出为高噪声数据集i,用于对第二子网络进行第二次训练。
140.第二网络包括第一子网络和第二子网络,第二网络为交互的对称结构。
141.本实施例对于s205-s207的顺序不做限定。
142.s208、利用第一数据集、第三目标训练数据和第四目标训练数据,对第一网络进行第三次训练。
143.第一数据集、第三目标训练数据和第四目标训练数据为置信数据。
144.s208即为利用置信数据对第一网络进行训练。
145.对于s208的说明,参见对于s205的说明,这里不再赘述。
146.如图2所示,将第三目标训练数据和第四目标训练数据加入到用于训练第一网络的数据中(也即来自图2虚线框b加入,形成低噪声数据集iii)。也即,对于第一网络的第三次训练来说,训练数据为低噪声数据集iii。
147.s209、利用第三数据集对第一子网络进行第三次训练。
148.第四目标训练数据为置信数据。
149.如图2所示,在图2中第三数据集示出为高噪声数据集i,用于对第一子网络进行第三次训练。
150.s210、利用第四数据集对第二子网络进行第三次训练。
151.第三目标训练数据为置信数据。
152.如图2所示,在图2中第四数据集示出为高噪声数据集ii,用于对第二子网络进行第三次训练。
153.对s209-s210的说明,参见对于s206-s207的说明,这里不再赘述。
154.本实施例以对第一网络、第一子网络和第二子网络进行三次训练为例,可以理解地是,对于网络的训练轮次可以为其他次数。例如,当对第一网络、第一子网络和第二子网
络进行四次训练,可以通过s209-s210得到置信数据,并利用第一数据集和通过s209-s210得到的置信数据对第一网络进行第四次训练。
155.在训练第一子网络和第二子网络的过程中,不断地进行训练数据筛选的过程,得到实车数据中标注噪声较小的训练数据。
156.在训练第一子网络和第二子网络的过程中,形成交互的训练过程。
157.经过s201-s210,得到经过三次训练的第一网络、第一子网络和第二子网络,也即得到利用第一数据集和第二数据集进行训练后的模型。
158.以下为本实施例提供的模型中各网络的损失函数的一种实现方式。
159.第一网络、第一子网络和第二子网络的损失函数均为基本的mse(均方误差,mean squared error)。对于整个模型来说,联合损失函数为:
[0160][0161]
其中,m为第一网络筛选出的高质量的样本数量,n为第一网络筛选出的低质量的样本数量,n为由第二网络传递至第一网络的高质量样本的数量。也即,n=m+n。高质量的样本指的是网络的损失函数小于预设值的样本,低质量的样本指的是网络的损失函数大于或等于预设值的样本。
[0162]
msea为第一网络的损失函数,msei为第二网络中每个子网络的损失函数,k为第二网络中子网络的个数。
[0163]
上述三个网络通过损失函数控制在整体网络中的权重。
[0164]
根据第一网络评估下的高低质量数据加权,第二网络中各个子网络平均加权。
[0165]
第二网络在不断地训练过程中,对第二数据集进行筛选,得到第二数据集中质量较高的训练数据。
[0166]
训练数据的筛选比例可以随着迭代而不断降低,也即随着模型训练轮次的增加而不断降低,损失函数中的置信度由筛选比例映射得到。筛选比例与训练轮次呈反比的关系,并且随着训练轮次越接近设定的最大轮次,筛选比例下降地越快。也即,随着训练轮次的增加,能够从训练数据(高噪声样本)中筛选得到高质量的样本的数据量越少,筛选的条件越苛刻。
[0167]
筛选比例可以表示为:r(t)=-log(t-t),其中,t为总轮次数,t为当前轮次数。
[0168]
每次迭代(训练)后,按照损失函数从低到高排序,取前r(t)占比的训练数据,得到高质量的数据。
[0169]
r(t)乘当前轮次的高噪声样本的样本数,即为上面提到联合损失函数中的n。
[0170]
采用本实施例提供的基于车辆数据的模型的训练方法,一方面可以筛选出实车数据中质量较高的训练数据;另一方面在目标任务(例如soh预估任务)中,各个网络通过权重配比,得到具有更高准确率的模型。
[0171]
实验数据具有高置信度,但是工况覆盖较少;实车数据覆盖工况较广泛,但是具有较大的标注噪声。采用本实施例的技术方案,利用半交互的模型训练方法,对于第一网络的训练,采用置信度较高的第一数据集,以及由于第二网络筛选出来的置信度较高的训练数据。较为有效地利用了实车数据中置信度较高的数据,补充单一数据集(实验数据)训练模型后,模型难以应用在实际场景的问题,使得模型具有更高的预估准确率。
[0172]
在一些可能的实现方式中,当模型包括更多的网络结果时,也可以采用本实施例
类似的技术方案进行模型的训练,原理和本实施例的原理类似,在此不再赘述。
[0173]
本技术实施例还提供了一种基于车辆数据的模型的训练装置。
[0174]
该模型包括第一网络和第二网络,本技术实施例的基于车辆数据的模型的训练装置用于对该模型进行n次训练,n=2,3


[0175]
参见图3,图3为本技术实施例提供的基于车辆数据的模型的训练装置的结构示意图。
[0176]
如图3所示,装置300包括第一训练单元301和第二训练单元302。
[0177]
装置300用于对模型进行第i次训练,i=1,2,

,n,包括:
[0178]
第一训练单元301用于利用第i训练数据训练第一网络;第二训练单元302用于利用第j训练数据训练第二网络,得到第j目标数据;其中,第j目标数据包括第j训练数据中第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;
[0179]
其中,当i=j=1时,第i训练数据包括第一数据集,第j训练数据包括第二数据集,其中,第一数据集的标记噪声小于第二数据集的标记噪声;
[0180]
当i》1,且j》1时,第i训练数据包括第一数据集和第(j-1)目标数据,第j训练数据包括第(j-1)训练数据。
[0181]
上述基于车辆数据的模型的训练装置所包括的单元,能够达到和以上实施例中的基于车辆数据的模型的训练方法相同的技术效果,为避免重复,这里不再赘述。
[0182]
在一些可能的实现方式中,第二网络包括第一子网络和第二子网络。
[0183]
第二训练单元包括第一子训练单元、第二子训练单元和数据融合单元,其中:
[0184]
第一子训练单元,用于利用第一子网络的第j训练数据训练第一子网络,得到第一子网络的第j数据;第一子网络的第j数据包括第一子网络的第j训练数据中第一子网络的损失函数小于第一子网络的第j阈值的数据;
[0185]
第二子训练单元,用于利用第二子网络的第j训练数据训练第二子网络,得到第二子网络的第j数据;第二子网络的第j数据包括第二子网络的第j训练数据中第二子网络的损失函数小于第二子网络的第j阈值的数据;
[0186]
其中,当j=1时,第一子网络的第j训练数据包括第三数据集,第二子网络的第j训练数据包括第四数据集,第二数据集包括第三数据集和第四数据集;
[0187]
当j》1时,第一子网络的第j训练数据包括第二子网络的第(j-1)训练数据,第二子网络的第j训练数据包括第一子网络的第(j-1)训练数据;
[0188]
数据融合单元,用于融合第一子网络的第j数据和第二子网络的第j数据,得到第j目标数据。
[0189]
在一些可能的实现方式中,第一子网络和第二子网络相同。
[0190]
上述基于车辆数据的模型的训练装置所包括的单元,能够达到和以上实施例中的基于车辆数据的模型的训练方法相同的技术效果,为避免重复,这里不再赘述。
[0191]
本技术实施例还提供了一种电子设备。该电子设备包括处理器和存储器,其中,存储器存储有代码,处理器用于调用存储器中存储的代码,以执行以上任一的基于车辆数据的模型的训练方法。
[0192]
上述电子设备所包括的单元,能够达到和以上实施例中的基于车辆数据的模型的训练方法相同的技术效果,为避免重复,这里不再赘述。
[0193]
在本技术的实施例中,还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述基于车辆数据的模型的训练方法,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等。
[0194]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种基于车辆数据的模型的训练方法,其特征在于,所述模型包括第一网络和第二网络,所述方法包括对所述模型进行n次训练,n=2,3

,其中,对所述模型进行第i次训练,i=1,2,

,n,包括:利用第i训练数据训练所述第一网络;利用第j训练数据训练所述第二网络,得到第j目标数据;其中,所述第j目标数据包括所述第j训练数据中所述第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;其中:当i=j=1时,所述第i训练数据包括第一数据集,所述第j训练数据包括第二数据集,其中,所述第一数据集的标记噪声小于所述第二数据集的标记噪声;当i>1,且j>1时,所述第i训练数据包括所述第一数据集和第(j-1)目标数据,所述第j训练数据包括所述第(j-1)训练数据。2.根据权利要求1所述的方法,其特征在于,所述第二网络包括第一子网络和第二子网络;所述利用第j训练数据训练所述第二网络,得到第j目标数据;其中,所述第j目标数据包括所述第j训练数据中所述第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n,包括:利用第一子网络的第j训练数据训练所述第一子网络,得到第一子网络的第j数据;所述第一子网络的第j数据包括所述第一子网络的第j训练数据中所述第一子网络的损失函数小于第一子网络的第j阈值的数据;利用第二子网络的第j训练数据训练所述第二子网络,得到第二子网络的第j数据;所述第二子网络的第j数据包括所述第二子网络的第j训练数据中所述第二子网络的损失函数小于第二子网络的第j阈值的数据;融合所述第一子网络的第j数据和所述第二子网络的第j数据,得到所述第j目标数据;其中,当j=1时,所述第一子网络的第j训练数据包括所述第三数据集,所述第二子网络的第j训练数据包括所述第四数据集,所述第二数据集包括所述第三数据集和所述第四数据集;当j>1时,所述第一子网络的第j训练数据包括第二子网络的第(j-1)训练数据,所述第二子网络的第j训练数据包括第一子网络的第(j-1)训练数据。3.根据权利要求2所述的方法,其特征在于,所述第一子网络和所述第二子网络相同。4.根据权利要求1所述的方法,其特征在于,所述第一网络包括transform。5.根据权利要求2所述的方法,其特征在于,所述第一子网络包括rnn,第二子网络包括rnn。6.根据权利要求1所述的方法,其特征在于,第(j-1)预设值小于第j预设值,j=2,

,n。7.一种基于车辆数据的模型的训练装置,其特征在于,所述模型包括第一网络和第二网络,所述装置用于对所述模型进行n次训练,n=2,3

;所述装置包括第一训练单元和第二训练单元;所述装置用于对所述模型进行第i次训练,i=1,2,

,n,包括:所述第一训练单元用于利用第i训练数据训练所述第一网络;所述第二训练单元用于利用第j训练数据训练所述第二网络,得到第j目标数据;其中,所述第j目标数据包括所述
第j训练数据中所述第二网络的损失函数小于第j预设值的数据,i=j=1,2,

,n;其中,当i=j=1时,所述第i训练数据包括第一数据集,所述第j训练数据包括第二数据集,其中,所述第一数据集的标记噪声小于所述第二数据集的标记噪声;当i>1,且j>1时,所述第i训练数据包括所述第一数据集和第(j-1)目标数据,所述第j训练数据包括所述第(j-1)训练数据。8.根据权利要求7所述的装置,其特征在于,所述第二网络包括第一子网络和第二子网络;所述第二训练单元包括第一子训练单元、第二子训练单元和数据融合单元,其中:所述第一子训练单元,用于利用第一子网络的第j训练数据训练所述第一子网络,得到第一子网络的第j数据;所述第一子网络的第j数据包括所述第一子网络的第j训练数据中所述第一子网络的损失函数小于第一子网络的第j阈值的数据;所述第二子训练单元,用于利用第二子网络的第j训练数据训练所述第二子网络,得到第二子网络的第j数据;所述第二子网络的第j数据包括所述第二子网络的第j训练数据中所述第二子网络的损失函数小于第二子网络的第j阈值的数据;其中,当j=1时,所述第一子网络的第j训练数据包括所述第三数据集,所述第二子网络的第j训练数据包括所述第四数据集,所述第二数据集包括所述第三数据集和所述第四数据集;当j>1时,所述第一子网络的第j训练数据包括第二子网络的第(j-1)训练数据,所述第二子网络的第j训练数据包括第一子网络的第(j-1)训练数据;所述数据融合单元,用于融合所述第一子网络的第j数据和所述第二子网络的第j数据,得到所述第j目标数据。9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,其中,所述存储器存储有代码,所述处理器用于调用所述存储器中存储的代码,以执行权利要求1至6任一项所述的方法10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行权利要求1至6任一项所述的方法。

技术总结
本申请实施例公开了一种基于车辆数据的模型的训练方法、装置和电子设备。该模型包括第一网络和第二网络,该方法包括对所述模型进行N次训练;对所述模型进行第i次训练包括:利用第i训练数据训练所述第一网络;利用第j训练数据训练所述第二网络,得到第j目标数据;其中,所述第j目标数据包括所述第j训练数据中所述第二网络的损失函数小于第j预设值的数据,i=j=1,2,


技术研发人员:刘美亿 曹斌
受保护的技术使用者:东软睿驰汽车技术(沈阳)有限公司
技术研发日:2022.02.24
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-2131.html

最新回复(0)