基于嵌入式GPU的星载SAR成像处理方法及装置与流程

allin2023-05-07 84

基于嵌入式gpu的星载sar成像处理方法及装置
技术领域
1.本发明涉及信号处理技术领域，尤其涉及基于嵌入式gpu的星载sar成像处理方法及装置。

背景技术：

2.星载合成孔径雷达(synthetic aperture radar，sar)是空间对地观测领域的一个重要组成部分，由于其全天时、全天候的工作能力，星载sar被广泛应用于地球遥感、军事侦察、资源勘探等诸多国防和民生的重要领域。近年来，随着图形处理器(graphics processor unit，gpu)技术的飞速发展，gpu强大的浮点运算和并行处理能力使得业界都在致力于挖掘其潜能，使其能够在非图形领域也能发挥其高性能计算的优势。gpu由于自身架构原因，使其在更适用于并行计算，于是很多领域将gpu用作数据处理处理器。
3.现有的星载sar实时成像主要是采用基于中央处理器(central processing unit，cpu)与gpu组合架构的嵌入式gpu进行处理。
4.但上述方法存在单板的处理速度较慢、效率低下等问题。

技术实现要素：

5.针对现有技术存在的问题，本发明实施例提供一种基于嵌入式gpu的星载sar成像处理方法及装置。
6.本发明提供一种基于嵌入式gpu的星载sar成像处理方法，包括：
7.从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；
8.基于所述sar的工作参数，确定相位相乘矫正数据；
9.根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。
10.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，所述基于所述sar的工作参数，确定相位相乘矫正数据，包括：
11.对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据；
12.利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据。
13.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，所述相位相乘矫正数据包括：第一相位相乘矫正数据、第二相位相乘矫正数据和第三相位相乘矫正数据；
14.所述根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息，包括：
15.通过方位向快速傅里叶变换将原始回波数据转换到距离多普勒域，获取第一多普勒数据；
16.利用并行线程和并行块，将所述第一多普勒数据与所述第一相位相乘矫正数据进
行相乘，获取第一矫正数据；
17.将所述第一矫正数据存储至共享内存，读取所述共享内存中的第一转置数据；所述第一转置数据是在所述共享内存中对所述第一矫正数据进行矩阵转置得到的；
18.通过距离向快速傅里叶变换，将所述第一转置数据转换到二维频域，获取第一频域数据；
19.利用所述并行线程和所述并行块，将所述第一频域数据和所述第二相位相乘矫正数据进行相乘，获取第二矫正数据；
20.通过距离向快速傅里叶逆变换，将所述第二矫正数据转换到距离多普勒域，获取第二多普勒数据；
21.将所述第二多普勒数据存储至所述共享内存，读取所述共享内中的第二转置数据；所述第二转置数据是在所述共享内存中对所述第二多普勒数据进行矩阵转置得到的；
22.利用所述并行线程和所述并行块，将所述第二转置数据与第三相位相乘矫正数据进行相乘，获取第三矫正数据；
23.通过方位向快速傅里叶逆变换，将所述第三矫正数据转换到二维时域，获取所述图像信息。
24.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，所述相位相乘数据包括：方向位合并数据和/或距离向合并数据；
25.所述对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据，包括：
26.对所述可合并参数进行方位向合并，获取方位向合并数据；和/或，
27.对所述可合并参数进行距离向合并，获取距离向合并数据。
28.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，所述利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据，包括：
29.将所述方位向合并数据和/或所述距离向合并数据，以及所述不可合并参数进行相乘，生成所述相位相乘矫正数据。
30.本发明还提供基于嵌入式gpu的星载sar成像处理装置，包括嵌入式图形处理器gpu；所述gpu，包括：
31.读取模块，用于从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；
32.确定模块，用于基于所述sar的工作参数，确定相位相乘矫正数据；
33.矫正模块，用于根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。
34.根据本发明提供的基于嵌入式gpu的星载sar成像处理装置，还包括共享内存；
35.所述共享内存用于接收所述锁页内存发送的待转置数据；对所述待转置数据进行矩阵转置处理，获取转置数据；将所述转置数据发送至所述锁页内存。
36.本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于嵌入式gpu的星载sar成像处理方法的步骤。
37.本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算
机程序被处理器执行时实现如上述任一种所述基于嵌入式gpu的星载sar成像处理方法的步骤。
38.本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述基于嵌入式gpu的星载sar成像处理方法的步骤。
39.本发明提供的基于嵌入式gpu的星载sar成像处理方法及装置，在cpu和嵌入式gpu架构下，gpu内核通过直接读取cpu在锁页内存中存储的原始回波数据，并对原始回波数据进行矫正，实现对星载sar实时成像处理，节省了数据拷贝的时间，有效提高了sar成像处理的速度和效率。
附图说明
40.为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
41.图1是本发明提供的基于嵌入式gpu的星载sar成像处理方法的流程示意图之一；
42.图2是本发明提供的原始回波数据存储矩阵的结构示意图；
43.图3是现有技术的星载sar成像处理方法的流程示意图；
44.图4是本发明提供的基于嵌入式gpu的星载sar成像处理方法的流程示意图之二；
45.图5是本发明提供的第一相位相乘矫正数据构造方法的流程示意图；
46.图6是本发明提供的第二相位相乘矫正数据构造方法的流程示意图；
47.图7是本发明提供的第三相位相乘矫正数据构造方法的流程示意图；
48.图8是本发明提供的数据矩阵的相乘运算的流程示意图；
49.图9是本发明提供的数据矩阵转置优化处理的流程示意图；
50.图10是本发明提供的并行sar成像处理算法的运行时间示意图；
51.图11是本发明提供的嵌入式gpu的结构示意图；
52.图12是本发明提供的电子设备的结构示意图。
具体实施方式
53.为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
54.需要说明的是，在本发明实施例的描述中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位
构造和操作，因此不能理解为对本发明的限制。除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。
55.由于星载sar成像算法运算量大，算法复杂度高，使用普通cpu或现场可编程逻辑门阵列(field programmable gate array，fpga)等无法满足实时处理的要求。而星载sar成像算法gpu地面成像的成熟应用为基于嵌入式的在轨sar实时成像处理提供可能，嵌入式gpu与星载sar成像算法的结合，能够很好地解决实时处理的问题。
56.传统的地面gpu功耗大，需要强大的散热系统，相较于传统插卡式gpu，嵌入式gpu具有功耗低、体积小、接口完备、易于嵌入式扩展等优势，但其劣势主要体现在处理性能相对较差、内存空间不足等方面。
57.本发明提供一种高效的gpu实时成像方法，对现有的嵌入式gpu星载sar成像处理方法中的某些步骤进行了改进和优化，提高了sar成像算法的处理速度。
58.下面结合图1至图12描述本发明实施例所提供的基于嵌入式gpu的星载sar成像处理方法及装置。
59.图1是本发明提供的基于嵌入式gpu的星载sar成像处理方法的流程示意图之一，如图1所示，其执行主体可以为嵌入式gpu，也可以为带有gpu处理功能的设备，方法包括但不限于以下步骤：
60.首先，在步骤s1中，gpu从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据。
61.其中，采用zero-copy技术，在cpu上分配锁页内存，并将锁页内存映射至gpu内存空间上，此时，cpu指针和gpu指针可以同时访问一个内存，使得cpu中存储的数据不需要拷贝到gpu中，而是通过映射使得gpu内核直接访问cpu内存，节省了数据拷贝的时间，提高了处理速度。
62.其中，原始回波数据，可以是对sar系统采集的信号进行滤波去噪处理后的回波数据。
63.将原始回波数据读取到cpu锁页内存中，即可直接映射到gpu内存空间上，原始回波数据表征为按照na长度的一维向量数组，在锁页内存中按照矩阵方式存储，图2是本发明提供的原始回波数据存储矩阵的结构示意图，如图2所示，总的sar原始回波数据由nr个na长度的向量组成，方位向包括0至na-1，距离向包括0至nr-1，以便于后续对方位向和距离向处理。
64.进一步地，在步骤s2中，gpu基于所述sar的工作参数，确定相位相乘矫正数据。
65.其中，cpu端设置sar的工作模式为条带工作模式，sar的工作参数包括：sar方位向采样点数na、sar距离向采样点数nr、sar距离向采样率fr，以及sar发射信号的线性调频率kr、sar发射信号的脉冲宽度tr、sar发射信号的载频频率fc。
66.此外，sar的工作参数还包括：sar斜视角θr、sar平台的等效速度vr、sar波束中心线扫过目标时的斜距r0、方位向多普勒中心f
dc
、sar方位向采样频率fa和光速c等。
67.在cpu中，分配在进行方位向数据计算时gpu中并行线程数量和并行块数量，分配
在进行距离向数据计算时gpu中并行线程数量和并行块数量，以及分配总sar数据计算时gpu中并行线程数量和并行块数量。线程和线程块数是根据数据量的大小和gpu核心数量设置的。
68.还可以在gpu中，利用sar的工作参数，构造sar成像线性调频变标(chirp scaling，cs)算法的cs成像参数，cs成像参数用于确定生成图像的尺寸和质量等，是固有参数，改变成像质量和尺寸等可以通过修改成像参数实现。cs成像参数包括：距离时间向量tr、方位时间向量ta、距离向频率向量fr、方位向频率向量fa、各距离单元对应的斜距组成的向量r、徙动因子ct等。
69.具体地，利用sar的工作参数，根据对数据补偿的相位不同，构造3个相位相乘矫正数据。
70.进一步地，在步骤s3中，gpu根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。
71.基于cs成像参数，利用3个相位相乘矫正数据对原始回波数据对补偿的相位进行3次补偿矫正相乘，并对中间值进行转置和信号域的变换，生成与原始回波数据对应的图像信息。
72.本发明提供的基于嵌入式gpu的星载sar成像处理方法，在cpu和嵌入式gpu架构下，gpu内核通过直接读取cpu在锁页内存中存储的原始回波数据，并对原始回波数据进行矫正，实现对星载sar实时成像处理，节省了数据拷贝的时间，有效提高了sar成像处理的速度和效率
73.图3是现有技术的星载sar成像处理方法的流程示意图，如图3所示，首先，将原始回波信息和cpu构造的成像参数，均存储至在cpu的内存；进一步地，将成像参数和原始回波信息等数据从cpu内存拷贝到gpu内存中，对gpu中的原始回波信息进行方向位快速傅里叶变换(fast fourier transform，fft)后，与构造的第一次相位相乘数据进行第一次相乘，再将第一次相乘的结果进行矩阵转置和距离向fft后，与构造的第二次相位相乘数据进行第二次相乘；进一步地，将第二次相乘的结果进行距离向快速傅里叶逆变换(inverse fast fourier transform，ifft)和矩阵转置后，与构造的第三次相位相乘数据进行第三次相乘，再将第三次相乘的结果进行方向位ifft，得到处理结果；根据处理结果等数据从cpu拷贝到gpu内存中的数据，得到最终的sar图像。
74.现有技术的星载sar成像处理方法，利用了gpu多线程处理的能力，能够将原始回波数据导入到gpu中进行sar成像加速处理，然而将数据从cpu内存中拷贝到gpu显存中需要花费数据拷贝时间，降低了处理速度，增加了数据处理时间；且sar成像算法中构造三次相位相乘数据的浮点计算量大，且转置运算访问全局内存，数据读取时间慢。
75.因此，现有技术在总体的sar成像处理没有达到很快的速度，而要想实现实时处理必须使用多块嵌入式gpu联合处理，但多块嵌入式gpu开发板不仅增加了成本，也增加了sar实时成像处理系统的重量。
76.图4是本发明提供的基于嵌入式gpu的星载sar成像处理方法的流程示意图之二，如图4所示，将原始回波数据和cpu雷达工作参数，以及gpu构造的成像参数，均存储至cpu和gpu可以共同访问的锁页内存。
77.进一步地，对原始回波信息进行方向位fft后，与利用第一次相位相乘na、nr向数
据a、b，以及第一次相位相乘其它相位相乘数据构造的第一相位相乘矫正数据进行第一次相乘，实现补余距离徙动矫正中的cs操作，获取第一矫正数据。
78.进一步地，将第一矫正数据进行改进的矩阵转置和距离向fft后，与利用2个第二次相位相乘na向数据e、f，以及第二次相位相乘其它相位相乘数据构造的第二相位相乘矫正数据，进行第二次相乘，同时完成距离压缩、二次距离压缩和一致距离徙动矫正，获取第二矫正数据。
79.进一步地，将第二矫正数据进行距离向ifft和改进的矩阵转置后，与利用2个第三次相位相乘na向数据g、h，1个第三次相位相乘nr向数据i，以及第三次相位相乘其它相位相乘数据构造的第三相位相乘矫正数据，进行第三次相乘，实现方位压缩及相位矫正，获取第三矫正数据。
80.进一步地，将第三矫正数据进行方向位ifft，得到sar的原始回波数据对应的图像信息。
81.此外，上述三次相位相乘矫正数据，采用沿na方向和nr方向的数据分别构造的方法，还适用于多个有减少浮点运算数据量需求的应用场景。
82.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，通过成像处理过程的改进，达到使用多个gpu相同的处理速度，或是达到处理性能更强的gpu相同的处理速度，减少嵌入式gpu使用的数量，从而降低sar实时成像处理系统的成本和重量。
83.可选地，所述基于所述sar的工作参数，确定相位相乘矫正数据，包括：
84.对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据；
85.利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据。
86.所述相位相乘矫正数据包括：第一相位相乘矫正数据、第二相位相乘矫正数据和第三相位相乘矫正数据，所述根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息，包括：
87.通过方位向快速傅里叶变换，将原始回波数据转换到距离多普勒域，获取第一多普勒数据；
88.利用并行线程和并行块，将所述第一多普勒数据与所述第一相位相乘矫正数据进行相乘，获取第一矫正数据；
89.将所述第一矫正数据存储至共享内存，读取所述共享内存中的第一转置数据；所述第一转置数据是在所述共享内存中对所述第一矫正数据进行矩阵转置得到的；
90.通过距离向快速傅里叶变换，将所述第一转置数据转换到二维频域，获取第一频域数据；
91.利用所述并行线程和所述并行块，将所述第一频域数据和所述第二相位相乘矫正数据进行相乘，获取第二矫正数据；
92.通过距离向快速傅里叶逆变换，将所述第二矫正数据转换到距离多普勒域，获取第二多普勒数据；
93.将所述第二多普勒数据存储至所述共享内存，读取所述共享内中的第二转置数据；所述第二转置数据是在所述共享内存中对所述第二多普勒数据进行矩阵转置得到的；
94.利用所述并行线程和所述并行块，将所述第二转置数据与第三相位相乘矫正数据进行相乘，获取第三矫正数据；
95.通过方位向快速傅里叶逆变换，将所述第三矫正数据转换到二维时域，获取所述图像信息。
96.可选地，所述相位相乘数据包括：方向位合并数据和/或距离向合并数据；
97.所述对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据，包括：
98.对所述可合并参数进行方位向合并，获取方位向合并数据；和/或，
99.对所述可合并参数进行距离向合并，获取距离向合并数据。
100.在图4中，a、e、f、g、h均为方位向合并数据，b、i均为距离向合并数据。
101.可选地，所述利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据，包括：
102.将所述方位向合并数据和/或所述距离向合并数据，以及所述不可合并参数进行相乘，生成所述相位相乘矫正数据。
103.其中，可合并参数为工作参数中能够合并成方位向和/或距离向的参数，不可合并参数为工作参数中不能够合并成方位向或距离向的参数。方位向合并数据可以为na向合并数据，距离向合并数据可以为nr向合并数据。
104.图5是本发明提供的第一相位相乘矫正数据构造方法的流程示意图，如图5所示，在gpu中，根据工作参数和第一次对数据补偿的相位，将第一次相位相乘数据中na向可合并数据合并为向量a，然后将第一次相位相乘nr向可合并数据合并为向量b，将向量a和向量b及剩余的其它相位相乘数据进行相乘，得到第一次相位相乘矫正数据，通过提前构造相位相乘矫正数据，能够有效减少多次构造向量a和向量b的计算次数。其中，其它相位相乘数据为部分不可合并参数。
105.图6是本发明提供的第二相位相乘矫正数据构造方法的流程示意图，如图6所示，在gpu中，根据工作参数和第二次对数据补偿的相位，将第二次相位相乘数据中na向部分可合并数据合并为向量e，然后将第二次相位相乘na向剩余部分可合并数据合并为向量f，将向量e和向量f及剩余的其它相位相乘数据进行相乘，得到第二相位相乘矫正数据，通过提前构造相位相乘矫正数据，减少了多次构造向量e和向量f的计算次数。
106.图7是本发明提供的第三相位相乘矫正数据构造方法的流程示意图，如图7所示，在gpu中，根据工作参数和第三次对数据补偿的相位，将第三次相位相乘数据中na向部分可合并数据合并为向量g，将第三次相位相乘数据中na向剩余部分可合并数据合并为向量h，然后将第三次相位相乘nr向可合并数据合并为向量i，可有效减少多次构造向量g、h、i计算次数。将向量g、向量h、向量i和剩余的其它相位相乘数据进行相乘，得到第三次相位相乘矫正数据。
107.通过将第二转置数据与第三次相位相乘矫正数据进行相乘，实现方位压缩及相位矫正，生成第三矫正数据。
108.在gpu中，对经过第三矫正数据进行方位向ifft，数据变回到二维时域，形成sar的原始回波数据对应的图像信息。
109.图8是本发明提供的数据矩阵的相乘运算的流程示意图，如图8所示，在网格
(grid0)中，包括6个线程块(block)，例如block(0,0)、block(1,0)、block(2,0)、block(0,1)、block(1,1)和block(2,1)。其中，在线程块block(1,1)中，包括n个线程(thread)，在第n个线程thread n中，向量h(x)中第n个数据和向量s(x)中第n个数据进行相乘，得到向量y(x)中的第n个数据。
110.将第一频域数据与第一相位相乘矫正数据进行相乘，生成第一次相位相乘矫正后的数据；将第一频域数据与第二相位相乘矫正数据进行相乘，生成第二矫正数据；以及，将第二转置数据与第三次相位相乘矫正数据进行相乘，实现方位压缩及相位矫正，生成第三矫正数据。
111.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，成像参数和相位相乘矫正数据的构造都是在gpu中并行完成，并且相位相乘矫正数据的构造进行了优化，将三次相位相乘矫正数据中沿na方向和nr方向的数据分别构造完成保存到gpu中，再进行浮点运算，减少单个线程中浮点运算的次数，从而进一步提高数据处理的速度。
112.图9是本发明提供的数据矩阵转置优化处理的流程示意图，如图9所示，例如，对经过第一矫正数据进行矩阵转置操作，在网格(grid0)中，将第一矫正数据的数据矩阵c分块，得到多个线程块(block)，例如block(0,0)、block(1,0)、block(2,0)、
…
，取矩阵c其中block(0,0)的子矩阵数据按行存入到gpu的共享内存中，然后，按列从gpu共享内存中取数据，放入矩阵d对应的子矩阵位置，完成矩阵转置操作。由于转置的过程没有计算的内容，只有数据位置的搬移，故矩阵转置的过程所用时间主要看读取速度。锁页内存具有空间大、读取数据慢的特点，如果在锁页内存进行转置的话，实时成像的速度会变得比较慢；共享内存虽然内存小，但读取数据很快，因此，利用共享内存进行矩阵转置能够有效缩短整个成像过程所用时间。
113.根据本发明提供的基于嵌入式gpu的星载sar成像处理方法，对数据的转置操作进行了优化，采用gpu共享内存减少gpu线程读取数据的时间，提高数据转置的速度。并且sar图像数据使用float型数据，但为了保证图像精度，其中相位矫正数据构造部分采用double型数据，相较于整体用double型数据又提高了处理速度。
114.图10是本发明提供的并行sar成像处理算法的运行时间示意图，如图10所示，横坐标为数据量，即方位向na乘以距离向nr；纵坐标为运行时间，单位为秒(s)。在仿真实验中，采用gf3卫星数据作为原始回波数据，对不同数据量下的sar原始回波数据在jetson agx xavier上，运行如图3所示的改进前的成像处理方法，以及运行如图4所示的改进后的成像处理方法，并记录运行时间。
115.在数据量为8192
×
8192时，sar成像处理在改进前用时3s左右，改进后用时1s左右，大大提高了sar成像处理的速度，且成像结果的幅度和相位精度很高，具有良好的聚焦效果。
116.其中，jetson agx xavier为jetson系列嵌入式gpu，拥有较多的核心数，浮点计算能力较强。
117.本发明提供一种基于嵌入式gpu的星载sar成像处理装置，包括嵌入式图形处理器gpu。
118.图11是本发明提供的嵌入式gpu的结构示意图，如图11所示，包括：
119.读取模块1101，用于从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始
回波数据；
120.确定模块1102，用于基于所述sar的工作参数，确定相位相乘矫正数据；
121.矫正模块1103，用于根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。
122.首先，读取模块1101从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据。
123.其中，采用zero-copy技术，在cpu上分配锁页内存，并将锁页内存映射至gpu内存空间上，此时，cpu指针和gpu指针可以同时访问一个内存，使得cpu中存储的数据不需要拷贝到gpu中，而是通过映射使得gpu内核直接访问cpu内存，节省了数据拷贝的时间，提高了处理速度。
124.其中，原始回波数据可以是对sar系统通常记录的信号，进行滤波去噪处理后的回波数据。
125.将原始回波数据读取到cpu锁页内存中，即可直接映射到gpu内存空间上，原始回波数据表征为按照na长度的一维向量数组，在锁页内存中按照矩阵方式存储，如图2所示，总的sar原始回波数据由nr个na长度的向量组成，以便于后续对方位向和距离向处理。
126.进一步地，确定模块1102基于所述sar的工作参数，确定相位相乘矫正数据。
127.其中，cpu端设置sar的工作模式为条带工作模式，sar的工作参数包括：sar方位向采样点数na、sar距离向采样点数nr、sar距离向采样率fr，以及sar发射数据的线性调频率kr、sar发射数据的脉冲宽度tr、sar发射数据的载频频率fc。
128.另外，sar的工作参数还可以包括：sar斜视角θr、sar平台的等效速度vr、sar波束中心线扫过目标时的斜距r0、方位向多普勒中心f
dc
、sar方位向采样频率fa和光速c等。
129.在cpu中，分配在进行方位向数据计算时gpu中并行线程数量和并行块数量，分配在进行距离向数据计算时gpu中并行线程数量和并行块数量，以及分配总sar数据计算时gpu中并行线程数量和并行块数量。线程和线程块数是根据数据量的大小和gpu核心数量设置的。
130.还可以在gpu中，利用sar的工作参数，构造sar成像cs算法的cs成像参数，cs成像参数用于确定生成图像的尺寸和质量等，是固有参数，改变成像质量和尺寸等可以通过修改成像参数实现。cs成像参数包括：距离时间向量tr、方位时间向量ta、距离向频率向量fr、方位向频率向量fa、各距离单元对应的斜距组成的向量r、徙动因子ct等。
131.具体地，利用sar的工作参数，根据数据补偿的相位不同，构造3个相位相乘矫正数据。
132.进一步地，矫正模块1103根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。
133.基于cs成像参数，利用3个相位相乘矫正数据对原始回波数据对补偿的相位进行3次补偿矫正相乘，并对中间值进行转置和数据域的变换，生成与原始回波数据对应的图像信息。
134.本发明提供的基于嵌入式gpu的星载sar成像处理装置，在cpu和嵌入式gpu架构下，gpu内核通过直接读取cpu在锁页内存中存储的原始回波数据，并对原始回波数据进行矫正，实现对星载sar实时成像处理，节省了数据拷贝的时间，有效提高了sar成像处理的速
度和效率。
135.可选地，基于嵌入式gpu的星载sar成像处理装置还包括cpu；
136.所述cpu用于设置所述工作参数，并将所述原始回波数据存入至所述锁页内存。
137.需要说明的是，本发明实施例提供的基于嵌入式gpu的星载sar成像处理装置，在具体执行时，可以基于上述任一实施例所述的基于嵌入式gpu的星载sar成像处理方法来实现，对此本实施例不作赘述。
138.图12是本发明提供的电子设备的结构示意图，如图12所示，该电子设备可以包括：处理器(processor)1210、通信接口(communications interface)1220、存储器(memory)1230和通信总线1240，其中，处理器1210，通信接口1220，存储器1230通过通信总线1240完成相互间的通信。处理器1210可以调用存储器1230中的逻辑指令，以执行基于嵌入式gpu的星载sar成像处理方法，该方法包括：从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；基于所述sar的工作参数，确定相位相乘矫正数据；根据相位相乘矫正数据，对原始回波数据进行矫正，获取与原始回波数据对应的图像信息。
139.此外，上述的存储器1230中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。
140.另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的基于嵌入式gpu的星载sar成像处理方法，该方法包括：从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；基于所述sar的工作参数，确定相位相乘矫正数据；根据相位相乘矫正数据，对原始回波数据进行矫正，获取与原始回波数据对应的图像信息。
141.又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各实施例提供的基于嵌入式gpu的星载sar成像处理方法，该方法包括：从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；基于所述sar的工作参数，确定相位相乘矫正数据；根据相位相乘矫正数据，对原始回波数据进行矫正，获取与原始回波数据对应的图像信息。
142.以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
143.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上
述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
144.最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征：
1.一种基于嵌入式gpu的星载sar成像处理方法，其特征在于，包括：从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；基于所述sar的工作参数，确定相位相乘矫正数据；根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。2.根据权利要求1所述的基于嵌入式gpu的星载sar成像处理方法，其特征在于，所述基于所述sar的工作参数，确定相位相乘矫正数据，包括：对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据；利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据。3.根据权利要求1或2所述的基于嵌入式gpu的星载sar成像处理方法，其特征在于，所述相位相乘矫正数据包括：第一相位相乘矫正数据、第二相位相乘矫正数据和第三相位相乘矫正数据；所述根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息，包括：通过方位向快速傅里叶变换将所述原始回波数据转换到距离多普勒域，获取第一多普勒数据；利用并行线程和并行块，将所述第一多普勒数据与所述第一相位相乘矫正数据进行相乘，获取第一矫正数据；将所述第一矫正数据存储至共享内存，读取所述共享内存中的第一转置数据；所述第一转置数据是在所述共享内存中对所述第一矫正数据进行矩阵转置得到的；通过距离向快速傅里叶变换，将所述第一转置数据转换到二维频域，获取第一频域数据；利用所述并行线程和所述并行块，将所述第一频域数据和所述第二相位相乘矫正数据进行相乘，获取第二矫正数据；通过距离向快速傅里叶逆变换，将所述第二矫正数据转换到距离多普勒域，获取第二多普勒数据；将所述第二多普勒数据存储至所述共享内存，读取所述共享内中的第二转置数据；所述第二转置数据是在所述共享内存中对所述第二多普勒数据进行矩阵转置得到的；利用所述并行线程和所述并行块，将所述第二转置数据与所述第三相位相乘矫正数据进行相乘，获取第三矫正数据；通过方位向快速傅里叶逆变换，将所述第三矫正数据转换到二维时域，获取所述图像信息。4.根据权利要求2所述的基于嵌入式gpu的星载sar成像处理方法，其特征在于，所述相位相乘数据包括：方向位合并数据和/或距离向合并数据；所述对所述工作参数中的可合并参数进行方位向合并和/或距离向合并，获取相位相乘数据，包括：对所述可合并参数进行方位向合并，获取所述方位向合并数据；和/或，
对所述可合并参数进行距离向合并，获取所述距离向合并数据。5.根据权利要求4所述的基于嵌入式gpu的星载sar成像处理方法，其特征在于，所述利用所述相位相乘数据和所述工作参数中的不可合并参数，获取所述相位相乘矫正数据，包括：将所述方位向合并数据和/或所述距离向合并数据，以及所述不可合并参数进行相乘，生成所述相位相乘矫正数据。6.一种基于嵌入式gpu的星载sar成像处理装置，其特征在于，包括嵌入式图形处理器gpu，所述gpu包括：读取模块，用于从中央处理器cpu的锁页内存中读取合成孔径雷达sar的原始回波数据；确定模块，用于基于所述sar的工作参数，确定相位相乘矫正数据；矫正模块，用于根据所述相位相乘矫正数据，对所述原始回波数据进行矫正，获取与所述原始回波数据对应的图像信息。7.根据权利要求6所述的基于嵌入式gpu的星载sar成像处理装置，其特征在于，还包括所述cpu；所述cpu用于设置所述工作参数，并将所述原始回波数据存入至所述锁页内存。8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于嵌入式gpu的星载sar成像处理方法步骤。9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于嵌入式gpu的星载sar成像处理方法步骤。10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于嵌入式gpu的星载sar成像处理方法的步骤。

技术总结
本发明提供一种基于嵌入式GPU的星载SAR成像处理方法及装置，方法包括：从中央处理器CPU的锁页内存中读取合成孔径雷达SAR的原始回波数据；基于SAR的工作参数，确定相位相乘矫正数据；根据相位相乘矫正数据，对原始回波数据进行矫正，获取与原始回波数据对应的图像信息。本发明提供的基于嵌入式GPU的星载SAR成像处理方法及装置，在CPU和嵌入式GPU架构下，GPU内核通过直接读取CPU在锁页内存中存储的原始回波数据，并对原始回波数据进行矫正，实现对星载SAR实时成像处理，节省了数据拷贝的时间，有效提高了SAR成像处理的速度和效率。有效提高了SAR成像处理的速度和效率。有效提高了SAR成像处理的速度和效率。

技术研发人员：王帅卢虹良孙吉利
受保护的技术使用者：齐鲁空天信息研究院
技术研发日：2022.03.17
技术公布日：2022/7/5

转载请注明原文地址: https://www.8miu.com/read-11587.html

专利

最新回复(0)