本发明涉及图像处理装置、图像处理装置的控制方法以及存储计算机程序的非瞬态计算机可读存储介质。
背景技术:
1、用于在图像中进行检测的人物检测技术是检测包围图像中的对象的人物区域的人物框(通常,边界框)的技术。此技术用于人类行为识别和人数统计。近年来,已经提出了许多使用机器学习的人物检测技术。在这些当中,使用利用深度神经网络(下文中,被称为“dnn”)的人物检测模型的方法已经显示出高识别精度(wang,chien-yao,alexeybochkovskiy,and hong-yuan mark liao.“yolov7:trainable bag-of-freebies setsnew state-of-the-art for real-time object detectors.”arxiv preprint arxiv:2207.02696(2022),下文中被称为文献“wang”)。
2、通过从训练数据中学习来获得人物检测模型,该训练数据包括成对的示出人物的图像(下文中,被称为人物图像)和与人物的人物框对应的正确答案标签。可由人物检测模型检测的人物姿势受限于训练数据中充分包括的人物姿势。例如,通常,人以直立姿势被成像相对常见,但人以水平姿势被成像相对不常见,因此没有被充分地包括在训练数据中。因此,对于处于直立姿势的人的人物检测是容易的,但是对于处于没有被充分地包括在训练数据中的人物姿势(诸如水平姿势)的人的人物检测是困难的。为了解决这问题,一种看似合理的方法包括生成处于水平姿势的人的训练数据。然而,对于大量图像,这需要手动地生成图像中的人的人物框作为正确答案标签。此任务的人力方面的成本高,并且不容易建立足够的训练数据。
3、用于实现对于人物检测困难的人物姿势(诸如水平姿势)的人物检测的看似合理的方法包括旋转图像、人工地生成处于对于人物检测容易的直立姿势的人的图像并且对这些图像执行人物检测的方法。日本专利no.7066122是用于通过旋转图像来推断人的位置的技术的示例。在日本专利no.7066122中提出的技术中,生成通过旋转人物图像而获得的多个旋转图像,对该多个旋转图像执行姿势推断以将图像中的人的关节的位置推断为姿势,并且输出具有最高可靠性的关节的位置。
4、然而,当文献“wang”的姿势推断技术被应用到人物检测时,生成人物图像的多个旋转图像,对多个旋转图像执行人物检测,并且输出具有最高可靠性的人物框。在此情况下,在每个旋转图像中可能发生错误检测。因此,与不使用多个旋转图像相比,错误检测的百分比增加。
技术实现思路
1、本发明是考虑到前述问题而做出的,并且实现了一种用于抑制错误检测的增加并增加对于人物检测困难的人物姿势的人物检测的检测精度的技术。
2、根据本发明的方面,提供了一种图像处理装置,所述图像处理装置用于检测图像中的表示人物的人物区域,所述图像处理装置包括:一个或多个存储器,所述一个或多个存储器存储指令;以及一个或多个处理器,所述一个或多个处理器执行所述指令以:获得图像;通过将获得的图像旋转多个预设的角度来生成多个旋转图像;对所述多个旋转图像中的每一个旋转图像执行人物检测处理并获得检测信息,所述检测信息包括指示检测的人物的候选区域的信息和指示作为候选区域中的人物的似然度的信息;以及使用经由检测的人物的检测而获得的检测信息,根据每个似然度来确定要从人物区域中移除的候选区域并且移除候选区域。
3、根据本发明的另一方面,提供了一种用于图像处理装置的控制方法,所述图像处理装置用于检测图像中的表示人物的人物区域,所述控制方法包括:获得图像;通过将获得的图像旋转多个预设的角度来生成多个旋转图像;对所述多个旋转图像中的每一个旋转图像执行人物检测处理并获得检测信息,所述检测信息包括指示检测的人物的候选区域的信息和指示作为候选区域中的人物的似然度的信息;以及使用经由检测的人物的检测而获得的检测信息,根据每个似然度来确定要从人物区域中移除的候选区域并且移除候选区域。
4、根据本发明的又一方面,提供了一种存储计算机程序的非瞬态计算机可读存储介质,所述计算机程序在由提供在用于检测图像中的表示人物的人物区域的图像处理装置中的计算机读取并执行时,使所述计算机获得图像;通过将获得的图像旋转多个预设的角度来生成多个旋转图像;对所述多个旋转图像中的每一个旋转图像执行人物检测处理并获得检测信息,所述检测信息包括指示检测的人物的候选区域的信息和指示作为候选区域中的人物的似然度的信息;以及使用经由检测的人物的检测而获得的检测信息,根据每个似然度来确定要从人物区域中移除的候选区域并且移除候选区域。
5、本发明的更多特征将从(参考附图)对示例性实施例的以下描述中变得清楚。
1.一种图像处理装置,所述图像处理装置用于检测图像中的表示人物的人物区域,所述图像处理装置包括:
2.根据权利要求1所述的图像处理装置,其中在所述移除中,从利用检测的人物的检测而检测的每个检测信息当中,设置不满足预设的最高排名k的检测信息以用于移除,k是自然数。
3.根据权利要求1所述的图像处理装置,其中在所述移除中,所述一个或多个处理器还执行所述指令以
4.根据权利要求1所述的图像处理装置,还包括成像单元,所述成像单元使用鱼眼镜头捕获作为所述获得的目标的图像。
5.根据权利要求4所述的图像处理装置,其中所述一个或多个存储器存储表格,在所述表格中,将在所述捕获中具有预设的视场区的多个划分的视场区域与用于移除的旋转角度相关联,以及
6.一种用于图像处理装置的控制方法,所述图像处理装置用于检测图像中的表示人物的人物区域,所述控制方法包括:
7.一种存储计算机程序的非瞬态计算机可读存储介质,所述计算机程序在由提供在用于检测图像中的表示人物的人物区域的图像处理装置中的计算机读取并执行时,使所述计算机