本公开实施例涉及计算机技术,尤其涉及一种视频编辑方法、装置、设备、介质及程序产品。
背景技术:
1、随着计算机及网络技术的发展,越来越多的用户通过拍摄视频记录日常生活等场景,并将拍摄的视频分享给他人。
2、目前,这类记录日常生活等场景的视频通常包含视频文案。优质的视频文案可以增加视频的趣味性和吸引力,从而,增加视频的传播广度。然而,视频文案的创作对视频作者的要求较高,需要一定的文案创作基础,这就增加了视频的创作难度。
技术实现思路
1、本公开实施例提供一种视频编辑方法、装置、设备、介质及程序产品,可以便捷地生成与视频内容强相关的视频文案,从而,降低视频创作难度,增加视频的趣味性和吸引力。
2、第一方面,本公开实施例提供了一种视频编辑方法,包括:
3、将原始视频输入预训练的文案生成模型,其中,所述文案生成模型基于视频文案满足预设筛选条件的视频样本训练;
4、通过所述文案生成模型根据所述原始视频中的视频帧生成视频特征序列,将所述视频特征序列映射到所述文案生成模型的文本特征空间,得到视频映射特征序列;
5、通过所述文案生成模型根据所述视频映射特征序列生成所述原始视频的视频文案,其中,所述视频文案包括时间戳;
6、根据所述时间戳将所述视频文案添加至原始视频得到目标视频。
7、第二方面,本公开实施例还提供了一种视频编辑装置,所述装置包括:
8、视频输入模块,用于将原始视频输入预训练的文案生成模型,其中,所述文案生成模型基于视频文案满足预设筛选条件的视频样本训练;
9、特征映射模块,用于通过所述文案生成模型根据所述原始视频中的视频帧生成视频特征序列,将所述视频特征序列映射到所述文案生成模型的文本特征空间,得到视频映射特征序列;
10、模型输出模块,用于通过所述文案生成模型根据所述视频映射特征序列生成所述原始视频的视频文案,其中,所述视频文案包括时间戳;
11、视频生成模块,用于根据所述时间戳将所述视频文案添加至原始视频得到目标视频。
12、第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
13、一个或多个处理器;
14、存储装置,用于存储一个或多个程序,
15、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开任意实施例所述的视频编辑方法。
16、第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开任意实施例所述的视频编辑方法。
17、第五方面,本公开实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开任意实施例所述的视频编辑方法。
18、本公开实施例提供一种视频编辑方法,通过文案生成模型压缩原始视频中的视频帧得到视频帧特征序列,将视频帧特征序列映射到文本特征空间,得到视频映射特征序列,基于视频映射特征序列生成原始视频的视频文案。由于在同一个模型中进行视频帧的向量化以及特征映射,可以避免误差或错误的累计。然后,获取文案生成模型输出的视频文案,根据时间戳将视频文案添加至原始视频得到目标视频。本公开实施例实现自动生成与视频内容相关的视频文案,解决相关技术中视频文案创作难度高的问题。通过本公开实施例可以便捷地生成与视频内容强相关的视频文案,并将视频文案渲染至原始视频得到目标视频,使目标视频具有更高的趣味性和吸引力。
1.一种视频编辑方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述通过所述文案生成模型根据所述视频映射特征序列生成所述原始视频的视频文案,包括:
3.根据权利要求2所述的方法,其特征在于,所述文案生成模型包括文案生成模块,所述文案生成模块的参数在所述文案生成模型的训练过程中被更新;
4.根据权利要求2所述的方法,其特征在于,所述文案生成模型的训练方式包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述视频样本中视频帧、提示信息样本和文案样本对待训练的文案生成模型进行训练,包括:
6.根据权利要求1所述的方法,其特征在于,所述文案生成模型包括视觉编码器和适配器,所述适配器的参数在所述文案生成模型的训练过程中被更新;
7.根据权利要求1所述的方法,其特征在于,所述根据所述时间戳将所述视频文案添加至原始视频得到目标视频,包括:
8.一种视频编辑装置,其特征在于,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的视频编辑方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-7中任一所述的视频编辑方法。