法律状态公告日
法律状态信息
法律状态
2022-09-16
实质审查的生效 IPC(主分类):G06T 3/40 专利申请号:2022106333099 申请日:20220606
实质审查的生效
技术领域
本发明属于计算机视觉领域,具体涉及深度学习,图像压缩,码率控制等技术。
背景技术
图像压缩是图像处理领域的基础课题之一。近年来,在自媒体时代,不仅图片和视频传输的数量在急剧的增加,而且单幅图像包含的数据量也不断增加,对图像压缩技术的性能提出了越来越高的要求。传统图像压缩方法依赖复杂的人工设计和单独优化各个模块,因此进一步追求编码性能改进存在越来越多的挑战。得益于深度学习的蓬勃发展,基于变分自编码器图像压缩框架,且包含超先验网络的模型,即基于超先验可变码率图像压缩由于能够端到端的联合优化各个模块,取得了较好的性能。
尽管基于超先验可变码率压缩图像能用同一模型以不同码率压缩图像,但是在相同权衡参数作为输入下,不同图像输出的码率并不相同。在实际应用中,为了适应传输带宽或者存储要求,需要改变输入(权衡参数)来调整图像的输出码率,以使输出码率接近目标码率,而这一过程需要码率控制来实现。在传统的编码框架下,码率控制算法通常建立R-Q模型或者R-λ模型,其中R-λ模型码率控制通过建立合适的R-D模型,利用R-D优化中的权衡参数λ,建立λ域R-D分析,表征码率与权衡参数之间的关系,通过改变权衡参数λ来调整输出码率。然而,由于编码器的不同,基于上述码率控制方法无法直接用于基于超先验可变码率图像压缩中。
发明内容
本发明针对上述问题,针对基于超先验可变码率图像压缩方法无法针对目标码率快速给出网络应该输入的权衡参数,本发明设计了一种基于超先验可变码率图像压缩的个体R-λ模型码率控制方法,实现了对于任意图像,给定目标码率下,快速计算出应该输入网络的权衡参数。
本发明针对任意基于超先验可变码率图像压缩,为训练好的模型建立平均R-λ模型。
具体的,设计平均R-λ模型为:
λ=α(e
其中,α和β是待拟合的参数。参数模型中减1的原因在于,当权衡参数为0时,码率也为0。
其次,利用训练好的模型使用5个权衡参数对Kodak数据集中的每张图像进行编解码获得码率,并计算每个权衡参数下平均码率,因此可以获得5对权衡参数和码率,并利用这5对数据拟合出平均R-λ模型中α和β。注意,不同训练好的模型拟合的α和β不同。其中,5个权衡参数必须包含初始权衡参数λ
然后,设计个体R-λ模型为:
其中,α和β为平均R-λ模型拟合的结果。ρ为初始权衡参数λ
最后,对于任意输入图像,首先计算出个体R-λ模型,给定目标码率R
有益效果
本发明是第一次实现基于超先验可变码率图像压缩的码率控制方法。为了验证本发明的有效性,针对三个不同的超先验可变码率图像压缩模型进行测试,本发明码率控制的码率平均相对误差在百分之一到百分之三之间。
附图说明
图1、本发明的码率控制方法流程图;
具体实施方式
首先,给定一个训练好的可变码率压缩模型,然后使用5个权衡参数分别输入网络对Kodak数据集每张图像进行编解码获得码率,并计算每个权衡参数下平均码率,其中,5个权衡参数必须包含初始权衡参数λ
然后,对于任意输入图像,将初始权衡参数λ
最后,对于给定目标码率R
本发明是第一次实现基于超先验可变码率压缩网络的码率控制方法。为了验证本发明的有效性,针对三个不同的超先验可变码率压缩网络进行测试,码率控制的平均相对误差在百分之一到百分之三之间。
机译: R-(-)-莫达非尼的多晶型物的组成,制备方法,R-(-)-莫达非尼2:1的制备:S-(+)-莫达非尼,R的III,IV和V形式的制备-(-)莫达非尼治疗和个体性疾病的治疗以及R-(-)-莫达非尼的解决方法以及个体中的曲霉菌素Nt在白天患有过度睡眠,与发作性睡病有关。睡眠呼吸暂停和缺乏注意力过度活跃症(ADHD)
机译: 基于结构磁共振成像的基于个体间和个体间变异性的预测模型的生成方法及其装置
机译: 基于统计模型的H.264 / AVC码率控制方法及装置