首页> 中国专利> 使用基于根据树结构确定的编码单元的预测单元的视频编码方法和视频编码设备以及使用基于根据树结构确定的编码单元的预测单元的视频解码方法和视频解码设备

使用基于根据树结构确定的编码单元的预测单元的视频编码方法和视频编码设备以及使用基于根据树结构确定的编码单元的预测单元的视频解码方法和视频解码设备

摘要

一种对视频编码的方法,所述方法包括:将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出基于分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。

著录项

  • 公开/公告号CN102934436A

    专利类型发明专利

  • 公开/公告日2013-02-13

    原文格式PDF

  • 申请/专利权人 三星电子株式会社;

    申请/专利号CN201180028147.6

  • 发明设计人 闵正惠;韩宇镇;金壹求;

    申请日2011-04-13

  • 分类号H04N7/26;H04N7/32;

  • 代理机构北京铭硕知识产权代理有限公司;

  • 代理人王兆赓

  • 地址 韩国京畿道水原市

  • 入库时间 2024-02-19 18:28:18

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-08

    授权

    授权

  • 2013-03-20

    实质审查的生效 IPC(主分类):H04N7/26 申请日:20110413

    实质审查的生效

  • 2013-02-13

    公开

    公开

说明书

技术领域

本发明涉及在空间区域和变换区域之间执行变换的视频编码和视频解 码。

背景技术

随着开发和提供用于再现和存储高分辨率或高质量视频内容的硬件,对 于有效地对高分辨率或高质量视频内容编码或解码的视频编解码器的需求日 益增加。在传统的视频编解码器中,基于具有预定尺寸的宏块根据有限编码 方法对视频编码。此外,传统的视频编解码器通过使用具有相同尺寸的块对 宏块执行变换和逆变换,从而对视频数据编码和解码。

发明内容

技术问题

本发明提供通过使用分层预测分块在空间区域和变换区域之间执行变换 的视频编码和视频解码。

技术方案

根据本发明的一方面,提供了一种通过使用基于具有树结构的编码单元 的预测单元对视频解码的方法,所述方法包括以下操作:接收关于编码的视 频的比特流并解析比特流;从比特流提取指示作为用于对视频的画面解码的 数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面 的具有树结构的编码单元的编码深度和编码模式的信息;基于编码单元结构 信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当 前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解 码。

有益效果

因为在考虑图像的特性的同时分层调整编码单元,并且在考虑图像的尺 寸的同时增加编码单元的最大尺寸,所以可提高图像压缩效率。因为编码器 发送编码的视频数据以及关于编码深度和编码模式的信息,所以解码器可在 根据具有树结构的编码单元确定至少一个编码深度之后对每条编码的图像数 据解码,从而可提高图像的编码和解码效率。

附图说明

图1是根据本发明实施例的通过使用基于具有树结构的编码单元的预测 单元对视频编码的设备的框图。

图2是根据本发明实施例的通过使用基于具有树结构的编码单元的预测 单元对视频解码的设备的框图。

图3是用于描述根据本发明实施例的编码单元的概念的示图。

图4是根据本发明实施例的基于编码单元的图像编码器的框图。

图5是根据本发明实施例的基于编码单元的图像解码器的框图。

图6是示出根据本发明实施例的根据深度的更深的编码单元以及分块的 示图。

图7是用于描述根据本发明实施例的编码单元和变换单元之间的关系的 示图。

图8是用于描述根据本发明实施例的与编码深度相应的编码单元的编码 信息的示图。

图9是根据本发明实施例的根据深度的更深的编码单元的示图。

图10至图12是用于描述根据本发明实施例的编码单元、预测单元和变 换单元之间的关系的示图。

图13是用于描述根据表1的编码模式信息的编码单元、预测单元或分块 和变换单元之间的关系的示图。

图14是示出根据本发明实施例的通过使用基于具有树结构的编码单元 的预测单元对视频编码的方法的流程图。

图15是示出根据本发明实施例的通过使用基于具有树结构的编码单元 的预测单元对视频解码的方法的流程图。

最佳模式

根据本发明的一方面,提供了一种通过使用基于具有树结构的编码单元 的预测单元对视频解码的方法,所述方法包括以下操作:接收关于编码的视 频的比特流并解析所述比特流;从所述比特流提取指示作为用于对视频的画 面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及 关于画面的具有树结构的编码单元的编码深度和编码模式的信息;基于编码 单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单 元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对 所述画面解码。

分块类型可包括具有与当前编码单元相同尺寸的数据单元,并且通过分 割当前编码单元的高度和宽度之一来获得部分数据单元。

根据本发明的另一方面,提供了一种通过使用基于具有树结构的编码单 元的预测单元对视频编码的方法,所述方法包括以下操作:将视频的画面分 割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单 元;基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的 分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度 的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或 多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个 最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出基于 分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的 信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息。

根据本发明的另一方面,提供了一种包括视频解码处理器并使用基于具 有树结构的编码单元的预测单元的视频解码设备,所述视频解码设备包括: 接收器,接收关于编码的视频的比特流并解析所述比特流;提取器,从所述 比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和 可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编 码深度和编码模式的信息;解码器,与视频解码处理器结合,基于编码单元 结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基 于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画 面解码。

根据本发明的另一方面,提供了一种包括视频编码处理器并使用基于具 有树结构的编码单元的预测单元的视频编码设备,所述视频编码设备包括: 最大编码单元分割器,将视频的画面分割为一个或多个最大编码单元,所述 最大编码单元是具有最大尺寸的编码单元;编码单元确定器,与视频编码处 理器结合,基于根据深度的编码单元并基于按照根据深度的编码单元的深度 确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编 码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述 一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个 或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输 出单元,输出基于分块类型和具有树结构的编码单元编码的数据、关于编码 深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结 构信息。

根据本发明的另一方面,提供了一种记录有通过使用计算机执行对视频 编码的方法的程序的计算机可读记录介质。根据本发明的另一方面,提供了 一种记录有通过使用计算机执行对视频解码的方法的程序的计算机可读记录 介质。

具体实施方式

在下文中,将参照附图更全面地描述本发明,在附图中示出本发明的示 例性实施例。在本发明的实施例中,术语“图像”不仅可指示静止图像,而 且可指示诸如视频的运动图像。

在下文中,将参照图1至图15详细地描述通过使用基于具有树结构的编 码单元的预测单元对视频编码和解码的设备和方法。

图1是根据本发明实施例的通过使用基于具有树结构的编码单元的预测 单元对视频编码的设备100的框图。

通过使用基于具有树结构的编码单元的预测单元对视频编码的设备100 包括最大编码单元分割器110、编码单元确定器120和输出单元130。在下文 中,为了便于描述,通过使用基于具有树结构的编码单元的预测单元对视频 编码的设备100被称为“视频编码设备100”。

最大编码单元分割器110可基于用于图像的当前画面的最大编码单元来 分割当前画面。如果当前画面大于最大编码单元,则当前画面的图像数据可 被分割为至少一个最大编码单元。根据本发明实施例的最大编码单元可以是 具有32×32、64×64、128×128、256×256等尺寸的数据单元,其中,数据 单元的形状是具有宽度和长度为2的若干次方的正方形。根据至少一个最大 编码单元,图像数据可被输出到编码单元确定器120。

根据本发明实施例的编码单元可由最大尺寸和深度来表示特性。深度表 示从最大编码单元空间分割编码单元的次数,并且随着深度加深,可从最大 编码单元到最小编码单元分割根据深度的更深的编码单元。最大编码单元的 深度是最高的深度,最小编码单元的深度是最低的深度。因为与每个深度相 应的编码单元的尺寸随着最大编码单元的深度加深而减小,所以与较高的深 度相应的编码单元可包括与较低的深度对应的多个编码单元。

如上所述,当前画面的图像数据根据编码单元的最大尺寸被分割为多个 最大编码单元,并且每个最大编码单元可包括根据深度分割的更深的编码单 元。因为根据本发明实施例的最大编码单元根据深度被分割,所以包括在最 大编码单元中的空间域的图像数据可根据深度被分层地分类。

编码单元的最大深度和最大尺寸可以被预先确定,所述最大深度和最大 尺寸限制最大编码单元的高度和宽度被分层分割的总次数。

编码单元确定器120对通过根据深度分割最大编码单元的区域获得的至 少一个分割区域编码,并根据至少一个分割区域确定深度以输出最终编码的 图像数据。换句话说,编码单元确定器120通过根据当前画面的最大编码单 元根据深度以更深的编码单元对图像数据编码并选择具有最小编码误差的深 度,来确定编码深度。因此,与确定的编码深度相应的编码单元的编码的图 像数据被最终输出。此外,与编码深度相应的编码单元可被视为编码的编码 单元。

确定的编码深度和根据确定的编码深度的编码的图像数据被输出到输出 单元130。

基于与等于或小于最大深度的至少一个深度相应的更深的编码单元对最 大编码单元中的图像数据编码,并且基于每个更深的编码单元比较编码图像 数据的结果。可在比较更深的编码单元的编码误差之后选择具有最小编码误 差的深度。可为每个最大编码单元选择至少一个编码深度。

随着根据深度对编码单元进行分层分割且随着编码单元的数量的增加, 最大编码单元的尺寸被分割。另外,即使在一个最大编码单元中多个编码单 元对应于相同深度,也通过单独测量每个编码单元的图像数据的编码误差来 确定是否将与相同深度对应的每个编码单元分割至更低的深度。因此,即使 在图像数据被包括在一个最大编码单元中时,也根据深度将图像数据分割至 多个区域,并且在所述一个最大编码单元中编码误差可根据区域而不同,因 此,在图像数据中,编码深度可根据区域而不同。因此,可在一个最大编码 单元中确定一个或多个编码深度,并可根据至少一个编码深度的编码单元对 最大编码单元的图像数据进行分割。

因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构 的编码单元。根据本发明实施例的“具有树结构的编码单元”包括在最大编 码单元中所包括的所有更深的编码单元中与确定为编码深度的深度相应的编 码单元。可在最大编码单元的相同区域中根据深度来分层确定编码深度的编 码单元,并且可在不同区域中独立地确定编码深度的编码单元。类似地,当 前区域中的编码深度可与另一区域中的编码深度被独立地确定。

根据本发明实施例的最大深度是与从最大编码单元到最小编码单元的分 割次数相关的数。根据本发明实施例的最大深度可表示从最大编码单元到最 小编码单元的总分割次数。例如,当最大编码单元的深度为0时,最大编码 单元被分割一次的编码单元的深度可被设置为1,最大编码单元被分割两次 的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元 被分割四次的编码单元,则存在深度0、1、2、3和4的5个深度级,因此, 最大深度可被设置为4。

可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基 于根据等于最大深度的深度或小于最大深度的深度的更深的编码单元,执行 预测编码和变换。可根据频率变换、正交变换或整数变换的方法来执行变换。

因为每当最大编码单元根据深度被分割时更深的编码单元的数量都增 加,所以对随着深度加深而产生的所有的更深的编码单元执行包括预测编码 和变换的编码。为了方便描述,现在将基于最大编码单元中的当前深度的编 码单元描述预测编码和变换。

视频编码设备100可不同地选择用于对图像数据编码的数据单元的尺寸 或形状。为了对图像数据编码,执行诸如预测编码、变换和熵编码的操作, 并且同时,相同的数据单元可被用于所有的操作,或者不同的数据单元可被 用于各个操作。

例如,视频编码设备100可不仅选择用于对图像数据编码的编码单元, 还可选择与编码单元不同的数据单元以对编码单元中的图像数据执行预测编 码。

为了以最大编码单元执行预测编码,可基于与编码深度相应的编码单元, 即,基于不再被分割为与更低的深度相应的编码单元的编码单元,执行预测 编码。以下,不再被分割并且变为用于预测编码的基本单元的编码单元现将 被称为“预测单元”。通过分割预测单元获得的分块可包括通过分割预测单元 的高度和宽度中的至少一个获得的预测单元或数据单元。

例如,当2N×2N(其中,N是正整数)的编码单元不再被分割并且变为 2N×2N的预测单元时,分块的尺寸可以是2N×2N、2N×N或N×2N。分块类 型的示例包括通过对称地分割预测单元的高度或宽度获得的对称分块、通过 非对称地分割预测单元的高度或宽度(诸如1:n或n:1)获得的分块、通 过几何地分割预测单元获得的分块、以及具有任意形状的分块。

可根据是否对具有当前深度或更低深度的当前编码单元执行分割来确定 编码单元的分块类型或预测单元的尺寸。

当当前编码单元的分块类型是对称分块类型时,当前编码单元的对称分 块类型可包括具有与当前编码单元相同尺寸的分块以及通过将当前编码单元 的高度或宽度除以二获得的分块。也就是说,具有2N×2N尺寸的编码单元的 对称分块类型可包括2N×2N、2N×N或N×2N的分块。

当当前编码单元不再被分给为更低深度的编码单元时,当前编码单元的 对称分块类型可包括具有与更低深度的编码单元相同尺寸的分块。也就是说, 当当前编码单元是不能被分割为更低深度的编码单元并且是当前最大编码单 元中的最小编码单元时,当前编码单元的对称分块类型不仅可包括2N×2N、 2N×N或N×2N的分块,而且可包括具有N×N尺寸的分块。

相似地,当当前编码单元是当前最大编码单元中的最低深度的编码单元 时,当前编码单元的对称分块类型不仅可包括2N×2N、2N×N或N×2N的分 块,而且可包括具有N×N尺寸的分块。

例如,当具有当前深度以及2N×2N尺寸的编码单元被分割一次,从而被 划分为具有更低深度以及N×N尺寸的编码单元时,可通过使用具有N×N尺 寸的分块对具有N×N尺寸的编码单元执行帧内预测和帧间预测。因此,为了 避免不必要的处理的重复,在根据本实施例的分层编码单元的结构中,不会 将具有N×N尺寸的分块类型设置到具有2N×2N尺寸的编码单元。

然而,当具有2N×2N尺寸的当前编码单元是最小编码单元时,当前编码 单元不再被分割为具有N×N尺寸的编码单元,从而可通过使用具有N×N尺 寸的分块对当前编码单元执行帧间预测或帧内预测。因此,具有2N×2N尺寸 的最小编码单元的分块类型可包括2N×2N、2N×N、N×2N和N×N的分块。

预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一 个。例如,可对2N×2N、2N×N或N×2N的分块执行帧内模式和帧间模式的 预测编码。

也就是说,在以下至少一种情况下,可跳过通过使用N×N的分块执行的 帧间预测和帧内预测,所述情况包括:当前编码单元不是最小编码单元,当 前编码单元被分割为更低深度的编码单元,以及当前编码单元不是当前最大 编码单元中的最低深度的编码单元。

然而,当当前编码单元是最小编码单元时,因为,不能对更低深度的编 码单元执行帧内预测和帧间预测,所以可通过使用2N×2N、2N×N、N×2N和 N×N的分块对最小编码单元执行帧间预测和帧内预测。

此外,可仅对2N×2N的分块执行跳过模式。对编码单元中的一个预测单 元独立地执行编码,从而选择引起最小编码误差的预测模式。

视频编码设备100还可不仅基于用于对图像数据编码的编码单元,而且 基于与该编码单元不同的数据单元,对编码单元中的图像数据执行变换。

为了以编码单元执行变换,可基于具有小于或等于所述编码单元的尺寸 的变换单元来执行变换。例如,用于变换的变换单元可包括针对帧内模式的 变换单元和针对帧间模式的变换单元。

与具有树结构的编码单元相似,编码单元中的变换单元可被递归地分割 为更小尺寸的区域。因此,编码单元中的残差数据可根据变换深度按照具有 树结构的变换被分割。

指示通过分割编码单元的高度和宽度达到变换单元的分割次数的变换深 度也可被设置在变换单元中。例如,在2N×2N的当前编码单元中,当变换单 元的尺寸也为2N×2N时,变换深度可以为0;当变换单元的尺寸为N×N时, 变换深度可以为1;当变换单元的尺寸为N/2×N/2时,变换深度可以为2。 也就是说,可根据变换深度的分层特性按照分层树结构来设置变换单元。

根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信 息,还需要关于与预测编码和变换相关的信息。因此,编码单元确定器120 不仅确定具有最小编码误差的编码深度,还确定预测单元中的分块类型、根 据预测单元的预测模式以及用于变换的变换单元的尺寸。

稍后将参照图3至图13详细地描述根据本发明实施例的最大编码单元中 的根据树结构的编码单元以及确定分块的方法。

编码单元确定器120可通过使用基于拉格朗日乘法(Lagrangian  multiplier)的率失真最优化,测量根据深度的更深的编码单元的编码误差。

输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码 深度的编码模式的信息,其中,基于由编码单元确定器120确定的至少一个 编码深度对最大编码单元的图像数据编码。

可通过对图像的残差数据编码来获得编码的图像数据。

关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于 预测单元中的分块类型、预测模式和变换单元的尺寸的信息。

可通过使用根据深度的分割信息定义关于编码深度的信息,所述根据深 度的分割信息指示是否对更低深度而非当前深度的编码单元执行编码。如果 当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码 和输出,并且因此分割信息可被定义为不将当前编码单元分割至更低深度。 可选择地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编 码单元执行编码,并且因此分割信息可被定义为对当前编码单元进行分割以 获得更低深度的编码单元。

如果当前深度不是编码深度,则对被分割为更低深度的编码单元的编码 单元执行编码。因为在当前深度的一个编码单元中存在更低深度的至少一个 编码单元,所以对更低深度的每个编码单元重复执行编码,从而可针对具有 相同深度的编码单元递归地执行编码。

因为针对一个最大编码单元确定具有树结构的编码单元,并且针对编码 深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编 码单元确定关于至少一个编码模式的信息。另外,因为根据深度分层地分割 图像数据,所以最大编码单元的图像数据的编码深度可根据位置而不同,从 而可为图像数据设置关于编码深度和编码模式的信息。

因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分 配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。 输出单元130可将关于相应的编码深度和相应的编码模式的信息插入到比特 流的头中,以发送编码的视频数据、序列参数集(SPS)或画面参数集(PPS), 并且可输出编码的视频数据、序列参数集(SPS)或画面参数集(PPS)。

根据本发明实施例的最小单元是通过将组成最低深度的最小编码单位分 割为4份而获得的矩形数据单元。根据本发明实施例的最小单元可以是最大 矩形数据单元,所述最大矩形数据单元可被包括在最大编码单元中所包括的 所有编码单元、预测单元、分块单元和变换单元中。

例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编 码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预 测模式的信息以及关于分块的尺寸的信息。根据预测单元的编码信息可包括 关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关 于运动矢量的信息、关于帧内模式的色度分量的信息以及关于帧内模式的插 值方法的信息。

另外,关于根据序列、画面、像条或GOP定义的编码单元的尺寸以及可 变深度的编码单元结构信息可被插入到SPS、PPS或比特流的头中。

可变深度不仅可指示具有树结构的当前编码单元的允许的最大深度,而 且可指示具有最小尺寸的编码单元的最低深度、深度级的数量或者深度变化。

深度级的数量可指示根据深度的更深的编码单元的深度级的数量,所述 更深的编码单元可存在于具有树结构的当前编码单元中。深度变化可指示根 据深度的更深的编码单元的变化的数量,所述更深的编码单元可存在于具有 树结构的当前编码单元中。

可根据序列、画面、像条或GOP来设置关于可变深度的信息。也就是说, 可针对序列、画面、像条或GOP的每个数据单元设置关于可变深度的信息以 及关于在具有树结构的当前编码单元中的编码单元的最大尺寸的信息或关于 最小尺寸的信息。

因此,输出单元130可包括作为编码单元结构信息的编码信息(所述编 码信息包括关于可变深度的信息、关于编码单元的最大尺寸的信息和关于编 码单元的最小尺寸的信息中的至少两个),可将所述编码信息插入到比特流的 头(即,SPS或PPS)中,然后可输出比特流。根据序列、画面、像条或GOP 来分别确定可变深度以及编码单元的最大尺寸和最小尺寸。此外,从输出单 元130输出的编码信息可包括变换索引。变换索引信息可指示关于用于变换 当前编码单元的变换单元的结构的信息。变换索引信息可指示当前变换单元 是否被分割为更低级的变换单元。

在视频编码设备100中,更深的编码单元可以是通过将上面一级的更高 深度的编码单元的高度或宽度除以二获得的编码单元。换句话说,当当前深 度的编码单元的尺寸为2N×2N时,更低深度的编码单元的尺寸为N×N。此 外,具有2N×2N尺寸的当前深度的编码单元可包括最多四个更低深度的编码 单元。

因此,视频编码设备100可基于考虑当前画面的特性确定的最大编码单 元的尺寸和最大深度,通过确定针对每个最大编码单元的具有最佳形状和最 佳尺寸的编码单元,来形成具有树结构的编码单元。此外,因为可通过使用 各种预测模式和变换中的任意一个来对每个最大编码单元执行编码,所以可 考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。

因此,如果以传统的宏块来对具有高分辨率或大数据量的图像编码,则 每个画面的宏块的数量急剧增加。因此,针对每个宏块产生的压缩信息的条 数增加,从而难以发送压缩信息并且数据压缩效率降低。然而,通过使用视 频编码设备100,因为在考虑图像的特性的同时调整编码单元并且在考虑图 像的尺寸的同时增加编码单元的最大尺寸,所以图像压缩效率可以被提高。

图2是根据本发明实施例的通过使用基于按照树结构的编码单元的预测 单元对视频解码的设备200的框图。

通过使用基于按照树结构的编码单元的预测单元对视频解码的设备200 包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。 在下文中,为了便于描述,通过使用基于按照树结构的编码单元的预测单元 对视频解码的设备200被称为“视频解码设备200”。

用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、 预测单元、变换单元以及关于各种编码模式的信息)的定义与参照图1和视 频编码设备100所描述的术语的定义相同。

接收器210接收并解析已编码的视频的比特流。图像数据和编码信息提 取器220从解析的比特流中提取每个编码单元的编码的图像数据,并将提取 的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大 编码单元的树结构。图像数据和编码信息提取器220可从接收的比特流中关 于当前画面的头、SPS和PPS中的至少一个提取关于当前画面的编码单元的 尺寸和可变深度的编码单元结构信息以及关于编码深度和编码模式的信息。

图像数据和编码信息提取器220可从编码信息中提取关于可变深度的信 息以及关于序列、画面、像条或GOP的每个数据单元的具有树结构的编码单 元中的编码单元的可允许的最大尺寸的信息和关于可允许的最小尺寸的信息 中的一个。图像数据解码器230可通过使用关于可变深度的信息、关于编码 单元的最大尺寸的信息以及关于编码单元的最小尺寸的信息中的至少两条来 确定序列、画面、像条或GOP的每个数据单元的具有树结构的编码单元中的 编码单元的可允许的最大尺寸和可允许的最小尺寸。

可从编码信息中提取针对每个画面、像条或GOP确定的关于可变深度的 信息、关于编码单元的最大尺寸的信息以及关于编码单元的最小尺寸的信息 中的至少两条,并且可基于读取的信息来确定当前数据单元的可允许的最大 尺寸和可允许的最小尺寸。此外,图像数据和编码信息提取器220从解析的 比特流提取关于编码单元的编码深度和编码模式的信息,其中,编码单元具 有根据每个最大编码单元的树结构。提取的关于编码深度和编码模式的信息 被输出到图像数据解码器230。换句话说,比特流中的图像数据被分割为最 大编码单元,从而图像数据解码器230对每个最大编码单元的图像数据解码。

可针对关于与编码深度对应的至少一个编码单元的信息设置关于根据最 大编码单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于 与编码深度对应的相应的编码单元的的分块类型的信息、关于预测模式以及 变换单元的尺寸的信息。另外,根据深度的分割信息可被提取作为关于编码 深度的信息。

此外,图像数据解码器230可从自解析的比特流提取的编码信息读取关 于变换索引的信息。图像数据解码器230可基于由图像数据和编码信息提取 器220提取的图像数据和变换索引信息来构造当前编码单元的变换单元,可 基于变换单元执行当前编码单元的逆变换,从而可对编码的数据解码。作为 对编码单元解码的结构,可恢复当前画面。

关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的 编码模式和编码深度的信息是这样的信息,即:关于被确定为当编码器(诸 如视频编码设备100)根据每个最大编码单元针对根据深度的每个更深的编 码单元重复执行编码时产生最小编码误差的编码深度和编码模式的信息。因 此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式 对图像数据解码来恢复图像。

因为关于编码深度和编码模式的编码信息可被分配给相应的编码单元、 预测单元和最小单元中的预定数据单元,所以图像数据和编码信息提取器220 可根据预定数据单元提取关于编码深度和编码模式的信息。被分配有相同的 关于编码深度和编码模式的信息的预定数据单元可被推断为是包括在同一最 大编码单元中的数据单元。

图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码 模式的信息,对每个最大编码单元中的图像数据解码来恢复当前画面。换句 话说,图像数据解码器230可基于针对包括在每个最大编码单元中的具有树 结构的编码单元中的每个编码单元提取的关于分块类型、预测模式和变换单 元的信息,来对编码的图像数据解码。解码处理可包括预测和逆变换,所述 预测包括帧内预测和运动补偿。可根据逆正交变换或逆整数变换的方法来执 行逆变换。

图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的 预测模式和分块类型的信息,根据每个编码单元的预测模式和分块执行帧内 预测或运动补偿。

此外,图像数据解码器230可通过读取根据树结构的变换单元以及关于 根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个 变换单元来执行逆变换,以根据最大编码单元执行逆变换。

图像数据解码器230可通过使用根据深度的分割信息,确定当前最大编 码单元的至少一个编码深度。如果所述分割信息指示在当前深度中不再分割 图像数据,则当前深度是编码深度。因此,图像数据解码器230可通过使用 关于预测单元的分块类型、预测模式、针对与编码深度相应的每个编码单元 的变换单元的尺寸的信息,对当前最大编码单元中的与每个编码深度相应的 至少一个编码单元的已编码的数据进行解码,并输出当前最大编码单元的图 像数据。

换句话说,可通过观察为编码单元、预测单元和最小单元中的预定数据 单元分配的编码信息,聚集包含编码信息(所述编码信息包括相同的分割信 息)的编码单元,并且聚集的数据单元可被考虑为一个数据单元,从而通过 图像数据解码器230以相同的编码模式被解码。

视频解码设备200可在对每个最大编码单元递归地执行编码时,获得关 于产生最小编码误差的至少一个编码单元的信息,并且视频解码设备200可 使用所述信息来对当前画面解码。换句话说,可以对在每个最大编码单元中 被确定为最佳编码单元的具有树结构的编码单元解码。此外,考虑图像数据 的分辨率和数据量来确定编码单元的最大尺寸。

因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元 的尺寸和编码模式对所述图像数据进行有效地解码和恢复,其中,通过使用 从编码器接收的关于最佳编码模式的信息,根据图像数据的特性来自适应地 确定编码单元的尺寸和编码模式。

现在将参照图3至图13描述根据本发明实施例的确定具有树结构的编码 单元、预测单元和变换单元的方法。

图3是用于描述根据本发明实施例的编码单元的概念的示图。

可以以宽度×高度来表示编码单元的尺寸,并且编码单元的尺寸可以是 64×64、32×32、16×16和8×8。

在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64, 最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大 尺寸是64,最大深度是3。在视频数据330中,分辨率是352×288,编码单 元的最大尺寸是16,最大深度是1。图3中示出的最大深度表示从最大编码 单元到最小编码单元的分割的总数。

如果分辨率高或者数据量大,则编码单元的最大尺寸可能大,以便不仅 提高编码效率,还精确地反映图像的特性。因此,具有比视频数据330高的 分辨率的视频数据310和320的编码单元的最大尺寸可以为64。

因为视频数据310的最大深度是2,所以视频数据310的编码单元315 可包括具有64的长轴(long axis)大小的最大编码单元,以及由于通过分 割最大编码单元两次将深度加深至两级而具有32和16的长轴大小的编码单 元。同时,因为视频数据330的最大深度是1,所以视频数据330的编码单 元335可包括具有16的长轴大小的最大编码单元,以及由于通过分割最大编 码单元一次将深度加深至一级而具有8的长轴大小的编码单元。

因为视频数据320的最大深度是3,所以视频数据320的编码单元325 可包括具有64的长轴大小的最大编码单元,以及由于通过分割最大编码单元 三次将深度加深至3级而具有32、16和8的长轴大小的编码单元。随着深度 加深,详细信息可被精确地表示。

具有64×64、64×32、32×64尺寸的分块类型可被设置到具有64×64 尺寸的编码单元。因为具有64×64尺寸的编码单元不是关于多条视频数据 310、320和330的最小解码单元,所以不会设置具有32×32尺寸的分块类 型。

具有32×32、32×16、16×32尺寸的分块类型可被设置到具有32×32 尺寸的编码单元。因为具有32×32尺寸的编码单元不是关于多条视频数据 310、320和330的最小解码单元,所以不会设置具有16×16尺寸的分块类 型。

具有16×16、16×8、8×16尺寸的分块类型可被设置到具有16×16尺 寸的编码单元。因为具有16×16尺寸的编码单元是关于视频数据310的最小 解码单元,所以可设置具有8×8尺寸的分块类型。然而,具有16×16尺寸 的编码单元不是关于多条视频数据320和330的最小解码单元,所以不会设 置具有8×8尺寸的分块类型。

在这点上,因为具有8×8尺寸的编码单元是关于多条视频数据310、320 和330的最小解码单元,所以不仅可设置具有8×8、8×4、4×8尺寸的分块 类型,而且可设置具有4×4尺寸的分块类型。

图4是根据本发明实施例的基于编码单元的图像编码器400的框图。

图像编码器400执行视频编码设备100的编码单元确定器120的操作, 以对图像数据编码。换句话说,在当前帧405中,帧内预测器410在帧内模 式下对编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用 当前帧405和参考帧495,在当前帧405中,在帧间模式下对编码单元执行 帧间估计和运动补偿。

从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过 变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反 量化器460和逆变换器470被恢复为在空间域中的数据,并且空间域中的恢 复的数据在通过去块单元480和环路滤波单元490进行后处理之后,被输出 为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。

为了在视频编码设备100中应用图像编码器400,图像编码器400的所 有部件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、 量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和 环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有 树结构的编码单元中的每个编码单元执行操作。

具体地讲,帧内预测器410、运动估计器420以及运动补偿器425在考 虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码 单元中的每个编码单元的分块和预测模式,变换器430确定在具有树结构的 编码单元中的每个编码单元中的变换单元的尺寸。

图5是根据本发明实施例的基于编码单元的图像解码器500的框图。

解析器510从比特流505对将被解码的已编码的视频数据以及关于进行 解码所需的编码的信息进行解析。编码的视频数据通过熵解码器520和反量 化器530被输出为反量化的数据,并且反量化的数据通过逆变换器540被恢 复为在空间域中的图像数据。

帧内预测器550针对空间域中的图像数据,在帧内模式下对编码单元执 行帧内预测,运动补偿器560通过使用参考帧585,在帧间模式下对编码单 元执行运动补偿。

经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过 去块单元570和环路滤波单元580进行后处理之后,被输出为恢复的帧595。 另外,通过去块单元570和环路滤波单元580进行后处理的图像数据可被输 出为参考帧585。

为了在图像解码设备200的图像数据解码器230中对图像数据解码,图 像解码器500可执行在解析器510之后执行的操作。

为了在视频解码设备200中应用图像解码器500,图像解码器500的所 有部件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧 内预测器550、运动补偿器560、去块单元570以及环路滤波单元580)基于 针对每个最大编码单元的具有树结构的编码单元执行操作。

具体地讲,帧内预测器550和运动补偿器560基于每个具有树结构的编 码单元的分块和预测模式来执行操作,逆变换器540基于每个编码单元的变 换单元的尺寸来执行操作。

图6是示出根据本发明实施例的根据深度的更深的编码单元以及分块的 示图。

视频编码设备100和视频解码设备200使用分层编码单元,以考虑图像 的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性被自 适应地确定,或者可由用户不同地设置。可根据编码单元的预定最大尺寸来 确定根据深度的更深编码单元的尺寸。

在根据本发明实施例的编码单元的分层结构600中,编码单元的最大高 度和最大宽度均是64,最大深度是3。这里,最大深度指示从最大编码单元 到最小编码单元的根据深度的编码单元的分割的总数。因为深度沿分层结构 600的纵轴加深,所以更深的编码单元的高度和宽度均被分割。另外,预测 单元和分块沿分层结构600的横轴被示出,其中,所述预测单元和分块是每 个更深的编码单元的预测编码的基础。

换句话说,编码单元610是分层结构600中的最大编码单元,其中,深 度是0,尺寸(即,高度乘以宽度)是64×64。深度沿纵轴加深,并且存在 尺寸为32×32且深度为1的编码单元620、尺寸为16×16且深度为2的编 码单元630、尺寸为8×8且深度为3的编码单元640。尺寸为8×8且深度为 3的编码单元640是最小编码单元。

编码单元的预测单元和分块根据每个深度沿横轴排列。换句话说,如果 尺寸为64×64且深度为0的编码单元610是预测单元,则预测单元可被分割 为包括在编码单元610中的分块,即,尺寸为64×64的分块610、尺寸为 64×32的分块612、尺寸为32×64的分块614。因为尺寸为64×64的编码 单元610不是最小编码单元,所以不设置尺寸为32×32的分块。

类似地,尺寸为32×32且深度为1的编码单元620的预测单元可被分割 为包括在编码单元620中的分块,即,尺寸为32×32的分块620、尺寸为 32×16的分块622、尺寸为16×32的分块624。因为尺寸为32×32的编码 单元620不是最小编码单元,所以不设置尺寸为16×16的分块。

类似地,尺寸为16×16且深度为2的编码单元630的预测单元可被分割 为包括在编码单元630中的分块,即,包括在编码单元630中的尺寸为16×16 的分块、尺寸为16×8的分块632、尺寸为8×16的分块634。因为尺寸为 16×16的编码单元630不是最小编码单元,所以不设置尺寸为8×8的分块。

最终,尺寸8×8且深度为3的编码单元640的预测单元是最小编码单元 并且具有最低的深度,因此可被分割为包括在编码单元640中的分块,即, 括在编码单元640中的尺寸为8×8的分块、尺寸为8×4的分块642、尺寸 为4×8的分块644以及尺寸为4×4的分块646。

为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频 编码设备100的编码单元确定器120针对与包括在最大编码单元610中的每 个深度相应的编码单元执行编码。

根据深度的更深的编码单元的数量随着深度加深而增加,其中,所述根 据深度的更深的编码单元包括相同范围和相同大小的数据。例如,与深度2 相应的四个编码单元需要覆盖包括在与深度1对应的一个编码单元中的数 据。因此,为了比较根据深度的相同数据的编码结果,与深度1相应的编码 单元和与深度2相应的四个编码单元均被编码。

为了针对多个深度中的当前深度执行编码,可通过沿分层结构600的横 轴对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深 度选择最小编码误差。可选择地,随着深度沿分层结构600的纵轴加深,可 通过针对每个深度执行编码比较根据深度的最小编码误差,来搜索最小编码 误差。编码单元610中具有最小编码误差的深度和分块可被选择为编码单元 610的编码深度和分块类型。

图7是用于描述根据本发明实施例的编码单元710和变换单元720之间 的关系的示图。

视频编码设备100或视频解码设备200针对每个最大编码单元,根据尺 寸小于或等于最大编码单元的编码单元对图像编码或解码。可基于不大于相 应的编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。

例如,在视频编码设备100或视频解码设备200中,如果编码单元710 的尺寸是64×64,则可通过使用尺寸为32×32的变换单元720来执行变换。

此外,可通过对尺寸为小于64×64的32×32、16×16、8×8以及4×4 的每个变换单元执行变换来对尺寸为64×64的编码单元710的数据编码,随 后可选择具有最小编码误差的变换单元。

图8是用于描述根据本发明实施例的与编码深度相应的编码单元的编码 信息的示图。

视频编码设备100的输出单元130可对关于分块类型的信息800、关于 预测模式的信息810和关于与编码深度相应的每个编码单元的变换单元的尺 寸的信息820进行编码和发送,作为关于编码模式的信息。

信息800指示关于通过分割当前编码单元的预测单元获得的分块的形状 的信息,其中,所述分块是用于对当前编码单元进行预测编码的数据单元。 例如,尺寸为2N×2N的当前编码单元CU_0可被分割为尺寸为2N×2N的分块 802、尺寸为2N×N的分块804、尺寸为N×2N的分块806中的任意一个。这 里,关于分块类型的信息800被设置为指示尺寸为2N×N的分块804以及尺 寸为N×2N的分块806中的一个。然而,当尺寸为2N×2N的当前编码单元 CU_0是最小编码单元时,关于分块类型的信息800可包括尺寸为N×N的分 块808。

信息810指示每个分块的预测模式。例如,信息810可指示对由信息800 指示的分块执行的预测编码的模式,即,帧内模式812、帧间模式814或跳 过模式816。

信息820指示当对当前编码单元执行变换时所基于的变换单元。例如, 变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变 换单元826或第二帧间变换单元828。

视频解码设备200的图像数据和编码信息提取器220可根据每个更深的 编码单元提取并使用信息800、810和820以进行解码。

图9是根据本发明实施例的根据深度的更深的编码单元的示图。

分割信息可被用于指示深度的改变。分割信息指示当前深度的编码单元 是否被分割成更低深度的编码单元。

用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预 测单元910可包括尺寸为2N_0×2N_0的分块类型912的分块、尺寸为 2N_0×N_0的分块类型914的分块、尺寸为N_0×2N_0的分块类型916的分 块。图9仅示出了通过对称地分割预测单元910获得的分块类型912至916, 但是分块类型不限于此,并且预测单元910的分块可包括非对称的分块、具 有任意形状的分块和具有几何形状的分块。

根据每个分块类型,对尺寸为2N_0×2N_0的一个分块、尺寸为2N_0×N_0 的两个分块、尺寸为N_0×2N_0的两个分块重复执行预测编码。可对尺寸为 2N_0×2N_0、N_0×2N_0、2N_0×N_0的分块执行帧内模式和帧间模式下的预 测编码。可仅对尺寸为2N_0×2N_0的分块执行跳过模式下的预测编码。

如果在尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0的分块类型912到分 块类型916的一个分块类型中编码误差最小,则预测单元910可以不被分割 至更低的深度。然而,如果在尺寸为N_0×N_0的编码单元930中编码误差最 小,则深度从0改变到1,以执行分割(操作920),并对深度为1且尺寸为 N_0×N_0的编码单元920重复执行编码,以搜索最小编码误差。

用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进 行预测编码的预测单元940可包括尺寸为2N_1×2N_1的分块类型942的分 块、尺寸为2N_1×N_1的分块类型944的分块、尺寸为N_1×2N_1的分块类 型946的分块。

如果与尺寸为2N_1×2N_1、2N_1×N_1、N_1×2N_1的分块类型942至 946中的编码误差相比,尺寸为N_2×N_2的编码单元960中编码误差最小, 则深度从1改变到2以执行分割(操作950),并对深度为2且尺寸为N_2×N_2 的编码单元960重复执行编码,以搜索最小编码误差。

当最大深度是d-1时,根据每个深度的编码单元可被分割,直到深度变 为d-1,并且分割信息可被编码,直到深度为0至d-2之一。换句话说,在 操作970中将与深度为d-2相应的编码单元分割之后,当执行编码直到深度 为d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980 进行预测编码的预测单元990可包括尺寸为2N_(d-1)×2N_(d-1)的分块类型 992的分块、尺寸为2N_(d-1)×N_(d-1)的分块类型994的分块、尺寸为 N_(d-1)×2N_(d-1)的分块类型996的分块以及尺寸为N_(d-1)×N_(d-1)的 分块类型998的分块。可在分块类型992至分块类型998之中,对尺寸为 2N_(d-1)×2N_(d-1)的一个分块、尺寸为2N_(d-1)×N_(d-1)的两个分块、 尺寸为N_(d-1)×2N_(d-1)的两个分块、尺寸为N_(d-1)×N_(d-1)的四个分 块重复执行预测编码,以搜索具有最小编码误差的分块类型。

即使当分块类型998具有最小编码误差时,因为最大深度为d-1,所以 深度为d-1的编码单元CU_(d-1)也不再被分割至更低深度,构成当前最大编 码单元900的编码单元的编码深度被确定为d-1,并且当前最大编码单元900 的分块类型可被确定为N_(d-1)×N_(d-1)。此外,因为最大深度为d-1,并 且具有最低深度d-1的最小编码单元980不再被分割至更低深度,所以不设 置用于最小编码单元980的分割信息。

因为深度为0且尺寸为2N_0×2N_0的编码单元900和深度为1且尺寸为 2N_1×2N_1的编码单元930不是最小编码单元,所以尺寸为2N_0×2N_0的 编码单元900的预测单元910不会包括尺寸为N_0×N_0的分块类型,尺寸为 2N_1×2N_1的编码单元930的预测单元940不会包括尺寸为N_1×N_1的分 块类型。

然而,用于对作为最小编码单元的深度为d-1的编码单元980进行预测 编码的预测单元990可包括尺寸为N_(d-1)×N_(d-1)的分块类型998。

数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明 实施例的最小单元可以是通过将最小编码单元980分割为4份而获得的矩形 数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单 元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度, 并且可将相应的分块类型和预测模式设置为编码深度的编码模式。

这样,在所有深度1至d中比较根据深度的最小编码误差,并且具有最 小编码误差的深度可被确定为编码深度。编码深度、预测单元的分块类型和 预测模式可被编码和发送,作为关于编码模式的信息。此外,因为从深度0 至编码深度来分割编码单元,所以只有编码深度的分割信息被设置为0,并 且除了编码深度之外的深度的分割信息被设置为1。

视频解码设备200的图像数据和编码信息提取器220可提取并使用关于 编码单元900的编码深度以及预测单元的信息,以对分块912解码。视频解 码设备200可通过使用根据深度的分割信息将分割信息为0的深度确定为编 码深度,并且可使用关于编码深度的编码模式的信息来对与编码深度相应的 编码单元进行解码。

图10至图12是用于描述根据本发明实施例的编码单元1010、预测单元 1060和变换单元1070之间的关系的示图。

编码单元1010是最大编码单元中的、与由视频编码设备100确定的编码 深度相应的、具有树结构的编码单元。预测单元1060是每个编码单元1010 的预测单元的分块,变换单元1070是每个编码单元1010的变换单元。

当在编码单元1010中最大编码单元的深度为0时,编码单元1012和1054 的深度为1,编码单元1014、1016、1018、1028、1050和1052的深度为2, 编码单元1020、1022、1024、1026、1030、1032和1048的深度为3,编码 单元1040、1042、1044和1046的深度为4。

在预测单元1060中,通过分割编码单元1010中的编码单元获得一些编 码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说, 编码单元1014、1022、1050和1054中的分块类型具有2N×N的尺寸,编码 单元1016、1048和1052中的分块类型具有N×2N的尺寸,编码单元1032的 分块类型具有N×N的尺寸。仅当编码单元1032是最小编码单元时,才会设 置尺寸为N×N的分块类型。编码单元1010的预测单元和分块小于或等于每 个编码单元。

以小于编码单元1052的数据单元,对变换单元1070中的编码单元1052 的图像数据执行变换或逆变换。另外,变换单元1070中的编码单元1014、 1016、1022、1032、1048、1050和1052与预测单元1060中的编码单元在尺 寸和形状上不同。换句话说,视频编码设备100和视频解码设备200可分别 对相同编码单元中的数据单元执行帧内预测、运动估计、运动补偿、变换和 逆变换。

因此,对每个编码单元递归地执行编码以确定最佳编码单元,从而可获 得具有递归树结构的编码单元,其中,每个编码单元在最大编码单元的每个 区域中具有分层结构。编码信息可包括关于编码单元的分割信息、关于分块 类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。表1示 出了可由视频编码设备100和视频解码设备200设置的编码信息。

[表1]

视频编码设备100的输出单元130可输出关于具有树结构的编码单元的 编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收的 比特流提取关于具有树结构的编码单元的编码信息。

分割信息指示当前编码单元是否被分割为更低深度的编码单元。如果当 前深度d的分割信息为0,则当前编码单元不再被分割至更低深度的深度是 编码深度,因此可对编码深度定义关于分块类型、预测模式和变换单元的尺 寸的信息。如果根据分割信息将当前编码单元进一步分割,则对更低深度的 四个分割的编码单元独立地执行编码。

预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分 块类型中定义帧内模式和帧间模式,仅在尺寸为2N×2N的分块类型中定义跳 过模式。

关于分块类型的信息可指示通过对称地分割预测单元的高度或宽度获得 的尺寸为2N×2N、2N×N、N×2N和N×N的对称的分块类型以及通过非对称 地分割预测单元的高度或宽度获得的尺寸为2N×nU、2N×nD、nL×2N和 nR×2N的非对称的分块类型。可通过按1:3和3:1分割预测单元的高度来分 别获得尺寸为2N×nU和2N×nD的非对称的分块类型,可通过按1:3和3:1 分割预测单元的宽度来分别获得尺寸为nL×2N和nR×2N的非对称的分块类 型。仅当2N×2N的当前编码单元是最小编码单元时,才会设置N×N的对称 的分块类型。

变换单元的尺寸可被设置为帧内模式下的两种类型以及帧间模式下的两 种类型。换句话说,如果变换单元的分割信息为0,则变换单元的尺寸可以 是2N×2N(2N×2N是当前编码单元的尺寸)。如果变换单元的分割信息为1, 则可通过分割当前编码单元来获得变换单元。另外,如果尺寸为2N×2N的当 前编码单元的分块类型是对称的分块类型,则变换单元的尺寸可以是N×N, 如果当前编码单元的分块类型是非对称的分块类型,则变换单元的尺寸可以 是N/2×N/2。

关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单 元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括 包含相同的编码信息的预测单元和最小单元中的至少一个。

因此,通过比较相邻数据单元的编码信息来确定相邻数据单元是否包括 在与编码深度相应的相同的编码单元中。另外,通过使用数据单元的编码信 息来确定与编码深度相应的相应编码单元,从而可确定在最大编码单元中编 码深度的分布。

因此,如果基于相邻数据单元的编码信息来预测当前编码单元,则可直 接参照和使用与当前编码单元相邻的更深的编码单元中的数据单元的编码信 息。

可选择地,如果基于相邻数据单元的编码信息来预测当前编码单元,则 使用所述数据单元的编码信息来搜索与当前编码单元相邻的数据单元,并且 可参照搜索到的相邻的编码单元来预测当前编码单元。

图13是用于描述根据表1的编码模式信息的编码单元、预测单元或分块 和变换单元之间的关系的示图。

最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、 1312、1314、1316和1318。这里,因为编码单元1318是编码深度的编码单 元,所以分割信息可被设置为0。关于尺寸为2N×2N的编码单元1318的分 块类型的信息可被设置为尺寸为2N×2N的分块类型1322、尺寸为2N×N的 分块类型1324、尺寸为N×2N的分块类型1326、尺寸为2N×nU的分块类型 1332、尺寸为2N×nD的分块类型1334、尺寸为nL×2N的分块类型1336以 及尺寸为nR×2N的分块类型1338中的一个。当尺寸为2N×2N的编码单元 1318是最小编码单元时,关于分块类型的信息可被设置为尺寸为N×N的分 块类型1328。

变换单元的分割信息(TU尺寸标志)是变换索引的类型,与变换索引相 应的变换单元的尺寸可根据编码单元的预测单元类型或分块类型而改变。

例如,当分块类型被设置为对称(即,分块类型1322、1324、1326或 1328)时,如果变换单元的分割信息为0,则尺寸为2N×2N的变换单元1342 被设置,如果TU尺寸标志为1,则尺寸为N×N的变换单元1344被设置。

当分块类型被设置为非对称(即,分块类型1332、1334、1336或1338) 时,如果TU尺寸标志为0,则尺寸为2N×2N的变换单元1352被设置,如果 TU尺寸标志为1,则尺寸为N/2×N/2的变换单元1354被设置。

参照图13,TU尺寸标志是具有值0或1的标志,但是TU尺寸标志不限 于1比特,并且在TU尺寸标志从0增加时,变换单元可具有树结构地分层分 割。变换单元的分割信息可用作变换索引的示例。

在这种情况下,如果变换单元的分割信息与变换单元的最大尺寸和变换 单元的最小尺寸一起被使用,则可表示实际使用的变换单元的尺寸。视频编 码设备100可对变换单元的最大尺寸信息、变换单元的最小尺寸信息以及变 换单元的最大分割信息进行编码。编码的变换单元的最大尺寸信息、编码的 变换单元的最小尺寸信息以及编码的变换单元的最大分割信息可被插入到 SPS中。视频解码设备200可通过使用变换单元的最大尺寸信息、变换单元 的最小尺寸信息以及变换单元的最大分割信息来对视频解码。

在一个示例中,(a)如果当前编码单元的尺寸为64×64,并且变换单元 的最大尺寸为32×32,则(a-1)当变换单元的分割信息是0时,变换单元 的尺寸可被设置为32×32;(a-2)当变换单元的分割信息是1时,变换单元 的尺寸可被设置为16×16;(a-3)当变换单元的分割信息是2时,变换单元 的尺寸可被设置为8×8。

在另一示例中,(b)如果当前编码单元的尺寸为32×32,并且变换单元 的最小尺寸为32×32,则(b-1)当变换单元的分割信息是0时,变换单元 的尺寸可被设置为32×32,并且因为变换单元的尺寸不能小于32×32的尺 寸,所以变换单元的分割信息不可被进一步设置。

在另一示例中,(c)如果当前编码单元的尺寸为64×64,并且变换单元 的最大分割信息为1,则变换单元的分割信息可以为0或1,而变换单元的另 一分割信息不可被设置。

因此,如果定义最大TU尺寸标志为“MaxTransformSizeIndex”,最小变 换单元尺寸为“MinTransformSize”,并且当TU尺寸标志位为0时变换单元 尺寸为“RootTuSize”,则可在当前编码单元中确定的当前最小变换单元尺寸 “CurrMinTuSize”可通过等式(1)来定义:

CurrMinTuSize=

max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))

…(1)

与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize” 相比,当TU尺寸标志为0时的变换单元尺寸“RootTuSize”可表示在系统中 可选择的最大变换单元尺寸。在等式(1)中, “RootTuSize/(2^MaxTransformSizeIndex)”表示当TU尺寸标志为0时的变 换单元尺寸“RootTuSize”被分割与最大TU尺寸标志相应的次数时的变换单 元尺寸,“MinTransformSize”表示最小变换尺寸。因此,“MinTransformSize” 与“RootTuSize/(2^MaxTransformSizeIndex)”中较小的值可作为可在当前 编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”。

根据本发明实施例,最大变换单元尺寸RootTuSize可根据预测模式的类 型而变化。

例如,如果当前预测模式是帧间模式,则可通过使用下面的等式(2)来 确定“RootTuSize”。在等式(2)中,“MaxTransformSize”表示最大变换单 元尺寸,“PUSize”表示当前预测单元尺寸。

RootTuSize=min(MaxTransformSize,PUSize)    …(2)

也就是说,如果当前预测模式是帧间模式,则当TU尺寸标志为0时的变 换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中 较小的值。

如果当前分块单元的预测模式是帧内模式,则可通过使用下面的等式(3) 来确定“RootTuSize”。在等式(3)中,“PartitionSize”表示当前分块单 元的尺寸。

RootTuSize=min(MaxTransformSize,PartitionSize)    …(3)

也就是说,如果当前预测模式是帧内模式,则当TU尺寸标志为0时的变 换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分块单元的尺寸 中较小的值。

然而,根据分块单元中的预测模式的类型变化的当前最大变换单元尺寸 “RootTuSize”只是一个示例,本发明不限于此。

图14是示出根据本发明实施例的通过使用基于具有树结构的编码单元 的预测单元对视频编码的方法的流程图。

在操作1210,将当前画面划分为至少一个最大编码单元。可预先确定指 示可能的分割次数的总数的最大深度。

在操作1220,通过对根据深度分割每个最大编码单元的区域获得的至少 一个分割区域进行编码来确定根据至少一个分割区域输出最终编码结果的编 码深度,并确定根据树结构的编码单元。

每当深度加深时,最大编码单元在空间上被分割,从而被分割为更低深 度的编码单元。可通过与相邻编码单元独立地在空间上分割每个编码单元来 将每个编码单元分割为另一更低深度的编码单元。根据深度对每个编码单元 重复地执行编码。

此外,针对每个更深的编码单元确定根据具有最小编码误差的分块类型 的变换单元。为了确定在每个最大编码单元中具有最小编码误差的编码深度, 可在所有根据深度的更深的编码单元中测量并比较编码误差。

当确定变换单元时,可确定用于编码单元的变换的变换单元。根据本实 施例的变换单元可被确定为使由用于编码单元的变换的变换单元引起的误差 最小化的数据单元。

在每个最大编码单元中,基于分块类型(基于根据深度的编码单元被确 定)和根据深度的编码单元的深度对画面编码,并且针对根据深度的每个编 码单元独立地确定编码深度的编码单元,从而可确定具有树结构的编码单元。

在以下情况中的至少一种情况下,当前编码单元的分块类型还可包括具 有与更低深度的编码单元相同尺寸的分块,所述情况包括:当前编码单元不 再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最 大编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。分 块类型可包括通过对称地分割当前编码单元的高度或宽度获得的对称的分 块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地 分割当前编码单元获得的分块或者具有任意形状的分块。可基于关于当前编 码单元的预测单元的分块类型和预测模式来执行预测编码。

因此,在以下情况中的至少一种情况下,不仅可通过使用通过对称地分 割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编 码单元的高度或宽度获得的分块、通过几何地分割当前编码单元获得的分块 和具有任意形状的分块,而且可通过使用具有与更低深度的编码单元相同尺 寸的分块来执行预测编码,所述情况包括:当前编码单元不再被分割为更低 深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当 前编码单元是当前最大编码单元中最低深度的编码单元。

此外,在以下情况中的至少一种情况下,可跳过通过使用具有与更低深 度的编码单元相同尺寸的分块执行的帧内预测和帧间预测,所述情况包括: 当前编码单元可被分割为更低深度的编码单元;当前编码单元不是当前最大 编码单元中最低深度的编码单元;当前编码单元是当前最大编码单元中最低 深度的编码单元。

在操作1230,针对每个最大编码单元,输出构成根据编码深度的最终编 码结果的编码的图像数据以及关于编码深度和编码模式的编码信息。关于编 码模式的信息可包括关于编码深度的信息或分割信息、关于预测单元的分块 类型的信息、关于预测模式的信息、关于变换单元的尺寸的信息、变换索引 信息等。

关于根据诸如序列、画面、像条或GOP的数据单元定义的编码单元的尺 寸和可变深度的编码单元结构信息可被插入到比特流的头、SPS或PPS中, 然后可被输出。关于编码模式的编码信息以及关于编码单元的尺寸和可变深 度的编码单元结构信息可被插入到比特流的头、SPS或PPS中,然后可连同 编码的图像数据一起被发送到解码器。

图15是示出根据本发明实施例的通过使用基于具有树结构的编码单元 的预测单元对视频解码的方法的流程图。

在操作1310,接收并解析编码的视频的比特流。

在操作1320,从解析的比特流提取分配给最大编码单元的当前画面的编 码的图像数据、关于根据最大编码单元的编码深度和编码模式的信息、以及 关于编码单元的尺寸和可变深度的编码单元结构信息。可从比特流的头、SPS 或PPS提取关于编码深度和编码模式的信息、关于编码单元的尺寸和可变深 度的编码单元结构信息、以及分割信息。

每个最大编码单元的编码深度是每个最大编码单元中具有最小编码误差 的深度。在对每个最大编码单元编码时,基于通过分层分割根据深度的每个 最大编码单元获得的至少一个数据单元来对图像数据编码。

根据关于编码深度和编码模式的信息,最大编码单元可被分割为具有树 结构的编码单元。每个具有树结构的编码单元被确定为与编码深度相应的编 码单元,并被最优地编码以输出最小编码误差。因此,通过在根据编码单元 确定至少一个编码深度之后对编码单元中的每条编码的图像数据解码,可提 高图像的编码和解码效率。

可基于编码信息(所述编码信息包括关于具有树结构的当前编码单元的 可变深度的信息、关于编码单元的最大尺寸的信息和关于编码单元的最小尺 寸的信息中的至少两个)来确定具有树结构的当前编码单元中的编码单元的 最大尺寸和最小尺寸。

此外,可基于编码信息的变换索引来确定编码单元中的根据树结构的变 换单元。

可基于当前编码单元的深度来确定分块类型,并基于编码单元和分块类 型来执行预测解码,从而可对画面解码。根据本实施例的分块类型可包括具 有与当前编码单元相同尺寸的分块、通过将当前编码单元的高度或宽度除以 二获得的分块、通过对称地分割当前编码单元的高度或宽度获得的对称的分 块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地 分割当前编码单元获得的分块以及具有任意形状的分块中的至少一种。

在以下情况中的至少一种情况下,当前编码单元的分块类型还可包括具 有与更低深度的编码单元相同尺寸的分块,所述情况包括:当前编码单元不 再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最 小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。

在操作1330,基于关于根据最大编码单元的编码深度和编码模式的信息 来对每个最大编码单元的图像数据解码。

可基于编码单元结构信息和分割信息来读取编码单元的最大尺寸和最小 尺寸,从而可确定具有树结构的编码单元。可从关于编码模式的信息中读取 关于编码单元的预测单元的分块类型和预测模式的信息,并可基于关于分块 类型和预测模式的信息,针对编码单元执行预测解码,从而可对当前编码单 元解码。

例如,在以下情况中的至少一种情况下,可跳过通过使用具有与更低深 度的编码单元相同尺寸的分块执行的帧内预测或帧间预测/补偿,所述情况包 括:当前编码单元可被分割为更低深度的编码单元;当前编码单元不是当前 最大编码单元中最低深度的编码单元;当前编码单元是当前最大编码单元中 最低深度的编码单元。

在以下情况中的至少一种情况下,不仅可通过使用具有与当前编码单元 相同尺寸的分块、通过将当前编码单元的高度或宽度除以二获得的分块、通 过非对称地分割当前编码单元的高度或宽度获得的分块,而且可通过使用具 有与深度低于当前编码单元的深度的编码单元相同尺寸的分块,来执行帧内 预测或帧间预测/补偿,所述情况包括:当前编码单元不再被分割为更低深度 的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编 码单元是当前最大编码单元中最低深度的编码单元。

解码的图像数据可通过再现设备被再现,可被存储在存储介质中,或者 可通过网络被发送。

本发明实施例可以被编写为计算机程序,并且可在使用计算机可读记录 介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括 磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或 DVD)。

虽然已经参照本发明的优选实施例具体显示和描述了本发明,但是本领 域普通技术人员将理解,在不脱离权利要求限定的本发明的精神和范围的情 况下,可以在形式和细节上进行各种改变。优选实施例应该仅被考虑为描述 性的,而非限制性的目的。因此,本发明的范围不是由本发明的详细描述限 定,而是由权利要求限定,并且所述范围内的所有不同将被解释为包括在本 发明中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号