QLinearConv

QLinearConv - 10

版本

  • 名称: QLinearConv (GitHub)

  • : main

  • 自版本: 10

  • 函数: False

  • 支持级别: SupportType.COMMON

  • 形状推断: True

此版本的算子自版本10起可用。

摘要

卷积算子使用量化的输入张量、其比例和零点、量化的滤波器、其比例和零点以及输出的比例和零点,并计算量化的输出。每个比例和零点对必须具有相同的形状。这意味着它们必须是标量(每个张量)或一维张量(每个输出通道)。每个输入或输出及其相关的零点必须具有相同的类型。当存在偏差时,它必须使用 scale = 输入比例 * 权重比例 和零点为 0 进行量化。

属性

  • auto_pad - 字符串 (默认值为 'NOTSET')

    auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID 之一。其中默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,以便每个轴 ioutput_shape[i] = ceil(input_shape[i] / strides[i])。填充在两侧平均分配或几乎平均分配(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充将添加到末尾,对于 SAME_LOWER,则添加到开头。

  • dilations - 整数 :

    滤波器沿每个空间轴的膨胀值。如果不存在,则每个空间轴的膨胀默认为 1。

  • group - 整数 (默认值为 '1')

    输入通道和输出通道划分的组数。默认为 1。

  • kernel_shape - 整数 :

    卷积核的形状。如果不存在,应从输入“w”推断。

  • pads - 整数 :

    沿每个空间轴的开头和结尾的填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开头和结尾部分的像素数。pads 格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end…],其中 xi_begin 是添加到轴 i 开头的像素数,xi_end 是添加到轴 i 末尾的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的开头和结尾的填充默认为 0。

  • strides - 整数 :

    沿每个空间轴的步长。如果不存在,则每个空间轴的步长默认为 1。

输入

8到9个输入。

  • x (异构) - T1

    来自前一层的输入数据张量;大小为 (N x C x H x W),其中 N 是批次大小,C 是通道数,H 和 W 是高度和宽度。请注意,这是针对二维图像的。否则,大小为 (N x C x D1 x D2 … x Dn)。或者,如果维度表示有效,则操作期望输入数据张量以 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示到达。

  • x_scale (异构) - tensor(float)

    输入“x”的比例张量。它是一个标量,表示每个张量/层的量化。

  • x_zero_point (异构) - T1

    输入“x”的零点张量。它是一个标量,表示每个张量/层的量化。

  • w (异构) - T2

    将在卷积中使用的权重张量;大小为 (M x C/group x kH x kW),其中 C 是通道数,kH 和 kW 是核的高度和宽度,M 是特征图的数量。对于超过两个维度,内核形状将为 (M x C/group x k1 x k2 x … x kn),其中 (k1 x k2 x … kn) 是内核的维度。或者,如果维度表示有效,则操作期望权重张量以 [FILTER_OUT_CHANNEL, FILTER_IN_CHANNEL, FILTER_SPATIAL, FILTER_SPATIAL …] 的维度表示到达。X.shape[1] == (W.shape[1] * group) == C(假设形状数组的索引从 0 开始)。或者换句话说,FILTER_IN_CHANNEL 应该等于 DATA_CHANNEL。

  • w_scale (异构) - tensor(float)

    输入“w”的比例张量。它可以是标量或一维张量,表示每个张量/层或每个输出通道的量化。如果它是一维张量,则其元素数量应等于输出通道数 (M)。

  • w_zero_point (异构) - T2

    输入“w”的零点张量。它可以是标量或一维张量,表示每个张量/层或每个输出通道的量化。如果它是一维张量,则其元素数量应等于输出通道数 (M)。

  • y_scale (异构) - tensor(float)

    输出“y”的比例张量。它是一个标量,表示每个张量/层的量化。

  • y_zero_point (异构) - T3

    输出“y”的零点张量。它是一个标量,表示每个张量/层的量化。

  • B (可选,异构) - T4

    可选的一维偏差,将添加到卷积中,大小为 M。偏差必须使用 scale = x_scale * w_scale 和 zero_point = 0 进行量化

输出

  • y (异构) - T3

    包含卷积结果的输出数据张量。输出维度是内核大小、步长大小和填充长度的函数。

类型约束

  • T1 in ( tensor(int8), tensor(uint8) )

    将输入类型约束为 8 位整数张量。

  • T2 in ( tensor(int8), tensor(uint8) )

    将过滤器类型限制为8位整数张量。

  • T3 in ( tensor(int8), tensor(uint8) )

    将输出类型限制为8位整数张量。

  • T4 in ( tensor(int32) )

    将偏置类型限制为32位整数张量。