QLinearConv¶
QLinearConv - 10¶
版本¶
域:
main
自版本:
10
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的算子自版本10起可用。
摘要¶
卷积算子使用量化的输入张量、其比例和零点、量化的滤波器、其比例和零点以及输出的比例和零点,并计算量化的输出。每个比例和零点对必须具有相同的形状。这意味着它们必须是标量(每个张量)或一维张量(每个输出通道)。每个输入或输出及其相关的零点必须具有相同的类型。当存在偏差时,它必须使用 scale = 输入比例 * 权重比例 和零点为 0 进行量化。
属性¶
auto_pad - 字符串 (默认值为
'NOTSET'
)auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID 之一。其中默认值为 NOTSET,这意味着使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,以便每个轴
i
的output_shape[i] = ceil(input_shape[i] / strides[i])
。填充在两侧平均分配或几乎平均分配(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充将添加到末尾,对于 SAME_LOWER,则添加到开头。dilations - 整数 :
滤波器沿每个空间轴的膨胀值。如果不存在,则每个空间轴的膨胀默认为 1。
group - 整数 (默认值为
'1'
)输入通道和输出通道划分的组数。默认为 1。
kernel_shape - 整数 :
卷积核的形状。如果不存在,应从输入“w”推断。
pads - 整数 :
沿每个空间轴的开头和结尾的填充,它可以取任何大于或等于 0 的值。该值表示添加到相应轴的开头和结尾部分的像素数。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end…],其中 xi_begin 是添加到轴i
开头的像素数,xi_end 是添加到轴i
末尾的像素数。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的开头和结尾的填充默认为 0。strides - 整数 :
沿每个空间轴的步长。如果不存在,则每个空间轴的步长默认为 1。
输入¶
8到9个输入。
x (异构) - T1
来自前一层的输入数据张量;大小为 (N x C x H x W),其中 N 是批次大小,C 是通道数,H 和 W 是高度和宽度。请注意,这是针对二维图像的。否则,大小为 (N x C x D1 x D2 … x Dn)。或者,如果维度表示有效,则操作期望输入数据张量以 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …] 的维度表示到达。
x_scale (异构) - tensor(float)
输入“x”的比例张量。它是一个标量,表示每个张量/层的量化。
x_zero_point (异构) - T1
输入“x”的零点张量。它是一个标量,表示每个张量/层的量化。
w (异构) - T2
将在卷积中使用的权重张量;大小为 (M x C/group x kH x kW),其中 C 是通道数,kH 和 kW 是核的高度和宽度,M 是特征图的数量。对于超过两个维度,内核形状将为 (M x C/group x k1 x k2 x … x kn),其中 (k1 x k2 x … kn) 是内核的维度。或者,如果维度表示有效,则操作期望权重张量以 [FILTER_OUT_CHANNEL, FILTER_IN_CHANNEL, FILTER_SPATIAL, FILTER_SPATIAL …] 的维度表示到达。X.shape[1] == (W.shape[1] * group) == C(假设形状数组的索引从 0 开始)。或者换句话说,FILTER_IN_CHANNEL 应该等于 DATA_CHANNEL。
w_scale (异构) - tensor(float)
输入“w”的比例张量。它可以是标量或一维张量,表示每个张量/层或每个输出通道的量化。如果它是一维张量,则其元素数量应等于输出通道数 (M)。
w_zero_point (异构) - T2
输入“w”的零点张量。它可以是标量或一维张量,表示每个张量/层或每个输出通道的量化。如果它是一维张量,则其元素数量应等于输出通道数 (M)。
y_scale (异构) - tensor(float)
输出“y”的比例张量。它是一个标量,表示每个张量/层的量化。
y_zero_point (异构) - T3
输出“y”的零点张量。它是一个标量,表示每个张量/层的量化。
B (可选,异构) - T4
可选的一维偏差,将添加到卷积中,大小为 M。偏差必须使用 scale = x_scale * w_scale 和 zero_point = 0 进行量化
输出¶
y (异构) - T3
包含卷积结果的输出数据张量。输出维度是内核大小、步长大小和填充长度的函数。
类型约束¶
T1 in (
tensor(int8)
,tensor(uint8)
)将输入类型约束为 8 位整数张量。
T2 in (
tensor(int8)
,tensor(uint8)
)将过滤器类型限制为8位整数张量。
T3 in (
tensor(int8)
,tensor(uint8)
)将输出类型限制为8位整数张量。
T4 in (
tensor(int32)
)将偏置类型限制为32位整数张量。