MaxPool¶
MaxPool - 22¶
版本¶
名称: MaxPool (GitHub)
域:
main
起始版本:
22
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自 版本 22 起可用。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状的计算方式因是否使用显式填充(使用 pads)或自动填充(使用 auto_pad)而异。对于显式填充 (https://pytorch.ac.cn/docs/stable/generated/torch.nn.MaxPool2d.html?highlight=maxpool#torch.nn.MaxPool2d)
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)
或
output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)
如果 ceil_mode 已启用,pad_shape[i]
是沿轴 i
的填充总和。将忽略起始于右侧填充区域的滑动窗口。
auto_pad
是一个已弃用的属性。如果您目前正在使用它,当 ceil_mode 启用时,输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
或者当 ceil_mode 禁用时 (https://tensorflowcn.cn/api_docs/python/tf/keras/layers/AveragePooling2D)
VALID: output_spatial_shape[i] = floor((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i]) + 1
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = floor((input_spatial_shape[i] - 1) / strides_spatial_shape[i]) + 1
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使得每个轴
i
的output_shape[i] = ceil(input_shape[i] / strides[i])
。填充会在两侧均匀或几乎均匀地分配(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充会添加到末尾;对于 SAME_LOWER,则添加到开头。ceil_mode - INT (默认值为
'0'
)是否使用 ceil 或 floor (默认) 计算输出形状。
dilations - 整数 :
沿滤波器每个空间轴的膨胀值。如果不存在,则每个空间轴的膨胀默认为 1。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。storage_order - INT (默认为
'0'
)张量的存储顺序。0 是行主序,1 是列主序。此属性仅用于将 n 元组索引值转换为单个整数值以生成第二个输出。
strides - 整数 :
沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
介于 1 到 2 个输出之间。
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
Indices (可选,异构) - I
来自对输入张量进行最大池化后的索引张量。索引的维度与输出张量相同。索引中的值是池化期间选定值的索引。索引被计算为展平的 1-D 张量,并且索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。
类型约束¶
T 在 (
tensor(bfloat16)
,tensor(double)
,tensor(float)
,tensor(float16)
,tensor(int8)
,tensor(uint8)
)将输入和输出类型限制为浮点和 8 位张量。
I 在 (
tensor(int64)
)将索引张量限制为 int64
MaxPool - 12¶
版本¶
名称: MaxPool (GitHub)
域:
main
起始版本:
12
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自 版本 12 起可用。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状的计算方式因是否使用显式填充(使用 pads)或自动填充(使用 auto_pad)而异。对于显式填充 (https://pytorch.ac.cn/docs/stable/generated/torch.nn.MaxPool2d.html?highlight=maxpool#torch.nn.MaxPool2d)
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)
或
output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - dilation[i] * (kernel_shape[i] - 1) - 1) / strides_spatial_shape[i] + 1)
如果 ceil_mode 已启用,pad_shape[i]
是沿轴 i
的填充总和。
auto_pad
是一个已弃用的属性。如果您目前正在使用它,当 ceil_mode 启用时,输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
或者当 ceil_mode 禁用时 (https://tensorflowcn.cn/api_docs/python/tf/keras/layers/AveragePooling2D)
VALID: output_spatial_shape[i] = floor((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i]) + 1
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = floor((input_spatial_shape[i] - 1) / strides_spatial_shape[i]) + 1
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET、SAME_UPPER、SAME_LOWER 或 VALID。默认值为 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使得每个轴
i
的output_shape[i] = ceil(input_shape[i] / strides[i])
。填充会在两侧均匀或几乎均匀地分配(取决于它是偶数还是奇数)。如果填充是奇数,则对于 SAME_UPPER,额外的填充会添加到末尾;对于 SAME_LOWER,则添加到开头。ceil_mode - INT (默认值为
'0'
)是否使用 ceil 或 floor (默认) 计算输出形状。
dilations - 整数 :
沿滤波器每个空间轴的膨胀值。如果不存在,则每个空间轴的膨胀默认为 1。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。storage_order - INT (默认为
'0'
)张量的存储顺序。0 是行主序,1 是列主序。此属性仅用于将 n 元组索引值转换为单个整数值以生成第二个输出。
strides - 整数 :
沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
介于 1 到 2 个输出之间。
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
Indices (可选,异构) - I
来自对输入张量进行最大池化后的索引张量。索引的维度与输出张量相同。索引中的值是池化期间选定值的索引。索引被计算为展平的 1-D 张量,并且索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。
类型约束¶
T 在 (
tensor(double)
,tensor(float)
,tensor(float16)
,tensor(int8)
,tensor(uint8)
)将输入和输出类型限制为浮点和 8 位张量。
I 在 (
tensor(int64)
)将索引张量限制为 int64
MaxPool - 11¶
版本¶
名称: MaxPool (GitHub)
域:
main
起始版本:
11
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自 版本 11 起可用。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状将如下所示
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)
或
output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)
如果 ceil_mode 已启用
* pad_shape[i] is sum of pads along axis i
auto_pad
是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET, SAME_UPPER, SAME_LOWER 或 VALID。默认值是 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使输出空间大小与输入匹配。如果是奇数,对于 SAME_UPPER,将额外填充添加到末尾;对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。
ceil_mode - INT (默认值为
'0'
)是否使用 ceil 或 floor (默认) 计算输出形状。
dilations - 整数 :
沿滤波器每个空间轴的膨胀值。如果不存在,则每个空间轴的膨胀默认为 1。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。storage_order - INT (默认为
'0'
)张量的存储顺序。0 是行主序,1 是列主序。
strides - 整数 :
沿每个空间轴的步长。如果不存在,步长默认为沿每个空间轴的 1。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
介于 1 到 2 个输出之间。
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
Indices (可选,异构) - I
来自对输入张量进行最大池化后的索引张量。索引的维度与输出张量相同。索引中的值是池化期间选定值的索引。索引被计算为展平的 1-D 张量,并且索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。
类型约束¶
T 在 (
tensor(double)
,tensor(float)
,tensor(float16)
)将输入和输出类型限制为浮点张量。
I 在 (
tensor(int64)
)将索引张量限制为 int64
MaxPool - 10¶
版本¶
名称: MaxPool (GitHub)
域:
main
since_version:
10
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的操作符已在 版本 10 中提供。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状将如下所示
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)
或
output_spatial_shape[i] = ceil((input_spatial_shape[i] + pad_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1)) / strides_spatial_shape[i] + 1)
如果 ceil_mode 已启用
* pad_shape[i] is sum of pads along axis i
auto_pad
是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + ((kernel_spatial_shape[i] - 1) * dilations[i] + 1) - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET, SAME_UPPER, SAME_LOWER 或 VALID。默认值是 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使输出空间大小与输入匹配。如果是奇数,对于 SAME_UPPER,将额外填充添加到末尾;对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。
ceil_mode - INT (默认值为
'0'
)是否使用 ceil 或 floor (默认) 计算输出形状。
dilations - 整数 :
沿滤波器每个空间轴的膨胀值。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。storage_order - INT (默认为
'0'
)张量的存储顺序。0 是行主序,1 是列主序。
strides - 整数 :
沿每个空间轴的步幅。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
介于 1 到 2 个输出之间。
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
Indices (可选,异构) - I
来自对输入张量进行最大池化后的索引张量。索引的维度与输出张量相同。索引中的值是池化期间选定值的索引。索引被计算为展平的 1-D 张量,并且索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。
类型约束¶
T 在 (
tensor(double)
,tensor(float)
,tensor(float16)
)将输入和输出类型限制为浮点张量。
I 在 (
tensor(int64)
)将索引张量限制为 int64
MaxPool - 8¶
版本¶
名称: MaxPool (GitHub)
域:
main
起始版本:
8
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此运算符版本自版本 8 起可用。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状将如下所示
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - kernel_spatial_shape[i]) / strides_spatial_shape[i] + 1)
* pad_shape[i] is sum of pads along axis i
auto_pad
是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - kernel_spatial_shape[i] + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + kernel_spatial_shape[i] - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET, SAME_UPPER, SAME_LOWER 或 VALID。默认值是 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使输出空间大小与输入匹配。如果是奇数,对于 SAME_UPPER,将额外填充添加到末尾;对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。storage_order - INT (默认为
'0'
)张量的存储顺序。0 是行主序,1 是列主序。
strides - 整数 :
沿每个空间轴的步幅。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
介于 1 到 2 个输出之间。
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
Indices (可选,异构) - I
来自对输入张量进行最大池化后的索引张量。索引的维度与输出张量相同。索引中的值是池化期间选定值的索引。索引被计算为展平的 1-D 张量,并且索引不考虑填充。因此索引中的值在 [0, N x C x D1 x … x Dn) 范围内。
类型约束¶
T 在 (
tensor(double)
,tensor(float)
,tensor(float16)
)将输入和输出类型限制为浮点张量。
I 在 (
tensor(int64)
)将索引张量限制为 int64
MaxPool - 1¶
版本¶
名称: MaxPool (GitHub)
域:
main
起始版本:
1
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自 版本 1 起可用。
摘要¶
MaxPool 接收输入张量 X,并根据核大小、步幅大小和填充长度对张量应用最大池化。最大池化包括根据核大小计算输入张量子集中所有值的最大值,并将数据下采样到输出张量 Y 中进行进一步处理。输出空间形状将如下所示
output_spatial_shape[i] = floor((input_spatial_shape[i] + pad_shape[i] - kernel_spatial_shape[i]) / strides_spatial_shape[i] + 1)
* pad_shape[i] is sum of pads along axis i
auto_pad
是一个已弃用的属性。如果您当前正在使用它们,则输出空间形状将如下所示
VALID: output_spatial_shape[i] = ceil((input_spatial_shape[i] - kernel_spatial_shape[i] + 1) / strides_spatial_shape[i])
SAME_UPPER or SAME_LOWER: output_spatial_shape[i] = ceil(input_spatial_shape[i] / strides_spatial_shape[i])
如果 SAME_UPPER
或 SAME_LOWER
,则填充形状将如下所示
pad_shape[i] = (output_spatial_shape[i] - 1) * strides_spatial_shape[i] + kernel_spatial_shape[i] - input_spatial_shape[i]
每个池化窗口的输出是排除填充后的最大元素数量。
属性¶
auto_pad - 字符串 (默认为
'NOTSET'
)auto_pad 必须是 NOTSET, SAME_UPPER, SAME_LOWER 或 VALID。默认值是 NOTSET,表示使用显式填充。SAME_UPPER 或 SAME_LOWER 表示填充输入,使输出空间大小与输入匹配。如果是奇数,对于 SAME_UPPER,将额外填充添加到末尾;对于 SAME_LOWER,则添加到开头。VALID 表示不进行填充。
kernel_shape - 整数 (必填)
沿每个轴的核大小。
pads - 整数 :
沿每个空间轴的起始和结束填充,它可以取大于或等于 0 的任何值。该值表示添加到对应轴的起始和结束部分的像素数量。
pads
格式应如下所示 [x1_begin, x2_begin…x1_end, x2_end,…],其中 xi_begin 是添加到轴i
起始处的像素数量,xi_end 是添加到轴i
结束处的像素数量。此属性不能与 auto_pad 属性同时使用。如果不存在,则每个空间轴的起始和结束填充默认为 0。strides - 整数 :
沿每个空间轴的步幅。
输入¶
X (异构) - T
来自前一个操作符的输入数据张量;图像情况下的维度为 (N x C x H x W),其中 N 是批大小,C 是通道数,H 和 W 是数据的高度和宽度。对于非图像情况,维度形式为 (N x C x D1 x D2 … Dn),其中 N 是批大小。可选地,如果维度表示生效,则操作期望输入数据张量带有维度表示 [DATA_BATCH, DATA_CHANNEL, DATA_FEATURE, DATA_FEATURE …]。
输出¶
Y (异构) - T
对输入张量进行平均或最大池化后的输出数据张量。维度将根据不同的核、步幅和填充大小而变化。使用维度的向下取整值
类型约束¶
T 在 (
tensor(double)
,tensor(float)
,tensor(float16)
)将输入和输出类型限制为浮点张量。