非最大抑制 ¶
非最大抑制 - 11 ¶
版本 ¶
名称: 非最大抑制 (GitHub)
域:
main
自版本:
11
功能:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自版本 11 起可用。
摘要 ¶
过滤掉与先前选定框具有高交并比 (IOU) 重叠的框。得分低于 score_threshold 的边界框将被移除。边界框格式由属性 center_point_box 指示。请注意,此算法与坐标系中的原点位置无关,更一般地,它对坐标系的正交变换和平移是不变的;因此,坐标系的平移或反射会导致算法选择相同的框。selected_indices 输出是一组整数,索引到表示选定框的边界框输入集合中。然后可以使用 Gather 或 GatherND 运算来获取与选定索引相对应的边界框坐标。
属性 ¶
center_point_box - INT(默认值为
'0'
)整数表示框数据的格式。默认值为 0。0 - 框数据以 [y1, x1, y2, x2] 的形式提供,其中 (y1, x1) 和 (y2, x2) 是框任意对角角点的坐标,坐标可以是归一化的(即位于区间 [0, 1] 内)或绝对的。主要用于 TF 模型。1 - 框数据以 [x_center, y_center, width, height] 的形式提供。主要用于 Pytorch 模型。
输入 ¶
2 到 5 个输入。
boxes(异构) - 张量(float)
形状为 [num_batches, spatial_dimension, 4] 的输入张量。单个框数据格式由 center_point_box 指示。
scores(异构) - 张量(float)
形状为 [num_batches, num_classes, spatial_dimension] 的输入张量
max_output_boxes_per_class(可选,异构) - 张量(int64)
整数,表示每个批次每个类别要选择的框的最大数量。它是标量。默认为 0,表示没有输出。
iou_threshold(可选,异构) - 张量(float)
浮点数,表示用于确定框是否相对于 IOU 过度重叠的阈值。它是标量。值范围 [0, 1]。默认为 0。
score_threshold(可选,异构) - 张量(float)
浮点数,表示用于确定何时基于得分移除框的阈值。它是标量。
输出 ¶
selected_indices(异构) - 张量(int64)
从 boxes 张量中选择的索引。[num_selected_indices, 3],选定索引格式为 [batch_index, class_index, box_index]。
非最大抑制 - 10 ¶
版本 ¶
名称: 非最大抑制 (GitHub)
域:
main
自版本:
10
功能:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符自版本 10 起可用。
摘要 ¶
过滤掉与先前选定框具有高交并比 (IOU) 重叠的框。得分低于 score_threshold 的边界框将被移除。边界框格式由属性 center_point_box 指示。请注意,此算法与坐标系中的原点位置无关,更一般地,它对坐标系的正交变换和平移是不变的;因此,坐标系的平移或反射会导致算法选择相同的框。selected_indices 输出是一组整数,索引到表示选定框的边界框输入集合中。然后可以使用 Gather 或 GatherND 运算来获取与选定索引相对应的边界框坐标。
属性 ¶
center_point_box - INT(默认值为
'0'
)整数表示框数据的格式。默认值为 0。0 - 框数据以 [y1, x1, y2, x2] 的形式提供,其中 (y1, x1) 和 (y2, x2) 是框任意对角角点的坐标,坐标可以是归一化的(即位于区间 [0, 1] 内)或绝对的。主要用于 TF 模型。1 - 框数据以 [x_center, y_center, width, height] 的形式提供。主要用于 Pytorch 模型。
输入 ¶
2 到 5 个输入。
boxes(异构) - 张量(float)
形状为 [num_batches, spatial_dimension, 4] 的输入张量。单个框数据格式由 center_point_box 指示。
scores(异构) - 张量(float)
形状为 [num_batches, num_classes, spatial_dimension] 的输入张量
max_output_boxes_per_class(可选,异构) - 张量(int64)
整数,表示每个批次每个类别要选择的框的最大数量。它是标量。默认为 0,表示没有输出。
iou_threshold(可选,异构) - 张量(float)
浮点数,表示用于确定框是否相对于 IOU 过度重叠的阈值。它是标量。值范围 [0, 1]。默认为 0。
score_threshold(可选,异构) - 张量(float)
浮点数,表示用于确定何时基于得分移除框的阈值。它是标量。
输出 ¶
selected_indices(异构) - 张量(int64)
从 boxes 张量中选择的索引。[num_selected_indices, 3],选定索引格式为 [batch_index, class_index, box_index]。