NonMaxSuppression

NonMaxSuppression - 11

版本

该算子的此版本已可用始于版本 11

摘要

过滤掉与先前选定的框具有高交并比 (IOU) 重叠的框。得分低于 score_threshold 的边界框将被移除。边界框格式由属性 center_point_box 指示。请注意,此算法与坐标系中的原点位置无关,更普遍地,它对于坐标系的正交变换和平移是不变的;因此,坐标系的平移或反射会导致算法选择相同的框。selected_indices 输出是一个整数集合,这些整数索引到代表所选框的输入边界框集合中。然后可以使用 Gather 或 GatherND 算子获取与所选索引对应的边界框坐标。

属性

  • center_point_box - INT (默认值是 '0')

    整数,指示框数据的格式。默认值为 0。0 - 框数据以 [y1, x1, y2, x2] 的形式提供,其中 (y1, x1) 和 (y2, x2) 是框角对角线的坐标,坐标可以是归一化(即位于区间 [0, 1] 内)或绝对值。主要用于 TF 模型。1 - 框数据以 [x_center, y_center, width, height] 的形式提供。主要用于 Pytorch 模型。

输入

输入数量在 2 到 5 个之间。

  • boxes (异构) - tensor(float)

    形状为 [num_batches, spatial_dimension, 4] 的输入张量。单个框数据的格式由 center_point_box 指示。

  • scores (异构) - tensor(float)

    形状为 [num_batches, num_classes, spatial_dimension] 的输入张量

  • max_output_boxes_per_class (可选,异构) - tensor(int64)

    整数,表示每个批次每类要选择的最大框数。它是一个标量。默认值为 0,表示没有输出。

  • iou_threshold (可选,异构) - tensor(float)

    浮点数,表示决定框是否与 IOU 重叠过多的阈值。它是一个标量。取值范围 [0, 1]。默认值为 0。

  • score_threshold (可选,异构) - tensor(float)

    浮点数,表示决定何时根据得分移除框的阈值。它是一个标量。

输出

  • selected_indices (异构) - tensor(int64)

    来自 boxes 张量的所选索引。形状为 [num_selected_indices, 3],所选索引格式为 [batch_index, class_index, box_index]。

NonMaxSuppression - 10

版本

该算子的此版本已可用始于版本 10

摘要

过滤掉与先前选定的框具有高交并比 (IOU) 重叠的框。得分低于 score_threshold 的边界框将被移除。边界框格式由属性 center_point_box 指示。请注意,此算法与坐标系中的原点位置无关,更普遍地,它对于坐标系的正交变换和平移是不变的;因此,坐标系的平移或反射会导致算法选择相同的框。selected_indices 输出是一个整数集合,这些整数索引到代表所选框的输入边界框集合中。然后可以使用 Gather 或 GatherND 算子获取与所选索引对应的边界框坐标。

属性

  • center_point_box - INT (默认值是 '0')

    整数,指示框数据的格式。默认值为 0。0 - 框数据以 [y1, x1, y2, x2] 的形式提供,其中 (y1, x1) 和 (y2, x2) 是框角对角线的坐标,坐标可以是归一化(即位于区间 [0, 1] 内)或绝对值。主要用于 TF 模型。1 - 框数据以 [x_center, y_center, width, height] 的形式提供。主要用于 Pytorch 模型。

输入

输入数量在 2 到 5 个之间。

  • boxes (异构) - tensor(float)

    形状为 [num_batches, spatial_dimension, 4] 的输入张量。单个框数据的格式由 center_point_box 指示。

  • scores (异构) - tensor(float)

    形状为 [num_batches, num_classes, spatial_dimension] 的输入张量

  • max_output_boxes_per_class (可选,异构) - tensor(int64)

    整数,表示每个批次每类要选择的最大框数。它是一个标量。默认值为 0,表示没有输出。

  • iou_threshold (可选,异构) - tensor(float)

    浮点数,表示决定框是否与 IOU 重叠过多的阈值。它是一个标量。取值范围 [0, 1]。默认值为 0。

  • score_threshold (可选,异构) - tensor(float)

    浮点数,表示决定何时根据得分移除框的阈值。它是一个标量。

输出

  • selected_indices (异构) - tensor(int64)

    来自 boxes 张量的所选索引。形状为 [num_selected_indices, 3],所选索引格式为 [batch_index, class_index, box_index]。