简介

快速入门

ONNX Runtime 提供了一种简单的方法,可以在 CPU 或 GPU 上以高性能运行机器学习模型,而无需依赖训练框架。机器学习框架通常针对批处理训练而非预测进行优化,而预测是在应用程序、站点和服务中更常见的场景。在高级别上,您可以

  1. 使用您喜欢的框架训练模型。

  2. 将模型转换为或导出为 ONNX 格式。有关更多详细信息,请参阅ONNX 教程

  3. 使用ONNX Runtime加载和运行模型。

在本教程中,我们将简要创建一个scikit-learn管道,将其转换为 ONNX 格式并运行第一个预测。

步骤 1:使用您喜欢的框架训练模型

我们将使用著名的 Iris 数据集。

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
iris = load_iris()
X, y = iris.data, iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y)

from sklearn.linear_model import LogisticRegression
clr = LogisticRegression()
clr.fit(X_train, y_train)

步骤 2:将模型转换为或导出为 ONNX 格式

ONNX 是一种描述机器学习模型的格式。它定义了一组常用的操作符来组合模型。有工具可以将其他模型格式转换为 ONNX。在这里,我们将使用ONNXMLTools

from skl2onnx import convert_sklearn
from skl2onnx.common.data_types import FloatTensorType

initial_type = [('float_input', FloatTensorType([None, 4]))]
onx = convert_sklearn(clr, initial_types=initial_type)
with open("logreg_iris.onnx", "wb") as f:
    f.write(onx.SerializeToString())

步骤 3:使用 ONNX Runtime 加载和运行模型

我们将使用ONNX Runtime计算此机器学习模型的预测。

import onnxruntime as rt
sess = rt.InferenceSession("logreg_iris.onnx", providers=["CPUExecutionProvider"])
input_name = sess.get_inputs()[0].name
label_name = sess.get_outputs()[0].name

pred_onx = sess.run([label_name], {input_name: X_test.astype(numpy.float32)})[0]

convert_sklearn、to_onnx、initial_types

该模块实现了两个函数:convert_sklearnto_onnx。第一个在前面的示例中使用过,它需要两个必填参数

  • 一个scikit-learn模型或管道

  • 初始类型

scikit-learn不存储有关训练数据集的信息。它并不总是能够检索特征的数量或其类型。因此,该函数需要另一个名为initial_types的参数。在许多情况下,训练数据集是一个数值矩阵X_train。然后它变成initial_type=[('X', FloatTensorType([None, X_train.shape[1]]))]X 是此唯一输入的名称,第二个术语指示类型和形状。形状是[None, X_train.shape[1]],第一个维度是行数,后跟特征数。行数未定义,因为在模型转换时,请求的预测数是未知的。特征数通常是已知的。现在假设输入是一个字符串列,后跟一个矩阵,则初始类型将是

initial_type=[
    ('S', StringTensorType([None, 1])),
    ('X', FloatTensorType([None, X_train.shape[1]])),
]

函数to_onnx是在与scikit-learn的核心开发人员讨论后实现的。它还包含一个根据训练数据集的一行推断正确类型的机制。然后,以下代码convert_sklearn(clr, initial_types=[('X', FloatTensorType([None, 4]))])通常重写为to_onnx(clr, X_train[:1]),其中X_train是训练数据集,它可以是矩阵或数据框。输入名称默认为'X',除非X_train是数据框。在这种情况下,列名用作输入名称。