ai.onnx.ml - DictVectorizer¶

DictVectorizer - 1 (ai.onnx.ml)¶

版本¶

名称: DictVectorizer (GitHub)
域: ai.onnx.ml
起始版本: 1
函数: False
支持级别: SupportType.COMMON
形状推断: True

该算子的此版本**自 ai.onnx.ml 域的 1 版本起**可用。

摘要¶

使用索引映射将字典转换为数组。
给定一个字典，每个键都会在对应于键类型的词汇表属性中查找。然后在词汇表数组中找到该键的索引，并用该索引来索引输出的一维张量‘Y’，并将字典‘X’中找到的值插入其中。
输入映射的键类型必须与定义的词汇表属性的元素类型相对应。因此，输出数组的长度将等于索引映射向量参数的长度。输入字典中的所有键都必须存在于索引映射向量中。对于输入字典中的每个项，将其值插入输出数组。任何不在输入字典中的键，在输出数组中将为零。
例如：如果 string_vocabulary 参数设置为 ["a", "c", "b", "z"]，那么输入 {"a": 4, "c": 8} 将产生输出 [4, 8, 0, 0]。

属性¶

int64_vocabulary - INTS :

一个整数词汇表数组。
必须定义且仅定义其中一个词汇表。
string_vocabulary - STRINGS :

一个字符串词汇表数组。
必须定义且仅定义其中一个词汇表。

输入¶

X (异构) - T1

一个字典。

输出¶

Y (异构) - T2

一个包含来自输入字典的值的一维张量。

类型约束¶

T1 在 ( map(int64, double), map(int64, float), map(int64, string), map(string, double), map(string, float), map(string, int64) )

输入必须是从字符串或整数到字符串或数值类型的映射。键和值类型不能相同。
T2 在 ( tensor(double), tensor(float), tensor(int64), tensor(string) )

输出将是输入映射的值类型的张量。其形状将为 [1,C]，其中 C 是输入字典的长度。