ai.onnx.ml - DictVectorizer¶
DictVectorizer - 1 (ai.onnx.ml)¶
版本¶
域:
ai.onnx.ml
起始版本:
1
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的算子自 domain ai.onnx.ml 的版本 1 起可用。
摘要¶
使用索引映射将字典转换为数组。
给定一个字典,每个键将在与键类型对应的词汇表属性中查找。找到键在词汇表数组中的索引,然后用该索引对输出的 1 维张量 ‘Y’ 进行索引,并将字典 ‘X’ 中找到的值插入其中。
输入 map 的键类型必须与定义的词汇表属性的元素类型对应。因此,输出数组的长度将等于索引映射向量参数的长度。输入字典中的所有键都必须存在于索引映射向量中。对于输入字典中的每个项,将其值插入到输出数组中。输入字典中不存在的任何键,在输出数组中将为零。
例如:如果参数 string_vocabulary
设置为 ["a", "c", "b", "z"]
,则输入 {"a": 4, "c": 8}
将产生输出 [4, 8, 0, 0]
。
属性¶
int64_vocabulary - INTS :
一个整数词汇表数组。
必须且只能定义其中一个词汇表。string_vocabulary - STRINGS :
一个字符串词汇表数组。
必须且只能定义其中一个词汇表。
输入¶
X (异构) - T1
一个字典。
输出¶
Y (异构) - T2
一个存储来自输入字典的值的 1 维张量。
类型约束¶
T1 在 (
map(int64, double)
,map(int64, float)
,map(int64, string)
,map(string, double)
,map(string, float)
,map(string, int64)
) 中输入必须是字符串或整数到字符串或数字类型的 map。键和值类型不能相同。
T2 在 (
tensor(double)
,tensor(float)
,tensor(int64)
,tensor(string)
) 中输出将是一个张量,其类型为输入 map 的值类型。其形状将是 [1,C],其中 C 是输入字典的长度。