ai.onnx.ml - 字典向量化器¶
字典向量化器 - 1 (ai.onnx.ml)¶
版本¶
名称: 字典向量化器 (GitHub)
域:
ai.onnx.ml
自版本:
1
函数:
False
支持级别:
SupportType.COMMON
形状推断:
True
此版本的运算符已从ai.onnx.ml 域的版本 1 开始可用。
摘要¶
使用索引映射将字典转换为数组。
给定一个字典,每个键将在对应于键类型的词汇表属性中查找。找到键的词汇表数组中的索引将用于索引输出一维张量“Y”并将字典“X”中找到的值插入其中。
输入映射的键类型必须与定义的词汇表属性的元素类型相对应。因此,输出数组的长度将等于索引映射向量参数。输入字典中的所有键必须存在于索引映射向量中。对于输入字典中的每个项目,将其值插入输出数组中。输入字典中不存在的任何键在输出数组中将为零。
例如:如果string_vocabulary
参数设置为["a", "c", "b", "z"]
,那么输入{"a": 4, "c": 8}
将产生输出[4, 8, 0, 0]
。
属性¶
int64_vocabulary - INTS :
一个整数词汇表数组。
必须定义一个且仅定义一个词汇表。string_vocabulary - STRINGS :
一个字符串词汇表数组。
必须定义一个且仅定义一个词汇表。
输入¶
X (异构) - T1
一个字典。
输出¶
Y (异构) - T2
一个保存输入字典中值的 1-D 张量。
类型约束¶
T1 in (
map(int64, double)
,map(int64, float)
,map(int64, string)
,map(string, double)
,map(string, float)
,map(string, int64)
)输入必须是字符串或整数到字符串或数值类型的映射。键和值类型不能相同。
T2 in (
tensor(double)
,tensor(float)
,tensor(int64)
,tensor(string)
)输出将是输入映射的值类型的张量。其形状将为 [1,C],其中 C 是输入字典的长度。