向量单元
100%可定制
提供包括:
Atrevido
Avispado

唯一100%可定制RISC-V向量单元

可单独或
与Atrevido及Avispado组合授权

64位

向量处理单元(VPU)以内在64位数据通路支持大型内存容量

浮点(FP)及整型(Int),8位到64位

支持所有整型和浮点格式,从8到64位,包括bfloat16。

DLEN高达2048位

数据通路长度可按需配置,从128到2048位

VLEN高达4096位

向量长度可按需配置,从128到4096位

支持AI

张量(Tensor)指令无缝集成

RVV1.0

实现完整RISC-V向量1.0规范

什么是向量单元?

向量单元包含若干“向量内核”,约等于一个GPU内核,用于实现并行乘法运算。
每个向量内核拥有可以进行加法、减法、加乘融合、除法、平方根和逻辑操作的算术单元。

Semidynamics 向量单元

我们的向量内核可被裁剪定制以支持不同数据类型:FP64, FP32, FP16, BF16, INT64,
INT32, INT16 或 INT8,取决于客户的目标应用领域。

最大的数据类型位数宽度定义了向量内核宽度或ELEN。客户然后可以选择
向量单元内部的向量内核数量,可以是4、8、16或32内核,满足非常宽泛的
功耗-性能-面积的取舍选项。

一旦做出这些选择,总向量单元数据通路宽度或DLEN就等于ELEN x 向量内核数量。
我们支持DLEN配置从128位到2048位。

我们的向量单元配有一个高性能,跨向量内核网络,提供了在向量内核之间
连接一切的高带宽通路,甚至可支持超大32向量内核的选项。

跨向量内核单元用于RISC-V标准中特定指令,
可以在不同向量内核(如vrgather,vslide等)之间重组数据。

我们还提供另一个向量单元的关键选项:每个向量寄存器的位数(称为VLEN)
也可按客户需求裁剪。

当多数其它厂商假定VLEN等于DLEN(即 1倍率)时,我们提供2倍、4倍及8倍率。
当VLEN比DLEN大时,一个向量操作使用多个周期来执行。
这是一个容忍大内存延迟并降低功耗的伟大特性。

例如,当VLEN=2048且DLEN=512时
每个向量算术操作将占用4个时钟周期来执行。