zcc编译器2.0正式发布, SPECINT2K6性能提升15%,RVV自动向量化80倍性能提升
经过一年的忙碌,兆松科技研发的RISC-V zcc编译器2.0版本正式发布,目前国内外各大主流RISC-V芯片/IP公司正在合作评估中,欢迎有兴趣的小伙伴随时勾搭。 废话不多说,下面主要展现一下2.0版本当中的改进。 SPECINT2K6 SPECINT2K6动态指令数,比riscv gcc 12.2好14%,比llvm16好15%,比美国某RISC-V IP公司商业化编译器好10%-15% RVV自动向量化 zcc自动向量化器可以产生比手写intrinsic算子库更好的性能(平均10%以上的性能优势),比gcc12-rvv-next自动向量化器最多快70倍,比llvm 16自动向量化器最多快86倍。(在我们测试的时候,以下有一些例子,gcc12-rvv-next,以及llvm16还无法成功做到多层循环的自动向量化)。 在#pragma的帮助下,zcc可以实现任意嵌套层次循环的自动向量化,可以解决最内层循环自动向量化的一些访存问题,从而让性能大幅提升。从我们合作评估方的反馈数据得知,zcc自动向量化的correlation算子的cycle数,比手写intrinsic版本的correlation算子cycle数好50%(cache命中显著提升)。 代码密度优势 除了上面提到的性能优势,我们zcc编译器在1.0版本的基础上,继续保持着代码密度优势,在embench-iot测试当中,.text段代码密度平均比gcc12.0好25%左右。 欢迎小伙伴前来索取试用评估版本的工具链(aries.wu@terapines.com)
zcc编译器2.0正式发布, SPECINT2K6性能提升15%,RVV自动向量化80倍性能提升 Read More »