1nfinite 技术文章
RISC-V 和 AI 技术文章,探索新算力时代的未来
精选文章

AI 模型性能的引擎:算子库编程语言的发展与趋势
本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新
随着 AI 技术的飞速发展,底层基础设施正面临前所未有的碎片化挑战。框架多样性、模型迭代速度加快、算子库维护成本攀升以及硬件平台的不断分化,使得 AI 系统的高效协同变得愈发复杂。本文将深入剖析这些挑战的根源,探讨新型算子库编程语言、AI 编译器与 RISC-V DSA 三者融合创新是否能够成为 AI 时代的底层解决方案。
所有文章

Triton Kernel 全流程揭秘:从编译到运行
本文将详细解析 Triton Kernel 从 Python 代码到目标二进制的完整编译流程,剖析每一步的关键机制与实现细节。同时,系统讲解 host 端与 device 端的 kernel 启动机制,阐释数据如何从 host 传递到 kernel,并揭示二者如何协同实现高效的算子执行。

Triton 算子开发:调试与性能优化实战
本文将系统介绍 Triton 算子开发中的调试方法,包括如何使用 device_print 和 interpret 模式 ( cpu python 解析执行) 进行算子级调试,帮助开发者快速发现和修复问题。

Triton 算子开发 Triton 编程语言和 SPMD 编程模型
本文将系统介绍 Triton 语言的核心语法要点与 SPMD 编程范式,帮助读者快速掌握使用 Python eDSL 算子开发语言开发 AI 算子的基本方法。

AI 模型性能的引擎:算子库编程语言的发展与趋势
本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新
随着 AI 技术的飞速发展,底层基础设施正面临前所未有的碎片化挑战。框架多样性、模型迭代速度加快、算子库维护成本攀升以及硬件平台的不断分化,使得 AI 系统的高效协同变得愈发复杂。本文将深入剖析这些挑战的根源 ,探讨新型算子库编程语言、AI 编译器与 RISC-V DSA 三者融合创新是否能够成为 AI 时代的底层解决方案。

预告 | Triton on RISC-V AI基础设施新范式全景解析
本系列共 11 期,聚焦 Triton on RISC-V 的核心技术演进,围绕 AI 基础设施、算子库、AI 编译器、Triton 编程体系与 RISC-V DSA 的融合创新展开。

Python 与 CIRCT 的融合:HLS 新视角
本文将探讨如何利用 Python 解释性语言与 CIRCT 工具链的强大组合,实现 HLS 流程,从而将 Python 代码转换为可在 FPGA 或 ASIC 上运行的硬件电路描述。

CIRCT 中的形式化验证利器:BMC & LEC
本文将重点介绍 CIRCT 框架中的两种形式化验证工具:BMC(Bounded Model Checking)和LEC(Logical Equivalence Checking)。

硬件仿真的两大范式:Cycle-based VS Event-driven
仿真在硬件领域是不可或缺的一个环节,它与验证密不可分。本文将对比两种主要的仿真范式:cycle-based (基于时钟周期)和event-driven (基于事件驱动)。

鄂公网安备 42018502007513