1nfinite 技术文章
RISC-V 和 AI 技术文章,探索新算力时代的未来
精选文章

AI 模型性能的引擎:算子库编程语言的发展与趋势
本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新
随着 AI 技术的飞速发展,底层基础设施正面临前所未有的碎片化挑战。框架多样性、模型迭代速度加快、算子库维护成本攀升以及硬件平台的不断分化,使得 AI 系统的高效协同变得愈发复杂。本文将深入剖析这些挑战的根源,探讨新型算子库编程语言、AI 编译器与 RISC-V DSA 三者融合创新是否能够成为 AI 时代的底层解决方案。
所有文章

Triton 编译器架构全景与多后端适配
本文将通过丰富的应用案例,帮助 开发者全面理解 Triton 编译器在不同硬件环境下的适配策略,为 AI 系统的高性能部署提供坚实支撑。

Triton Kernel 全流程揭秘:从编译到运行
本文将详细解析 Triton Kernel 从 Python 代码到目标二进制的完整编译流程,剖析每一步的关键机制与实现细节。同时,系统讲解 host 端与 device 端的 kernel 启动机制,阐释数据如何从 host 传递到 kernel,并揭示二者如何协同实现高效的算子执行。

Triton 算子开发:调试与性能优化实战
本文将系统介绍 Triton 算子开发中的调试方法,包括如何使用 device_print 和 interpret 模式 ( cpu python 解析执行) 进行算子级调试,帮助开发者快速发现和修复问题。

Triton 算子开发 Triton 编程语言和 SPMD 编程模型
本文将系统介绍 Triton 语言的核心语法要点与 SPMD 编程范式,帮助读者快速掌握使用 Python eDSL 算子开发语言开发 AI 算子的基本方法。

AI 模型性能的引擎:算子库编程语言的发展与趋势
本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。
