跳到主要内容

1nfinite 技术文章

RISC-V 和 AI 技术文章,探索新算力时代的未来

精选文章

AI 模型性能的引擎:算子库编程语言的发展与趋势

AI 模型性能的引擎:算子库编程语言的发展与趋势

本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新

随着 AI 技术的飞速发展,底层基础设施正面临前所未有的碎片化挑战。框架多样性、模型迭代速度加快、算子库维护成本攀升以及硬件平台的不断分化,使得 AI 系统的高效协同变得愈发复杂。本文将深入剖析这些挑战的根源,探讨新型算子库编程语言、AI 编译器与 RISC-V DSA 三者融合创新是否能够成为 AI 时代的底层解决方案。

所有文章

Triton 编译器架构全景与多后端适配

Triton 编译器架构全景与多后端适配

本文将通过丰富的应用案例,帮助开发者全面理解 Triton 编译器在不同硬件环境下的适配策略,为 AI 系统的高性能部署提供坚实支撑。

Triton Kernel 全流程揭秘:从编译到运行

Triton Kernel 全流程揭秘:从编译到运行

本文将详细解析 Triton Kernel 从 Python 代码到目标二进制的完整编译流程,剖析每一步的关键机制与实现细节。同时,系统讲解 host 端与 device 端的 kernel 启动机制,阐释数据如何从 host 传递到 kernel,并揭示二者如何协同实现高效的算子执行。

Triton 算子开发:调试与性能优化实战

Triton 算子开发:调试与性能优化实战

本文将系统介绍 Triton 算子开发中的调试方法,包括如何使用 device_print 和 interpret 模式 ( cpu python 解析执行) 进行算子级调试,帮助开发者快速发现和修复问题。

Triton 算子开发 Triton 编程语言和 SPMD 编程模型

Triton 算子开发 Triton 编程语言和 SPMD 编程模型

本文将系统介绍 Triton 语言的核心语法要点与 SPMD 编程范式,帮助读者快速掌握使用 Python eDSL 算子开发语言开发 AI 算子的基本方法。

AI 模型性能的引擎:算子库编程语言的发展与趋势

AI 模型性能的引擎:算子库编程语言的发展与趋势

本文将系统梳理主流算子 DSL 的发展现状,涵盖CUDA、CuteDSL、TileLang、Triton、Gluon、Mojo等代表性语言,简要介绍各自的特点,并分析它们在性能与编程友好性上的取舍。

AI 基础设施新范式:算子库、编译器�与 RISC-V DSA 的融合创新

AI 基础设施新范式:算子库、编译器与 RISC-V DSA 的融合创新

随着 AI 技术的飞速发展,底层基础设施正面临前所未有的碎片化挑战。框架多样性、模型迭代速度加快、算子库维护成本攀升以及硬件平台的不断分化,使得 AI 系统的高效协同变得愈发复杂。本文将深入剖析这些挑战的根源,探讨新型算子库编程语言、AI 编译器与 RISC-V DSA 三者融合创新是否能够成为 AI 时代的底层解决方案。

预告 | Triton on RISC-V AI基础设施新范式全景解析

预告 | Triton on RISC-V AI基础设施新范式全景解析

本系列共 11 期,聚焦 Triton on RISC-V 的核心技术演进,围绕 AI 基础设施、算子库、AI 编译器、Triton 编程体系与 RISC-V DSA 的融合创新展开。

Python 与 CIRCT 的融合:HLS 新视角

Python 与 CIRCT 的融合:HLS 新视角

本文将探讨如何利用 Python 解释性语言与 CIRCT 工具链的强大组合,实现 HLS 流程,从而将 Python 代码转换为可在 FPGA 或 ASIC 上运行的硬件电路描述。

CIRCT 中的形式化验证利器:BMC & LEC

CIRCT 中的形式化验证利器:BMC & LEC

本文将重点介绍 CIRCT 框架中的两种形式化验证工具:BMC(Bounded Model Checking)和LEC(Logical Equivalence Checking)。