专业阶段 - AI 编译器
    签到人数:41
    cover
    专业阶段 - AI 编译器
    • 课程介绍
    • 学习视频(4)
    • 组队信息(1)
    • 晋级榜单(0)

    专业阶段 - AI 编译器

    课程内容简介

    介绍传统编译器和AI编译器的区别,AI编译器的核心流程,一些主流的AI编译器生态介绍,探讨介绍AI编译器流程中前端部分,包含模型导入及其可以做的图优化,从 PyTorch 的核心设计理念——动态计算图出发,梳理图优化技术体系的演进历程,包括三条代表性技术路线:早期的 TorchScript(包含 jit.trace 和 jit.script);中期的 torch.fx 图重写机制;以及 PyTorch 2.0 引入的统一编译入口 torch.compile,并深入分析其核心组件 TorchDynamo、AOTAutograd 以及 TorchInductor 后端的设计原理与亮点,最后探讨并介绍AI编译器流程中后端部分,包含运行时、算子调用以及在此阶段可以做的优化方法。

    课程预期目标

    本课程旨在帮助学生深入理解AI编译器的核心原理与设计方法,系统掌握现代AI编译技术栈的关键组件和优化手段,培养开发高性能、可移植AI模型编译优化的工程实践能力。课程结束后,学生将能够深入理解AI编译器的核心流程和技术体系:

    • 掌握从高层计算图(如PyTorch FX Graph/ONNX)到底层硬件代码的全链路编译流程;
    • 学习计算图优化技术,包括常量折叠、冗余节点消除、算子融合等基础优化;
    • 熟悉内存优化策略,涵盖内存分配、布局转换、内存复用等关键技术。

    学时

    4 小时

    课程依赖

    预备知识

    建议学生具备以下基础:

    • 编程基础:熟悉Python和C++,了解基本的算法与数据结构;
    • 机器学习基础:理解神经网络模型(如CNN/Transformer)的结构与推理流程;
    • 编译原理入门:了解词法分析、语法分析、中间表示(IR)等基本概念;
    • 硬件基础(可选):对CPU/GPU/TPU的架构特性有基本认知,有助于理解后端优化。

    授课方式

    • 讲课
    • 实验/实践

    课程详情

    第一课时. “AI编译器概述”

    课时:1小时

    前置依赖:无

    第二课时. “AI编译器中的前端优化”

    课时:1小时

    前置依赖:无

    第三课时. “PyTorch中图优化”

    课时:1小时

    前置依赖:无

    第四课时. “AI编译器中的后端优化”

    课时:1小时

    前置依赖:无

    empty image
    暂无数据
    每支队伍最多 5
    序号队伍名称城市学校人数队长队员
    Simple Empty
    暂无数据
    • 共1条
    • 1
    排名姓名学校分数最后提交时间链接
    Simple Empty
    暂无数据