- 本课程包括:
- 3个月群内答疑,讲师助教及时解答
- 课程有效期为1年,建议合理规划学习
- 课程配有作业练习,助教一对一批改
- 班主任带班,严格督学,告别拖延
- 根据学习情况颁发结业证书、优秀学员证书
雍洋
商汤科技模型工具链团队研究员,毕业于西安交通大学,现主要研究方向为深度学习的模型压缩技术,负责团队中的大模型量化工具、在线量化工具、稀疏工具的迭代开发和相应的压缩业务落地。
谷石桥
商汤科技模型工具链团队研究员,毕业于天津大学,现主要研究方向为深度学习的模型压缩技术,负责团队中的大模型量化工具、离线量化工具和相应的压缩业务落地。
在当今的人工智能领域,深度学习模型已成为推动技术进步的核心动力。然而,随着模型变得越来越复杂,它们对计算资源的需求也日益增加,同时,边缘端对模型推理耗时的需求也较为苛刻。在这样的背景下,模型压缩技术应运而生,已成为一种不可或缺的技术。
模型压缩是通过量化或者稀疏等压缩技术,把深度神经网络模型以更高效的方式进行部署,实际提高模型的推理速度,降低模型的部署成本,带来明显的收益。从计算机视觉模型到大语言模型,模型压缩都是实际部署落地必备环节。
学习模型压缩技术,有助于打通整个AI模型的生产环节,加深对实际项目落地流程的理解。遗憾的是,绝大多数AI领域的工作者忽视了模型压缩的价值,同时,模型压缩技术路线较多,对初学者来说有较高的门槛,进一步导致目前市面上相关人才稀缺。深蓝学院联合商汤科技模型工具链团队一起推出该课程。通过该课程的学习,同学们可以逐步理解并掌握模型压缩的相关技术知识,并独立进行相关工作的开发和研究。
课程目标
- 掌握模型压缩领域的典型算法的原理和技术细节
- 掌握对模型压缩工具的熟练使用和内在原理
- 通过实战部署操作对模型压缩技术有全方位的理解和经验掌握
课程亮点
-
系统讲解深度神经网络中的模型压缩典型算法
-
代码级讲解多种压缩工具的原理细节和使用方式
-
覆盖视觉和大语言模型的全方位压缩知识和实际部署经验
课程大纲
-
第1章:模型压缩概述
本章节介绍了模型压缩的相关背景和基础概念。深度神经网络在实际部署落地的过程中,由于延迟功耗等要求,往往要对模型进行压缩。模型压缩可以让模型的推理速度会更快,在自动驾驶等场景,可以提升安全性,在手机等移动端场景, 可以增强用户体验。
-
第2章:离线量化算法和工具
本章节介绍了离线量化(PTQ)的基础概念,工业界常见的量化难点,常见的PTQ算法包括BRECQ、Qdrop等,最后介绍了离线量化工具Dipoorlet。离线量化因其简易性和低开销,是最常见的模型量化或模型压缩手段,使用合适离线量化算法和工具可以帮助用户快速部署一个压缩后的,同时精度得到保障的深度学习模型。
-
第3章:离线量化工具实现原理和细节
本章节介绍了支持多后端的离线量化工具Dipoorlet的实现,包括其核心的算法Adaround、BRECQ和QDrop,以及各种校准算法的实现。同时Dipoorlet支持多种推理后端的部署,包括TRT,TI,Snpe等。其使用起来非常简单,仅仅需要一句命令行,课程最后会向大家介绍如何用Dipoorlet在TRT推理后端量化部署一个CV模型。
-
第4章:在线量化算法和工具
本章节介绍了在线量化算法和MQBench在线量化工具。在线量化在模型的训练过程中,模拟量化的行为,从而能够在训练时感知到量化的误差。通过约束模型的损失函数,在线量化在训练结束之后,即可生产出更适合量化的模型。
课程适合谁学习
- AI相关企业的模型压缩和部署工程师
- 高校和企业从事模型压缩研究的同学
- 对模型压缩和部署技术感兴趣的算法工程师
基础&设备要求
-
编程能力: Python
-
基础知识: 深度学习常见模型,尤其是CNN以及transformer
-
硬件要求: 12GB以上的显存,16GB以上的内存,Ubuntu系统,A100显卡(本地或者云端)
全方位的学习服务
个性化增值服务,学习有保障更高效
-
作业批改
作业批改 助教1V1批改作业,定期针对作业中的“通病”进行点评
-
结业证书
结业证书 本课程将根据作业完成情况评选结业学员及优秀学员,颁发证书
-
实时答疑
实时答疑 讲师和助教微信群答疑,及时解决大家遇到的问题
-
班班督学
班班督学 班主任全程带班,不定时“关照”未交作业的同学,克服拖延
-
第1章: 模型压缩概述 4节课程·1小时47分钟
本章节介绍了模型压缩的相关背景和基础概念。深度神经网络在实际部署落地的过程中,由于延迟功耗等要求,往往要对模型进行压缩。模型压缩可以让模型的推理速度会更快,在自动驾驶等场景,可以提升安全性,在手机等移动端场景, 可以增强用户体验。
-
第1节: 模型压缩背景及本套课程简介
- 1:【课件】模型压缩概述
- 免费 2-1:【视频】章节介绍
- 免费 2-2:【视频】模型压缩在AI模型一生中的意义
- 免费 2-3:【视频】模型压缩效果演示
- 免费 2-4:【视频】课程内容及目标
-
第2节: 模型量化概念
- 免费 3-1:【视频】线性量化:对称线性量化
- 免费 3-2:【视频】线性量化:非对称线性量化
- 免费 4:【视频】非线性量化
- 免费 5:【视频】动态量化
- 免费 6:【视频】量化粒度
- 免费 7:【视频】量化研究的重点
-
第3节: 模型稀疏概念
- 免费 8:【视频】模型剪枝技术
-
第4节: 其他模型压缩概念
- 免费 9:【视频】其他模型压缩技术简介
-
第2章: 离线量化算法和工具 4节课程·1小时37分钟
本章节介绍了离线量化(PTQ)的基础概念,工业界常见的量化难点,常见的PTQ算法包括BRECQ、Qdrop等,最后介绍了离线量化工具Dipoorlet。离线量化因其简易性和低开销,是最常见的模型量化或模型压缩手段,使用合适离线量化算法和工具可以帮助用户快速部署一个压缩后的,同时精度得到保障的深度学习模型。
- 10:【课件】离线量化算法和工具
-
第1节: 离线量化基础概念
- 11-1:【视频】模型量化的定义与优缺点
- 11-2:【视频】离线量化类型回顾
- 11-3:【视频】如何计算scale与zero_point
- 11-4:【视频】离线量化的概念与流程概述
- 12:【视频】离线量化的流程细节
-
第2节: 离线量化的难点
- 13:【视频】离线量化的难点
-
第3节: 离线量化算法介绍:Data-free量化,Adaround,Brecq,Qdrop等
- 14-1:【视频】Data-free量化方法:WE
- 14-2:【视频】Data-free量化方法:BC
- 14-3:【视频】AdaRound方法
- 14-4:【视频】Brecq与QDrop方法
- 14-5:【视频】量化算法总结
-
第4节: 离线量化工具介绍:dipoorlet
- 15:【视频】离线量化工具Dipoorlet介绍
-
第3章: 离线量化工具实现原理和细节 3节课程2篇阅读材料·1次作业·2小时22分钟
本章节介绍了支持多后端的离线量化工具Dipoorlet的实现,包括其核心的算法Adaround、BRECQ和QDrop,以及各种校准算法的实现。同时Dipoorlet支持多种推理后端的部署,包括TRT,TI,Snpe等。其使用起来非常简单,仅仅需要一句命令行,课程最后会向大家介绍如何用Dipoorlet在TRT推理后端量化部署一个CV模型。
- 16-1:【课件】离线量化工具Dipoorlet
- 16-2:【实践代码】code
-
第1节: 离线量化工具整体设计结构
- 17-1:【视频】离线量化工具Dipoorlet介绍
- 17-2:【视频】Dipoorlet整体结构
-
第2节: 离线量化工具代码解读
- 18-1:【视频】Dipoorlet量化流程之模型加载
- 18-2:【视频】Dipoorlet量化流程之校准
- 18-3:【视频】Dipoorlet量化流程之权重微调:BC与WE方法
- 18-4:【视频】Dipoorlet量化流程之权重微调:AdaRound, Brecq与QDrop
- 19:【视频】量化分析与量化部署
-
第3节: 实践:Dipoorlet量化:MobileNet
- 20-1:【视频】Dipoorlet实战
- 20-2:【视频】实战案例:MobileNet
- 21-1:【任务说明】Project 1 MobileNet V2量化推理
- 21-2:【模型】mobilev2_model
- 21-3:【作业】第三章
- 21-4:【图文】第三章作业思路提示
-
第4章: 在线量化算法和工具 4节课程·1小时46分钟
本章节介绍了在线量化算法和MQBench在线量化工具。在线量化在模型的训练过程中,模拟量化的行为,从而能够在训练时感知到量化的误差。通过约束模型的损失函数,在线量化在训练结束之后,即可生产出更适合量化的模型。
- 22:【课件】在线量化算法和工具
-
第1节: 在线量化基础概念
- 23:【视频】在线量化基础概念
-
第2节: 在线量化的基本流程
- 24-1:【视频】QAT整体的pipeline
- 24-2:【视频】QAT超参选择
- 24-3:【视频】QAT的几个关键点
-
第3节: 在线量化算法介绍:LSQ,DSQ,PACT等
- 25-1:【视频】在线量化算法介绍
- 25-2:【视频】在线量化算法小结
-
第4节: 在线量化工具介绍:MQBench
- 26-1:【视频】在线量化工具介绍
- 26-2:【视频】在线量化工具演示
-
第5章: 在线量化工具实现原理和细节 3节课程2篇阅读材料·1次作业·1小时31分钟
本章介绍了在线量化工具MQBench的实现原理和细节,MQBench基于torch.fx,实现了在线量化的各个流程,包括QAT Module的替换,BN Fuse的模拟,量化参数的初始化,不同算法的伪量化,onnx导出等。本章通过代码的讲解,巩固加深对在线量化的理解和熟悉工具的使用。
- 27:【课件】在线量化工具
-
第1节: 在线量化工具整体设计结构
- 28:【视频】LSQ+的推导
- 29:【视频】在线量化工具整体设计结构
-
第2节: 在线量化工具代码解读
- 30-1:【视频】mqbench的安装和快速example
- 30-2:【视频】pth模型转静态图
- 30-3:【视频】静态图-fuse-ConvBnRelu
- 30-4:【视频】swap: ConvBnRelu+weight量化
-
第3节: 实践:MobileNet V2 在线量化
- 31:【视频】在线量化实战
- 32-1:【任务说明】Project 2 MobileNet V2在线量化
- 32-2:【代码】code
- 32-3:【作业】第五章
- 32-4:【图文】第五章作业思路提示
-
第6章: 量化部署实践 3节课程·2小时42分钟
本章介绍了三种常见的AI推理后端,包括TRT, QNN,Openvino,同时也简易介绍了推理后端自带的量化框架。同时展开介绍了TRT后端的模型优化手段。最后向介绍了如何使用离线量化工具Dipoorlet在TRT, QNN后端部署Yolov8模型,以及如何编写量化训练的代码和注意事项。
- 33-1:【课件】量化部署实践
- 33-2:【文档】课件所涉及链接
-
第1节: 常见的AI部署后端
- 34:【视频】3种常见的AI推理框架
-
第2节: YOLOv8在TensorRT与QNN推理后端上的量化部署
- 35-1:【视频】量化任务安排
- 35-2:【视频】在TensorRT上部署离线量化的YOLOv8模型
- 35-3:【视频】在高通QNN上部署离线量化的YOLOv8模型
-
第3节: YOLOv8模型的在线量化部署
- 36:【课件】YOLOv8模型的在线量化部署
- 37-1:【视频】在线量化部署的注意事项
- 37-2:【视频】YOLOv8的训练代码结构
- 38-1:【视频】前后处理与纯网络部分的分离
- 38-2:【视频】预训练浮点模型的加载
- 38-3:【视频】屏蔽纯网络中不可trace的部分
- 38-4:【视频】QAT模型在线量化
-
第7章: 模型压缩中的稀疏算法 4节课程·2小时0分钟
本章介绍了模型压缩中常见的稀疏剪枝方法,按稀疏粒度分,分别介绍了结构化稀疏、非结构化稀疏、半结构化稀疏(n:m)。同时介绍了一些学术界的稀疏剪枝算法,和我们的稀疏工具MSBench,最后向大家介绍了如何用Msbench结构化剪枝一个ResNet模型,实现加速,以及如何在TRT后端部署半结构化稀疏的模型。
- 39:【课件】模型压缩中的稀疏算法
-
第1节: 模型稀疏介绍
- 40:【视频】模型稀疏介绍与常见稀疏类型
-
第2节: 常见稀疏范式
- 41-1:【视频】结构化稀疏
- 41-2:【视频】非结构稀疏和N:M稀疏
-
第3节: msbench工具介绍
- 42-1:【视频】msbench工具介绍
- 42-2:【视频】 msbench代码结构介绍及使用
-
第4节: 模型稀疏部署
- 43-1:【视频】2比4与非结构化稀疏过程的代码演示
- 43-2:【视频】结构化剪枝案例实践讲解
-
第8章: 大模型领域的量化算法 6节课程1篇阅读材料·1次作业·3小时33分钟
本章介绍了大模型(LLM)的量化背景,常见的大模型量化算法,以及大模型量化工具LLMC。大模型的推理成本较高,耗时压力很大,为了加速大模型的推理,大模型量化是必要的技术。本章同样会从从算法和工具的角度带大家入门并掌握大模型量化的常见技术手段。
- 44:【课件】大语言模型量化算法与工具
-
第1节: 大模型基础概念介绍
- 45:【视频】LLM量化的背景介绍
-
第2节: 大模型量化算法之Weight-Act量化
- 46-1:【视频】Outlier Suppression 算法
- 46-2:【视频】Outlier Suppression+ 算法
- 46-3:【视频】SmoothQuant与OmniQuant算法
- 46-4:【视频】Llm.int8()算法
-
第3节: 大模型量化算法之Weight-Only量化
- 47:【视频】Weight-Only量化:GPTQ与AWQ
-
第4节: 大模型量化算法之量化benchmark
- 48:【视频】量化benchmark
-
第5节: 大模型量化工具介绍:llmc
- 49:【视频】LLM量化算法awq
- 50-1:【视频】大模型量化引入
- 50-2:量化工具LLMC架构
- 50-3:【视频】LLM量化算法smoothquant
- 50-4:【视频】LLM量化算法osplus
-
第6节: 大模型推理部署和评测流程
- 51-1:【视频】小节引入
- 51-2:【视频】大模型量化实战
- 52-1:【任务说明】Project3
- 52-2:【作业】第八章
课程讨论区
已累计讨论26495个问题
课程配备专属讨论区,不仅有讲师、助教全程答疑,更能与同学们交流讨论,在思维碰撞中加深理解
在课程中随想随问,同学们的问题也可能启发到你
在课程讨论区,和684位同学一起探讨更多问题···
作业批改
已累计批改4951份作业
助教一对一批改作业,定期针对作业中的问题进行评讲
结业证书
课程根据作业完成情况评选结业学员及优秀学员,颁发证书
优秀学员更能获得额外购课优惠
班班督学
班班、助教、讲师全程带班,日常答疑解惑
FAQ
1、课程可以试听吗?
可以,您可以联系客服领取试听内容,根据试听的效果决定是否报名。
2、报名课程后,如果不满意,可以退款吗?
我们承诺: 报名后7天内且学习进度停留在第一章节的内容可以无条件全额退款,若您的学习进度超过第一章或报名时间超过7天将不再支持退款哦。课好不好,学了就知道了!
3、报名课程的费用可以开发票吗?
深蓝学院所有课程都可以开具发票。您可以登录深蓝学院官网(https://www.shenlanxueyuan.com),进入个人“账户中心”,在线申请。
4、报名后怎么开始学习呢?
PC端:登录深蓝学院官网(https://www.shenlanxueyuan.com),进入“个人中心”或“我的课程” 的课程即可开始学习。课程中包含讲师讲解的视频、课件、代码、作业及其它学习资料。建议在PC端学习体验更好。
如果想缓存视频,可下载深蓝学院APP。
5、可以跟讲师直接交流吗?
报名课程后添加课程对应的班主任微信,由其邀请加入微信答疑群。在答疑群内,您可以直接跟讲师和其他同学讨论交流。
报名后在对应的课程详情页,可查看对应的班主任微信。
6、学习形式和学习周期是怎样的?
为保证学习质量方便同学们反复观看,本课程采用录播形式。建议同学们登录深蓝学院PC端官网体验更佳。
7、课程有有效期吗?
为了督促同学们学习,保证学习效率,学院的课程有效期均为一年,当课程有效期截止后将不再支持观看视频、下载课件等课程服务及操作。若同学们依旧想观看视频和下载课件,建议可选择续费本课程。需要提醒大家的是,课程答疑、作业批改&讲评等课程相关服务期从报名加入课程后开始计算至少保证三个月。
8、作业会提供参考答案吗?
不提供参考答案。当每章作业截止提交后,会解锁作业思路讲解。我们希望引导大家培养独立思考的习惯和敢于动手实践的勇气,以便尽快适应实际工作中解决问题的模式。做作业过程中,如果有任何困惑和问题,可以在课程讨论区和交流群内提问解决。
课程预览
深度神经网络模型压缩