精品课

深度神经网络模型压缩

系统讲解深度神经网络中的模型压缩典型算法

代码级讲解多种压缩工具的原理细节和使用方式

覆盖视觉和大语言模型的全方位压缩知识和实际部署经验

  • 讲师:雍洋
  • 讲师:谷石桥

 对课程有疑问? 点击视频立即观看课程介绍!

课程服务

至少3个月

作业批改

助教1v1批改

课程有效期

365天

课程时长

17.4 h

¥699.00

更多信息添加客服咨询,请备注【模型压缩】
请确认
X
深度神经网络模型压缩 您已经是《深度神经网络模型压缩》-学员,是否购买最新一期?

i提示:

1. 您的《深度神经网络模型压缩》-暂未到期,可直接学习

2. 针对以上信息如有问题,您可联系工作人员进行咨询

购买最新一期
课程介绍 课程大纲 学习服务 售前疑问
¥699.00
本课程包括:
3个月群内答疑,讲师助教及时解答
课程有效期为1年,建议合理规划学习
课程配有作业练习,助教一对一批改
班主任带班,严格督学,告别拖延
根据学习情况颁发结业证书、优秀学员证书

雍洋

商汤科技模型工具链团队研究员,毕业于西安交通大学,现主要研究方向为深度学习的模型压缩技术,负责团队中的大模型量化工具、在线量化工具、稀疏工具的迭代开发和相应的压缩业务落地。

谷石桥

商汤科技模型工具链团队研究员,毕业于天津大学,现主要研究方向为深度学习的模型压缩技术,负责团队中的大模型量化工具、离线量化工具和相应的压缩业务落地。

在当今的人工智能领域,深度学习模型已成为推动技术进步的核心动力。然而,随着模型变得越来越复杂,它们对计算资源的需求也日益增加,同时,边缘端对模型推理耗时的需求也较为苛刻。在这样的背景下,模型压缩技术应运而生,已成为一种不可或缺的技术。

模型压缩是通过量化或者稀疏等压缩技术,把深度神经网络模型以更高效的方式进行部署,实际提高模型的推理速度,降低模型的部署成本,带来明显的收益。从计算机视觉模型到大语言模型,模型压缩都是实际部署落地必备环节。

学习模型压缩技术,有助于打通整个AI模型的生产环节,加深对实际项目落地流程的理解。遗憾的是,绝大多数AI领域的工作者忽视了模型压缩的价值,同时,模型压缩技术路线较多,对初学者来说有较高的门槛,进一步导致目前市面上相关人才稀缺。深蓝学院联合商汤科技模型工具链团队一起推出该课程。通过该课程的学习,同学们可以逐步理解并掌握模型压缩的相关技术知识,并独立进行相关工作的开发和研究。

课程目标

  • 掌握模型压缩领域的典型算法的原理和技术细节
  • 掌握对模型压缩工具的熟练使用和内在原理
  • 通过实战部署操作对模型压缩技术有全方位的理解和经验掌握

课程亮点

  • 系统讲解深度神经网络中的模型压缩典型算法

  • 代码级讲解多种压缩工具的原理细节和使用方式

  • 覆盖视觉和大语言模型的全方位压缩知识和实际部署经验

课程大纲

  • 第1章:模型压缩概述

    本章节介绍了模型压缩的相关背景和基础概念。深度神经网络在实际部署落地的过程中,由于延迟功耗等要求,往往要对模型进行压缩。模型压缩可以让模型的推理速度会更快,在自动驾驶等场景,可以提升安全性,在手机等移动端场景, 可以增强用户体验。

  • 第2章:离线量化算法和工具

    本章节介绍了离线量化(PTQ)的基础概念,工业界常见的量化难点,常见的PTQ算法包括BRECQ、Qdrop等,最后介绍了离线量化工具Dipoorlet。离线量化因其简易性和低开销,是最常见的模型量化或模型压缩手段,使用合适离线量化算法和工具可以帮助用户快速部署一个压缩后的,同时精度得到保障的深度学习模型。

  • 第3章:离线量化工具实现原理和细节

    本章节介绍了支持多后端的离线量化工具Dipoorlet的实现,包括其核心的算法Adaround、BRECQ和QDrop,以及各种校准算法的实现。同时Dipoorlet支持多种推理后端的部署,包括TRT,TI,Snpe等。其使用起来非常简单,仅仅需要一句命令行,课程最后会向大家介绍如何用Dipoorlet在TRT推理后端量化部署一个CV模型。

  • 第4章:在线量化算法和工具

    本章节介绍了在线量化算法和MQBench在线量化工具。在线量化在模型的训练过程中,模拟量化的行为,从而能够在训练时感知到量化的误差。通过约束模型的损失函数,在线量化在训练结束之后,即可生产出更适合量化的模型。

点击此处查看完整目录

课程适合谁学习

  • AI相关企业的模型压缩和部署工程师
  • 高校和企业从事模型压缩研究的同学
  • 对模型压缩和部署技术感兴趣的算法工程师

基础&设备要求

  • 编程能力: Python
  • 基础知识: 深度学习常见模型,尤其是CNN以及transformer
  • 硬件要求: 12GB以上的显存,16GB以上的内存,Ubuntu系统,A100显卡(本地或者云端)

全方位的学习服务

个性化增值服务,学习有保障更高效

  • 作业批改

    作业批改 助教1V1批改作业,定期针对作业中的“通病”进行点评

  • 结业证书

    结业证书 本课程将根据作业完成情况评选结业学员及优秀学员,颁发证书

  • 实时答疑

    实时答疑 讲师和助教微信群答疑,及时解决大家遇到的问题

  • 班班督学

    班班督学 班主任全程带班,不定时“关照”未交作业的同学,克服拖延

课程相关问题请咨询客服

添加请备注【模型压缩】

点击查看
课程大纲
点击了解
学习服务
  • 第1章: 模型压缩概述 4节课程·1小时47分钟

    本章节介绍了模型压缩的相关背景和基础概念。深度神经网络在实际部署落地的过程中,由于延迟功耗等要求,往往要对模型进行压缩。模型压缩可以让模型的推理速度会更快,在自动驾驶等场景,可以提升安全性,在手机等移动端场景, 可以增强用户体验。

  • 第1节: 模型压缩背景及本套课程简介

  • 1:【课件】模型压缩概述
  • 1分钟 免费 2-1:【视频】章节介绍
  • 8分钟 免费 2-2:【视频】模型压缩在AI模型一生中的意义
  • 5分钟 免费 2-3:【视频】模型压缩效果演示
  • 2分钟 免费 2-4:【视频】课程内容及目标
  • 第2节: 模型量化概念

  • 17分钟 免费 3-1:【视频】线性量化:对称线性量化
  • 9分钟 免费 3-2:【视频】线性量化:非对称线性量化
  • 5分钟 免费 4:【视频】非线性量化
  • 7分钟 免费 5:【视频】动态量化
  • 7分钟 免费 6:【视频】量化粒度
  • 19分钟 免费 7:【视频】量化研究的重点
  • 第3节: 模型稀疏概念

  • 12分钟 免费 8:【视频】模型剪枝技术
  • 第4节: 其他模型压缩概念

  • 10分钟 免费 9:【视频】其他模型压缩技术简介
  • 第2章: 离线量化算法和工具 4节课程·1小时37分钟

    本章节介绍了离线量化(PTQ)的基础概念,工业界常见的量化难点,常见的PTQ算法包括BRECQ、Qdrop等,最后介绍了离线量化工具Dipoorlet。离线量化因其简易性和低开销,是最常见的模型量化或模型压缩手段,使用合适离线量化算法和工具可以帮助用户快速部署一个压缩后的,同时精度得到保障的深度学习模型。

  • 10:【课件】离线量化算法和工具
  • 第1节: 离线量化基础概念

  • 6分钟 11-1:【视频】模型量化的定义与优缺点
  • 14分钟 11-2:【视频】离线量化类型回顾
  • 4分钟 11-3:【视频】如何计算scale与zero_point
  • 7分钟 11-4:【视频】离线量化的概念与流程概述
  • 18分钟 12:【视频】离线量化的流程细节
  • 第2节: 离线量化的难点

  • 3分钟 13:【视频】离线量化的难点
  • 第3节: 离线量化算法介绍:Data-free量化,Adaround,Brecq,Qdrop等

  • 11分钟 14-1:【视频】Data-free量化方法:WE
  • 6分钟 14-2:【视频】Data-free量化方法:BC
  • 8分钟 14-3:【视频】AdaRound方法
  • 5分钟 14-4:【视频】Brecq与QDrop方法
  • 3分钟 14-5:【视频】量化算法总结
  • 第4节: 离线量化工具介绍:dipoorlet

  • 7分钟 15:【视频】离线量化工具Dipoorlet介绍
  • 第3章: 离线量化工具实现原理和细节 3节课程2篇阅读材料·1次作业·2小时22分钟

    本章节介绍了支持多后端的离线量化工具Dipoorlet的实现,包括其核心的算法Adaround、BRECQ和QDrop,以及各种校准算法的实现。同时Dipoorlet支持多种推理后端的部署,包括TRT,TI,Snpe等。其使用起来非常简单,仅仅需要一句命令行,课程最后会向大家介绍如何用Dipoorlet在TRT推理后端量化部署一个CV模型。

  • 16-1:【课件】离线量化工具Dipoorlet
  • 16-2:【实践代码】code
  • 第1节: 离线量化工具整体设计结构

  • 8分钟 17-1:【视频】离线量化工具Dipoorlet介绍
  • 3分钟 17-2:【视频】Dipoorlet整体结构
  • 第2节: 离线量化工具代码解读

  • 13分钟 18-1:【视频】Dipoorlet量化流程之模型加载
  • 17分钟 18-2:【视频】Dipoorlet量化流程之校准
  • 9分钟 18-3:【视频】Dipoorlet量化流程之权重微调:BC与WE方法
  • 25分钟 18-4:【视频】Dipoorlet量化流程之权重微调:AdaRound, Brecq与QDrop
  • 2分钟 19:【视频】量化分析与量化部署
  • 第3节: 实践:Dipoorlet量化:MobileNet

  • 13分钟 20-1:【视频】Dipoorlet实战
  • 48分钟 20-2:【视频】实战案例:MobileNet
  • 21-1:【任务说明】Project 1 MobileNet V2量化推理
  • 21-2:【模型】mobilev2_model
  • 21-3:【作业】第三章
  • 21-4:【图文】第三章作业思路提示
  • 第4章: 在线量化算法和工具 4节课程·1小时46分钟

    本章节介绍了在线量化算法和MQBench在线量化工具。在线量化在模型的训练过程中,模拟量化的行为,从而能够在训练时感知到量化的误差。通过约束模型的损失函数,在线量化在训练结束之后,即可生产出更适合量化的模型。

  • 22:【课件】在线量化算法和工具
  • 第1节: 在线量化基础概念

  • 23分钟 23:【视频】在线量化基础概念
  • 第2节: 在线量化的基本流程

  • 2分钟 24-1:【视频】QAT整体的pipeline
  • 7分钟 24-2:【视频】QAT超参选择
  • 29分钟 24-3:【视频】QAT的几个关键点
  • 第3节: 在线量化算法介绍:LSQ,DSQ,PACT等

  • 22分钟 25-1:【视频】在线量化算法介绍
  • 2分钟 25-2:【视频】在线量化算法小结
  • 第4节: 在线量化工具介绍:MQBench

  • 5分钟 26-1:【视频】在线量化工具介绍
  • 13分钟 26-2:【视频】在线量化工具演示
  • 第5章: 在线量化工具实现原理和细节 3节课程2篇阅读材料·1次作业·1小时31分钟

    本章介绍了在线量化工具MQBench的实现原理和细节,MQBench基于torch.fx,实现了在线量化的各个流程,包括QAT Module的替换,BN Fuse的模拟,量化参数的初始化,不同算法的伪量化,onnx导出等。本章通过代码的讲解,巩固加深对在线量化的理解和熟悉工具的使用。

  • 27:【课件】在线量化工具
  • 第1节: 在线量化工具整体设计结构

  • 8分钟 28:【视频】LSQ+的推导
  • 14分钟 29:【视频】在线量化工具整体设计结构
  • 第2节: 在线量化工具代码解读

  • 4分钟 30-1:【视频】mqbench的安装和快速example
  • 13分钟 30-2:【视频】pth模型转静态图
  • 9分钟 30-3:【视频】静态图-fuse-ConvBnRelu
  • 12分钟 30-4:【视频】swap: ConvBnRelu+weight量化
  • 第3节: 实践:MobileNet V2 在线量化

  • 28分钟 31:【视频】在线量化实战
  • 32-1:【任务说明】Project 2 MobileNet V2在线量化
  • 32-2:【代码】code
  • 32-3:【作业】第五章
  • 32-4:【图文】第五章作业思路提示
  • 第6章: 量化部署实践 3节课程·2小时42分钟

    本章介绍了三种常见的AI推理后端,包括TRT, QNN,Openvino,同时也简易介绍了推理后端自带的量化框架。同时展开介绍了TRT后端的模型优化手段。最后向介绍了如何使用离线量化工具Dipoorlet在TRT, QNN后端部署Yolov8模型,以及如何编写量化训练的代码和注意事项。

  • 33-1:【课件】量化部署实践
  • 33-2:【文档】课件所涉及链接
  • 第1节: 常见的AI部署后端

  • 22分钟 34:【视频】3种常见的AI推理框架
  • 第2节: YOLOv8在TensorRT与QNN推理后端上的量化部署

  • 1分钟 35-1:【视频】量化任务安排
  • 13分钟 35-2:【视频】在TensorRT上部署离线量化的YOLOv8模型
  • 40分钟 35-3:【视频】在高通QNN上部署离线量化的YOLOv8模型
  • 第3节: YOLOv8模型的在线量化部署

  • 36:【课件】YOLOv8模型的在线量化部署
  • 9分钟 37-1:【视频】在线量化部署的注意事项
  • 21分钟 37-2:【视频】YOLOv8的训练代码结构
  • 12分钟 38-1:【视频】前后处理与纯网络部分的分离
  • 5分钟 38-2:【视频】预训练浮点模型的加载
  • 12分钟 38-3:【视频】屏蔽纯网络中不可trace的部分
  • 23分钟 38-4:【视频】QAT模型在线量化
  • 第7章: 模型压缩中的稀疏算法 4节课程·2小时0分钟

    本章介绍了模型压缩中常见的稀疏剪枝方法,按稀疏粒度分,分别介绍了结构化稀疏、非结构化稀疏、半结构化稀疏(n:m)。同时介绍了一些学术界的稀疏剪枝算法,和我们的稀疏工具MSBench,最后向大家介绍了如何用Msbench结构化剪枝一个ResNet模型,实现加速,以及如何在TRT后端部署半结构化稀疏的模型。

  • 39:【课件】模型压缩中的稀疏算法
  • 第1节: 模型稀疏介绍

  • 7分钟 40:【视频】模型稀疏介绍与常见稀疏类型
  • 第2节: 常见稀疏范式

  • 10分钟 41-1:【视频】结构化稀疏
  • 16分钟 41-2:【视频】非结构稀疏和N:M稀疏
  • 第3节: msbench工具介绍

  • 10分钟 42-1:【视频】msbench工具介绍
  • 30分钟 42-2:【视频】 msbench代码结构介绍及使用
  • 第4节: 模型稀疏部署

  • 15分钟 43-1:【视频】2比4与非结构化稀疏过程的代码演示
  • 30分钟 43-2:【视频】结构化剪枝案例实践讲解
  • 第8章: 大模型领域的量化算法 6节课程1篇阅读材料·1次作业·3小时33分钟

    本章介绍了大模型(LLM)的量化背景,常见的大模型量化算法,以及大模型量化工具LLMC。大模型的推理成本较高,耗时压力很大,为了加速大模型的推理,大模型量化是必要的技术。本章同样会从从算法和工具的角度带大家入门并掌握大模型量化的常见技术手段。

  • 44:【课件】大语言模型量化算法与工具
  • 第1节: 大模型基础概念介绍

  • 21分钟 45:【视频】LLM量化的背景介绍
  • 第2节: 大模型量化算法之Weight-Act量化

  • 12分钟 46-1:【视频】Outlier Suppression 算法
  • 6分钟 46-2:【视频】Outlier Suppression+ 算法
  • 10分钟 46-3:【视频】SmoothQuant与OmniQuant算法
  • 2分钟 46-4:【视频】Llm.int8()算法
  • 第3节: 大模型量化算法之Weight-Only量化

  • 23分钟 47:【视频】Weight-Only量化:GPTQ与AWQ
  • 第4节: 大模型量化算法之量化benchmark

  • 6分钟 48:【视频】量化benchmark
  • 第5节: 大模型量化工具介绍:llmc

  • 12分钟 49:【视频】LLM量化算法awq
  • 5分钟 50-1:【视频】大模型量化引入
  • 32分钟 50-2:量化工具LLMC架构
  • 7分钟 50-3:【视频】LLM量化算法smoothquant
  • 17分钟 50-4:【视频】LLM量化算法osplus
  • 第6节: 大模型推理部署和评测流程

  • 2分钟 51-1:【视频】小节引入
  • 51分钟 51-2:【视频】大模型量化实战
  • 52-1:【任务说明】Project3
  • 52-2:【作业】第八章

课程讨论区

已累计讨论26495个问题

课程配备专属讨论区,不仅有讲师、助教全程答疑,更能与同学们交流讨论,在思维碰撞中加深理解

在课程中随想随问,同学们的问题也可能启发到你

在课程讨论区,和684位同学一起探讨更多问题···

作业批改

已累计批改4951份作业

助教一对一批改作业,定期针对作业中的问题进行评讲

结业证书

课程根据作业完成情况评选结业学员及优秀学员,颁发证书

优秀学员更能获得额外购课优惠

班班督学

班班、助教、讲师全程带班,日常答疑解惑

FAQ

1、课程可以试听吗?

可以,您可以联系客服领取试听内容,根据试听的效果决定是否报名。

2、报名课程后,如果不满意,可以退款吗?

我们承诺: 报名后7天内且学习进度停留在第一章节的内容可以无条件全额退款,若您的学习进度超过第一章或报名时间超过7天将不再支持退款哦。课好不好,学了就知道了!

3、报名课程的费用可以开发票吗?

深蓝学院所有课程都可以开具发票。您可以登录深蓝学院官网(https://www.shenlanxueyuan.com),进入个人“账户中心”,在线申请。

4、报名后怎么开始学习呢?

PC端:登录深蓝学院官网(https://www.shenlanxueyuan.com),进入“个人中心”或“我的课程” 的课程即可开始学习。课程中包含讲师讲解的视频、课件、代码、作业及其它学习资料。建议在PC端学习体验更好。

如果想缓存视频,可下载深蓝学院APP。

5、可以跟讲师直接交流吗?

报名课程后添加课程对应的班主任微信,由其邀请加入微信答疑群。在答疑群内,您可以直接跟讲师和其他同学讨论交流。

报名后在对应的课程详情页,可查看对应的班主任微信。

6、学习形式和学习周期是怎样的?

为保证学习质量方便同学们反复观看,本课程采用录播形式。建议同学们登录深蓝学院PC端官网体验更佳。

7、课程有有效期吗?

为了督促同学们学习,保证学习效率,学院的课程有效期均为一年,当课程有效期截止后将不再支持观看视频、下载课件等课程服务及操作。若同学们依旧想观看视频和下载课件,建议可选择续费本课程。需要提醒大家的是,课程答疑、作业批改&讲评等课程相关服务期从报名加入课程后开始计算至少保证三个月。

8、作业会提供参考答案吗?

不提供参考答案。当每章作业截止提交后,会解锁作业思路讲解。我们希望引导大家培养独立思考的习惯和敢于动手实践的勇气,以便尽快适应实际工作中解决问题的模式。做作业过程中,如果有任何困惑和问题,可以在课程讨论区和交流群内提问解决。

X

课程预览

深度神经网络模型压缩