• 学习时长

    9周/建议每周至少6小时

  • 答疑服务

    专属微信答疑群/讲师助教均参与

  • 作业批改

    每章节设计作业/助教及时批改评优

  • 课程有效期

    一年/告别拖延,温故知新

*课程已报满,可预约下一期

  • 1:【文档】大模型微调与部署开课仪式
  • 第1章: 课程概述与模型应用
  • 2:【课件】课程概述与模型应用
  • 第1节: 课程概览
  • 3:【视频】课程概览-1
  • 4:【视频】课程概览-2
  • 第2节: 大模型的基本概念
  • 5:【视频】大模型的基本概念:定义、优势和特点
  • 6:【视频】大模型的基本概念:Llama3 8B代码结构详解
  • 7:【视频】大模型的基本概念:Scaling Law
  • 8:【视频】大模型的基本概念:一些代表性的大模型
  • 9:【视频】大模型的基本概念:发展历史与应用场景
  • 第3节: 大模型在垂直细分场景中的表现
  • 10:【视频】大模型在垂直细分场景中的表现
  • 第4节: 什么是微调及其必要性
  • 11:【视频】大模型微调的概念及其必要性
  • 第5节: 课程资源
  • 12:【视频】课程资源推荐
  • 第6节: 【实践】project-1-1:文本摘要能力
  • 13:【视频】文本摘要与实践项目目标
  • 14:【视频】源码获取及微调环境配置
  • 15:【视频】基座模型下载
  • 16-1:【实践】Project1-摘要生成Part1
  • 16-2:【实践】Project:大模型微调实践 Part1
  • 第2章: 指令数据准备与构建
  • 17:【课件】第2章:指令数据准备与构建
  • 第1节: 内容回顾
  • 18:【视频】内容回顾
  • 第2节: 深度学习中的数据工程
  • 19:【视频】深度学习中的数据工程
  • 第3节: Prompt-Engineering与指令数据
  • 20:【视频】提示词工程与指令数据-1
  • 21:【视频】提示词工程与指令数据:指令微调训练流程
  • 第4节: 构建微调指令数据
  • 22:【视频】构建微调指令数据:指令数据的构成
  • 23:【视频】指令数据集的3种构建方法
  • 第5节: 开源指令数据集
  • 24:【视频】开源指令数据集:Flan 2021
  • 25:【视频】 开源指令数据集:AIpaca
  • 26:【视频】开源指令数据集:LIMA与BELLE
  • 第6节: 指令数据准备
  • 27:【视频】指令数据准备
  • 28-1:【实践】Project:大模型微调实践 Part2指令数据准备
  • 28-2:【实践】Project1-摘要生成Part2
  • 第3章: 指令数据进阶与增强
  • 29:【课件】第3章:指令数据进阶与增强.pdf
  • 第1节: 知识回顾
  • 30:【视频】知识回顾
  • 第2节: 指令数据的重要性
  • 31:【视频】指令数据的重要性
  • 第3节: 数据好坏的度量
  • 32:【视频】数据好坏的度量
  • 第4节: 指令数据的筛选与配比
  • 33:【视频】基于指令质量的筛选
  • 34:【视频】数据类别划分与配比
  • 35:【视频】数据复杂度分析
  • 第5节: 指令数据的扩充
  • 36:【视频】指令数据的扩充
  • 第6节: 指令数据优化案例
  • 37:【视频】LIMA
  • 38:【视频】基于InsTag分类的指令数据多样化优化
  • 39:【视频】Instruction-Following Difficulty
  • 40:【视频】MoDS: Model-oriented Data Selection
  • 41:【视频】指令进化
  • 第7节: 数学推理指令与思维链
  • 42:【视频】 数学推理指令与思维链
  • 第4章: 大模型微调理论
  • 第1节: 指令微调回顾
  • 第2节: 指令微调方法:全量微调
  • 第3节: 并行训练技术:DeepSpeed
  • 第4节: 减少内存使用技术:Flash Attention
  • 第5节: 指令微调方法:高效指令微调
  • 第6节: 混合的方法:MAM Adapter
  • 第7节: 小结
  • 第5章: 微调实践
  • 第1节: 文本摘要与实践项目目标
  • 第2节: 源码获取及微调环境配置
  • 第3节: 基座模型下载
  • 第4节: 指令数据准备
  • 第5节: 指令微调训练
  • 第6节: 模型的使用与推理
  • 第7节: 摘要模型结果评估
  • 第6章: 微调后的模型评估
  • 第1节: 语音模型通用能力评估
  • 第2节: 评测集梳理
  • 第3节: 语言模型专项能力评估
  • 第4节: Bad case定位、问题分析及解决方法
  • 第7章: 模型部署理论
  • 第1节: 大模型高效部署
  • 第2节: 主流部署框架介绍
  • 第3节: Text Generation Inference 详解
  • 第4节: TGI整体推理流程

大模型文本摘要生成技术实践
本项目旨在利用大语言模型实现文本摘要生成技术,帮助用户从大量信息中提取关键内容。学员将学习如何构建和微调一个能够自动生成高质量文本摘要的大模型,从而在新闻报道、学术论文、法律文件等不同领域中实现高效的信息获取。
大模型工具调用技术实践
本项目聚焦于大模型在工具调用中的应用,旨在开发一个能够根据自然语言指令自动调用特定工具或API的大模型系统。通过本项目,学员将学习如何构建一个能理解复杂指令并执行相应操作的智能助手,提升自动化任务处理的能力。

相关推荐

自然语言处理 大模型 基础
模型压缩与部署 模型压缩与部署 基础
模型压缩与部署 模型压缩与部署 进阶

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》

请完善资料,让我们更好的为您服务!

+86  (手机号已绑定)

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》