课程价格 :
¥599.00
剩余名额
0
-
学习时长
5周/建议每周至少6小时
-
答疑服务
专属微信答疑群/讲师助教均参与
-
作业批改
每章节设计作业/助教及时批改评优
-
课程有效期
一年/告别拖延,温故知新
- 1:【课件】开课仪式
- 第1章: 语音识别综述
- 2-1:【课件】第一章语音识别综述
- 2-2:【补充】课件中的视频/音频
- 3:【视频】语音识别任务介绍
- 第1节: 什么是语音
- 4:【视频】什么是语音
- 第2节: 语音识别的挑战
- 5:【视频】语音识别的挑战
- 第3节: 语音识别框架
- 6:【视频】语音识别框架
- 第2章: 语音信号处理与特征提取
- 7-1:【课件】语音信号处理与特征提取
- 7-2:【补充】课件中的动图
- 8:【视频】章节内容引入
- 第1节: 数字信号处理基础
- 9:【视频】数字信号处理基础
- 第2节: 常用特征提取
- 10:【视频】FBank特征提取
- 第3节: Torchaudio介绍与使用
- 11:【视频】TorchAudio介绍与使用
- 第4节: Project I 语音特征提取
- 12-1:【附件】Project1 FBank语音特征提取
- 12-2:Project1 语音特征提取
- 12-3:【作业】Project 1 FBank语音特征提取
- 12-4:【作业思路】Project 1
- 第3章: 端到端语音识别基础知识
- 13-1:【课件】端到端语音识别基础知识
- 13-2:【补充】课件中的动图
- 第1节: 章节内容引入
- 14:【视频】本章内容介绍
- 第2节: Transformer中的Attention与multi-head attention
- 15-1:【视频】自注意力与交叉注意力
- 15-2:【视频】多头注意力
- 15-3:【视频】自注意力的缺陷与位置编码
- 第3节: 自回归解码
- 16:【视频】自回归解码
- 第4节: Transducer基础
- 17:【视频】Transducer基础:CTC与RNNT
- 第5节: Speech-transformer
- 18-1:speech-transformer
- 18-2:【视频】speech transformer的框架及代码
- 第6节: 小结
- 19:【视频】小结
- 第7节: Project II 特征提取器Transformer在语音中的应用
- 20-1:【附件】Project2 Speech-Transformer
- 20-2:【作业说明】Project 2 实践作业说明
- 20-3:【作业】Project2 Speech-Transformer
- 20-4:【作业思路】第三章
- 第4章: FunASR理论、前沿与实战
- 21:第4章FunASR理论、前沿与实战
- 第1节: FunASR与魔搭社区介绍
- 22:【视频】FunASR介绍
- 第2节: FunASR模型原理与前沿探索
- 23-1:【视频】paraformer模型讲解
- 23-2:【视频】基于paraformer的热词定制化
- 23-3:【视频】时间戳预测模型
- 24:【视频】语言模型与大语言模型的结合
- 第3节: 如何使用FunASR:推理与微调
- 25-1:【视频】FunASR主要模型的推理
- 25-2:【视频】FunASR中的Automodel
- 第4节: 本章小结
- 26:【视频】本章小结
- 第5节: FunASR实战:Python推理与微调
- 27:【视频】课程作业
- 第6节: Project III FunASR热词模型推理优化实战
- 28-1:【作业】FunASR热词模型推理优化实战
- 28-2:第四章作业思路提示
- 第5章: FunASR服务部署
- 29:【课件】FunASR服务部署
- 第1节: FunASR服务部署介绍
- 30:【视频】FunASR服务部署介绍
- 第2节: 离线文件撰写
- 31:【视频】离线文件撰写
- 第3节: 实时语音撰写
- 32:【视频】实时语音撰写