GenAI模型的量化

解锁模型优化的力量,学习如何用Python提升GenAI模型效率

学习内容:

* 掌握模型优化技术:剪枝、知识蒸馏和量化
* 了解FP32、FP16、BFloat16和INT8等数据类型的基础知识
* 掌握从FP32到BF16以及从FP32到INT8的向下转换方法
* 理解对称量化和非对称量化之间的区别
* 通过真实示例在Python中实现量化技术
* 应用量化使模型更高效、更易于部署
* 获得优化边缘设备和资源受限环境模型的实用技能

课程内容主题:

* 大型语言模型(LLM)
* 数据科学
* 开发

课程要求:

* 建议具备基础Python知识,无需任何AI经验

课程详细描述:

* 本课程适合希望优化和部署高效AI模型的开发者、数据科学家和机器学习爱好者。
* 学习如何通过量化技术使模型更快速、更节省资源,同时保持性能。
* 掌握FP32到BF16和INT8的转换方法,实现模型压缩。
* 实现对称和非对称量化技术,应用于实际场景。
* 学习将模型参数从FP32降至INT8,适配移动和物联网设备。
* 量化技术能显著减少模型大小和计算负荷,适用于智能手机、物联网设备等资源受限环境。
* 课程结合理论与实践,帮助学员在边缘设备上高效部署模型。
* 课程内容涵盖量化、剪枝、知识蒸馏等核心概念,适合初学者和AI专业人士。

B站免费课程

更多 软件编程 教程

发表回复

后才能评论

尊敬的用户,您好!由于部分培训机构和留学生的举报,近期导致网站大量链接暂时失效。对此给您带来的不便,我们深表歉意。任何链接失效的资源,欢迎您添加侧边栏二维码随时反馈,我们将在48小时内为您提供新的网盘链接。如果您对此不便感到不满,您也可在48小时内申请无理由退款。感谢您的理解与支持!

Windows播放器推荐:Potplayer Potplayer 是免费的 Windows 播放器,支持双字幕和自动翻译功能。以下是操作指南: 挂载字幕 加载中文字幕:右击选择 字幕 -> 字幕设置,取消“只匹配文件名字幕”选项。可调整字幕颜色、位置和大小。 双字幕设置:右击 字幕 -> 选择字幕 -> 次字幕输出,设置主字幕和次字幕。 自动翻译 若可访问 Google 翻译服务,选择 字幕 -> 实时字幕翻译,勾选 总是使用 和 Google Translate,即可实时翻译英文字幕。 Potplayer 让观看更智能,学习体验升级。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可联络站长解决。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源