Azure Databricks 与 Spark 数据工程实战课程
基于 Formula1 项目构建的全流程 Azure 数据工程项目实战课
学习内容:
- 使用 Azure Databricks 和 Spark Core 构建真实世界数据工程项目
- 掌握 PySpark 与 Spark SQL 进行数据处理与分析
- 理解并实施 Lakehouse 架构与 Delta Lake 数据湖管理
- 配置 Azure Databricks:集群、笔记本、作业、集群池等
- 使用 Azure Data Lake Gen2 进行数据存储与挂载
- 使用 Azure Data Factory 编排管道,实现调度与触发机制
- 连接 Power BI 创建动态仪表盘展示分析结果
- 掌握 Unity Catalog,实现数据治理、权限控制、审计与血缘追踪
- 支持 Azure 数据工程师认证(DP-203)和 Databricks 数据工程师认证准备
本课程包括
- 20 小时随选视频
- 6 篇文章资料
- 21 个可下载资源
- 支持移动设备与电视访问
- 课程完成证书
价格:$79.99
教程评分:4.6 / 5(22,096 条评价)
教程语言:英文
教程字幕:中英文字幕
课程要求:
- 具备基础的 Python 编程经验
- 具备基础 SQL 知识
- 了解云计算基础知识者优先(非必需)
- 需拥有 Azure 订阅(课程中可创建免费账户)
课程描述:
本课程通过 Formula1 赛车数据分析项目,带你深入实践 Azure Databricks 与 Spark 在数据工程中的真实应用。课程从 Azure 门户、Databricks 服务创建、数据湖挂载,到 Delta Lake 架构实现、Data Factory 流程编排、Power BI 可视化、Unity Catalog 数据治理,构建完整的云端数据工程解决方案。
你将掌握 PySpark 和 Spark SQL 的数据处理技能,实现数据的摄取、转换、聚合、窗口函数及增量加载模式,同时深入学习 Unity Catalog 所提供的数据发现、审计、血缘追踪与权限控制能力。
课程采用实战驱动方式,循序渐进地完成完整的数据平台构建,是迈向 Azure 数据工程师与云原生数据开发岗位的理想学习路径。
声明:本站所有文章,如无特殊说明或标注,均为本站发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。