Azure Data Factory For Data Engineers – Project on Covid19

面向数据工程师的 Azure 数据工厂 – Covid19 上的项目

教程演示🔗

你会学到什么

  • 您将了解如何在 Azure 数据工厂 (ADF) 中构建真实世界的数据管道。
  • 您将使用 Azure 数据工厂 (ADF)、Azure Data Lake Storage Gen2、Azure SQL 数据库和 Azure Monitor 在 Azure 中获得良好的数据工程技能
  • 您将学习如何使用 Azure 数据工厂 (ADF) 将数据从 HTTP 和 Azure Blob 存储等来源提取到 Azure Data Lake Gen2
  • 您将学习如何使用 Azure 数据工厂 (ADF) 中的数据流转换数据并加载到 Azure Data Lake Storage Gen2
  • 您将学习如何使用 Azure 数据工厂 (ADF) 中的 Databricks 笔记本活动转换数据并加载到 Azure Data Lake Storage Gen2
  • 您将了解如何使用 Azure 数据工厂 (ADF) 中的 Azure HDInsight 活动转换数据并加载到 Azure Data Lake Storage Gen2
  • 您将了解如何使用 Azure 数据工厂 (ADF) 将转换后的数据从 Azure Data Lake Storage Gen2 加载到 Azure SQL 数据库
  • 您将广泛了解 Azure 数据工厂 (ADF) 中的触发器以及如何使用它们来安排数据管道。
  • 您将学习如何通过实际项目使用 Azure 数据工厂 (ADF)、Azure Monitor 和 Log Analytics 来监控管道。
  • 您将学习如何构建生产就绪的管道以及良好实践和命名标准
  • 您将学习 Azure 数据工厂所需的主题,以通过 Azure 数据工程师助理认证考试 DP203
  • 您将了解如何在 Azure Devops 中创建 CI/CD 管道以将 ADF 管道发布到更高的环境(测试/生产)

要求

  • 对云计算的基本了解会很有用,但不是必需的。
  • 不需要 Azure 经验,我将带您完成学习本课程和构建项目所需的一切
  • 需要一个 Azure 帐户,如果您没有,我们将在课程中创建一个免费帐户

描述

自推出以来课程的重大更新

2023 年 1 月 – 更新第 3 节(环境设置)以反映对用户界面的更改。重新录制了 5 节课。

2022 年 11 月 – 增加第 15 和 16 节,重点关注持续集成和持续交付 (CI/CD)

欢迎!

我期待着帮助您学习云中最受欢迎的数据工程工具之一,Azure 数据工厂 (ADF)!本课程讲授了使用 Azure 数据工厂 (ADF) 实施数据工程解决方案,以解决报告 Covid-19 趋势和预测该病毒传播的现实问题。

这与 Udemy 中针对 Azure 数据工厂或数据工程技术的其他课程不同。完成包括所有作业在内的课程后,我坚信您将能够自己开始一个真实世界的数据工程项目,并且精通 Azure 数据工厂 (ADF)。

我还提供了有关存储解决方案的课程,例如 Azure Data Lake Storage、Azure Blob Storage、Azure SQL Database 等。此外,还有有关 Azure HDInsight 和 Azure Databricks 的课程。我什至包括了关于使用 Power BI 对 Azure 数据工厂数据管道处理的数据构建报告的课程。我认为机器学习模型超出了范围。您可以使用此数据来构建自己的模型并预测传播。

该课程遵循现实世界项目实施的逻辑进展,其中解释了技术概念并同时构建了 Azure 数据工厂 (ADF) 中的数据管道。尽管本课程并不是专门为教您通过 Azure 数据工程师助理认证考试 DP203 所需的技能而设计的,但它可以极大地帮助您获得考试所需的大部分必要技能。

我和我一样珍惜你的时间。因此,我将这门课程设计得快节奏、切题。此外,该课程以简单的英语授课,没有行话。我从基础开始课程,到课程结束时,您将精通所使用的技术。

目前课程教你以下内容

Azure 数据工厂

  • 使用 Azure 数据工厂 (ADF)、Azure Data Lake Gen2、Azure Blob 存储、Azure SQL 数据库、Azure Databricks、Azure HDInsight 和 Microsoft PowerBI 等 Azure 数据工程技术为数据工程解决方案构建解决方案架构。
  • 使用 Azure 数据工厂集成来自 HTTP 客户端、Azure Blob 存储和 Azure Data Lake Gen2 的数据。
  • 使用获取元数据等控制流活动在 Azure 数据工厂 (ADF) 管道中分支和链接活动。If Condition、ForEach、Delete、Validation 等
  • 使用管道、数据集和 LinkedServices 中的参数和变量在 Azure 数据工厂 (ADF) 中创建元数据驱动的管道
  • 调试数据管道并解决问题。
  • 使用 Azure 数据工厂 (ADF) 中的事件触发器、计划触发器和翻转窗口触发器等触发器来安排管道
  • 创建映射数据流以创建转换逻辑。该课程涵盖所有转换步骤,例如源、过滤器、选择、数据透视、查找、条件拆分、派生列、聚合、连接和接收器转换。
  • 调试数据流、调查问题、修复故障等
  • 实施 Azure 数据工厂管道以调用映射数据流并执行它们。
  • 创建 ADF 管道以执行 HDInsight 活动并执行数据转换。
  • 创建 ADF 管道以执行 Databricks Notebook 活动以执行转换。
  • 在管道之间创建依赖关系以编排数据流
  • 在触发器之间创建依赖关系以编排数据流
  • 监视数据管道、创建警报、从 Azure 数据工厂监视器报告指标。
  • 使用 Azure Monitor 监视数据工厂管道并设置要转发到 Azure 存储帐户或 Log Analytics Workspace 的诊断设置。
  • 创建 Log Analytics 工作区,从 Azure 数据工厂管道上的日志分析创建工作簿和图表
  • 实施 Azure 数据工厂分析监控工具以及如何进一步扩展该功能。

Azure 存储解决方案

  • 创建 Azure 存储帐户、创建容器、上传数据、访问控制 (IAM)、使用 Azure 存储资源管理器与存储帐户交互
  • 创建 Azure Data Lake Gen2、创建容器、上传数据、访问控制 (IAM)、使用 Azure 存储资源管理器与存储帐户交互
  • 创建 Azure SQL 数据库、定价层、创建管理员用户、创建表、加载数据和查询数据库。

Azure HDInsight 和数据块

  • 创建 HDInsight 集群、与 UI 交互、使用 Ambari、创建 Hive 表、从 Azure 数据工厂调用 HDInsight 活动
  • 创建 Azure Databricks 工作区、创建 Databricks 集群、安装存储帐户、创建 Databricks 笔记本、使用 Databricks 笔记本执行转换、从 Azure 数据工厂调用 Databricks 笔记本。

Azure 开发运维 (CI/CD)

  • 创建 Azure Devops 环境并配置 Azure Devops Git 存储库
  • 用于将 Azure 数据工厂工件发布到更高环境的 CI/CD 过程
  • 在 Azure Devops 中创建构建和发布管道以将代码发布到更高的环境(测试/生产)
  • 配置/参数化 CI/CD 管道以发布访问 Azure Data Lake Storage 的 ADF 管道。

本课程适合谁:

  • 寻找数据工程职业的大学生
  • 从事其他学科的 IT 开发人员试图转向数据工程
  • 当前从事本地技术或其他云平台(如 AWS 或 GCP)并希望学习 Azure 技术的数据工程师/数据仓库开发人员
  • 希望了解 Azure 数据工程堆栈的数据架构师
  • 希望将知识扩展到数据工程的数据科学家

B 站免费课程:更多免费教程

更多 devops 教程:更多 devops 教程

发表回复

后才能评论

尊敬的用户,您好!由于部分培训机构和留学生的举报,近期导致网站大量链接暂时失效。对此给您带来的不便,我们深表歉意。任何链接失效的资源,欢迎您添加侧边栏二维码随时反馈,我们将在48小时内为您提供新的网盘链接。如果您对此不便感到不满,您也可在48小时内申请无理由退款。感谢您的理解与支持!

Windows播放器推荐:Potplayer Potplayer 是免费的 Windows 播放器,支持双字幕和自动翻译功能。以下是操作指南: 挂载字幕 加载中文字幕:右击选择 字幕 -> 字幕设置,取消“只匹配文件名字幕”选项。可调整字幕颜色、位置和大小。 双字幕设置:右击 字幕 -> 选择字幕 -> 次字幕输出,设置主字幕和次字幕。 自动翻译 若可访问 Google 翻译服务,选择 字幕 -> 实时字幕翻译,勾选 总是使用 和 Google Translate,即可实时翻译英文字幕。 Potplayer 让观看更智能,学习体验升级。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可联络站长解决。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源