课程描述

Writing production-ready ETL pipelines in Python / Pandas 是课程的名称,它将展示使用 Python 3.9、Jupyter Notebook、Git 和 Github、Visual Studio 等必要工具从头开始到生产用 Python 编写 ETL 管道的每个步骤Code、Docker 和 Docker Hub 以及 Python 包 Pandas、boto3、pyyaml、awscli、jupyter、pylint、moto、coverage 和 memory-profiler。介绍并应用了两种不同的数据工程领域编码方法——函数式编程和面向对象编程。
介绍并应用了开发 Python 代码的最佳实践,包括设计原则、干净的编码、虚拟环境、项目/文件夹设置、配置、日志记录、异常处理、linting、依赖管理、性能分析、单元测试、集成测试和 dockerization .

您将在本课程中学到什么:

  • 如何用 Python 编写专业的 ETL 管道。
  • 编写生产级 Python 代码的步骤。
  • 如何在数据工程中应用函数式编程。
  • 如何进行适当的面向对象代码设计。
  • 如何使用元文件进行作业控制。
  • ETL/数据工程中 Python 的编码最佳实践。
  • 如何在 Python 中实现管道,从 AWS S3 源提取数据,将数据转换并加载到另一个 AWS S3 目标。

本课程适合谁:

  • 希望使用 Python 编写专业的生产就绪数据管道的数据工程师、科学家和开发人员。
  • 每个对使用 Python 编写可用于生产的数据管道感兴趣的人。

用 Python / Pandas 课程规范编写生产就绪的 ETL 管道:

  • 出版商:乌迪米
  • 讲师:扬·施瓦兹洛斯
  • 英语语言
  • 级别:所有级别
  • 时长:7 小时 3 分钟
  • 讲座:78

课程内容:

要求:

  • 需要基本的 Python 和 Pandas 知识。
  • 需要基本的 ETL 和 AWS S3 知识。

课程图片:

课程介绍视频:

媒体错误:格式不受支持或来源未找到

安装指南:

Extract之后,用你想要的播放器观看。
字幕:英语
画质:720p

下载链接:

发表回复

后才能评论

尊敬的用户,您好!由于部分培训机构和留学生的举报,近期导致网站大量链接暂时失效。对此给您带来的不便,我们深表歉意。任何链接失效的资源,欢迎您添加侧边栏二维码随时反馈,我们将在48小时内为您提供新的网盘链接。如果您对此不便感到不满,您也可在48小时内申请无理由退款。感谢您的理解与支持!

Windows播放器推荐:Potplayer Potplayer 是免费的 Windows 播放器,支持双字幕和自动翻译功能。以下是操作指南: 挂载字幕 加载中文字幕:右击选择 字幕 -> 字幕设置,取消“只匹配文件名字幕”选项。可调整字幕颜色、位置和大小。 双字幕设置:右击 字幕 -> 选择字幕 -> 次字幕输出,设置主字幕和次字幕。 自动翻译 若可访问 Google 翻译服务,选择 字幕 -> 实时字幕翻译,勾选 总是使用 和 Google Translate,即可实时翻译英文字幕。 Potplayer 让观看更智能,学习体验升级。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可联络站长解决。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源