课程描述
Writing production-ready ETL pipelines in Python / Pandas 是课程的名称,它将展示使用 Python 3.9、Jupyter Notebook、Git 和 Github、Visual Studio 等必要工具从头开始到生产用 Python 编写 ETL 管道的每个步骤Code、Docker 和 Docker Hub 以及 Python 包 Pandas、boto3、pyyaml、awscli、jupyter、pylint、moto、coverage 和 memory-profiler。介绍并应用了两种不同的数据工程领域编码方法——函数式编程和面向对象编程。
介绍并应用了开发 Python 代码的最佳实践,包括设计原则、干净的编码、虚拟环境、项目/文件夹设置、配置、日志记录、异常处理、linting、依赖管理、性能分析、单元测试、集成测试和 dockerization .
您将在本课程中学到什么:
- 如何用 Python 编写专业的 ETL 管道。
- 编写生产级 Python 代码的步骤。
- 如何在数据工程中应用函数式编程。
- 如何进行适当的面向对象代码设计。
- 如何使用元文件进行作业控制。
- ETL/数据工程中 Python 的编码最佳实践。
- 如何在 Python 中实现管道,从 AWS S3 源提取数据,将数据转换并加载到另一个 AWS S3 目标。
本课程适合谁:
- 希望使用 Python 编写专业的生产就绪数据管道的数据工程师、科学家和开发人员。
- 每个对使用 Python 编写可用于生产的数据管道感兴趣的人。
用 Python / Pandas 课程规范编写生产就绪的 ETL 管道:
- 出版商:乌迪米
- 讲师:扬·施瓦兹洛斯
- 英语语言
- 级别:所有级别
- 时长:7 小时 3 分钟
- 讲座:78
课程内容:
要求:
- 需要基本的 Python 和 Pandas 知识。
- 需要基本的 ETL 和 AWS S3 知识。
课程图片:
课程介绍视频:
媒体错误:格式不受支持或来源未找到
安装指南:
Extract之后,用你想要的播放器观看。
字幕:英语
画质:720p
下载链接:
声明:本站所有文章,如无特殊说明或标注,均为本站发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。