DuckDB
– 终极指南
掌握DuckDB:未来的分析数据库。7个实践项目+理论,精通DuckDB Python、Streamlit、CLI和Docker
学习内容:
构建并实施使用 DuckDB 作为数据库的分析解决方案
了解使 DuckDB 在任何机器上如此快速的底层原理(理论)
学习在 Python 环境中使用 DuckDB(实践)
学习从 CLI(命令行)环境使用 DuckDB(实践)
使用 DuckDB 作为 Streamlit Python 分析应用程序的后端数据库(实践)
将 DuckDB 与 dbt(数据构建工具)结合简化分析数据仓库开发(实践)
学习在 MotherDuck 中工作:DuckDB 的云原生环境(SaaS)(实践)
了解 DuckDB 与其他数据库的不同之处:分析数据库(Clickhouse、Redshift、Cassandra)和 OLTP 数据库(PostgreSQL、SQLITE)
课程内容主题:
DuckDB 引入
环境设置与演示
CLI 使用:DuckDB 的 SQL 创新
DuckDB Python
Streamlit + DuckDB
DuckDB + DBT
MotherDuck:DuckDB 的云原生环境(SaaS)
Rill:基于 DuckDB 的 BI-as-Code 平台
DuckDB 在复杂数据管道中的应用
课程要求:
基本 SQL 有帮助,但不是必需的(课程提供指南)
Python 基础
笔记本电脑或台式电脑
课程详细描述:
**为什么学习 DuckDB?**
1. **过去 2 年搜索量增长 306%**:其受欢迎程度正在迅速增长!
2. **数据湖和大数据基础设施并非所有数据问题的最佳解决方案**:DuckDB 提供与 PostgreSQL 类似的数据库,但具有强大的分析能力,本地运行无需复杂配置。
3. **100% 免费且支持多种集成**:可与 Python、dbt、Streamlit、S3、WASM、Docker 等集成,支持多种数据导出格式(CSV、Parquet、JSON)。
4. **易于使用**:无需为每个开发人员部署 PostgreSQL/MariaDB,可快速生成内存实例;支持从互联网获取数据(通过 DuckDB Httpfs)。
5. **本地大数据分析**:可高效处理大型数据集,支持类似电子表格的表格创建(Pivot 功能)。
6. **比 SQLite 更易学习**:在聚合查询和过滤查询场景下表现更优,课程将对比 DuckDB 与 SQLite、Clickhouse 的差异。
7. **比 Pandas 快 300% 以上**:DuckDB 可处理内存外数据集,利用多核 CPU,通过 SQL 语言实现高性能分析。
**课程内容亮点**:
– 视频讲座(含交互式注释)
– 实践案例大纲 PDF
– 演示资源与完整代码库
– 终身访问权限及未来更新
– 课程结业证书与 30 天退款保证
**课程更新记录**:
– 2025年10月:更新 MotherDuck 部分,新增 UI 概览、AI 功能解析及“自动更新共享”功能
– 2025年9月:重构 DuckDB + DBT 部分,替换因 API 停用的实践案例
– 2025年8月:更新 DuckDB + Rill(仪表板)部分
– 2024年6月:新增“DuckDB 在数据管道中的应用”章节,解析其作为“数据转换器”的角色
– 2024年5月:MotherDuck 部分新增 AI 功能探索
**适合人群**:
– 想要掌握现代本地数据仓库并加速分析解决方案开发的开发人员与数据工程师
– 希望提升技能、学习嵌入式分析数据库使用的数据分析师与数据科学家
– 欲提升数据库与数据建模能力的数据从业者与爱好者
– 计划成为数据科学家、BI 分析师、数据工程师或数据分析师的人群




