数据科学入门 – Python、Azure ML 和 Tableau
实用数据科学:使用 Python、Tableau 和 Azure ML 进行机器学习、人工智能、云和数据分析及真实项目
学习内容:
* 动手学习 Python 中的数据分析和操作
* 理解并应用关键统计概念
* 使用 Matplotlib 和 Seaborn 进行数据可视化以提取见解
* 使用 Python 和 Azure 机器学习工作室开发和评估机器学习模型
* 具有云计算和自然语言处理经验
* 使用 Tableau 创建交互式仪表板并可视化数据洞察
课程内容主题:
* 课程介绍
* Python 在数据科学中的基础
* 数据科学统计学基础
* 使用 Pandas 进行数据处理
* 使用 ChatGPT 作为数据科学助手
* Python 数据可视化
* 机器学习基础
* 加州住房数据分析和建模项目
* 数据科学中的假设检验
* Azure ML 贷款审批分类模型项目
* 客户流失分析与预测项目
* Tableau 交互式仪表板开发
课程要求:
* 本课程没有任何先决条件 – 它是为初学者设计的
* 你所需要的只是一台电脑、一个互联网连接和学习意愿
课程详细描述:
* **Python 编程基础**:从变量、数据类型、函数和控制流等基本编程概念入手,掌握 Python 在数据科学中的应用。
* **使用 Pandas 进行数据清理和分析**:学习导入、探索和转换数据的技术,为建模做好准备。
* **数据科学统计学**:学习集中趋势度量(平均值、中位数、众数)、变异度量(标准差、方差)和假设检验等关键统计概念。
* **数据可视化**:使用 Matplotlib 和 Seaborn 创建线图、散点图、条形图、热图等,清晰传达数据见解。
* **使用 Tableau 进行交互式数据可视化**:连接数据源、构建图表、创建计算字段,并开发银行客户流失仪表板。
* **真实项目实践**:
* **加州住房数据分析**:通过数据清洗、特征工程和回归模型预测房价,评估模型性能。
* **Azure ML 贷款审批模型**:使用 Azure ML 创建、部署和测试分类模型,掌握数据拆分、准确率、召回率等评估指标。
* **客户流失分析与预测**:分析客户数据,构建预测模型,评估模型性能以应对客户保留挑战。
* **机器学习与云计算**:学习线性回归、随机森林等模型,并通过 Azure ML 掌握云环境中的模型构建与部署。
* **使用 ChatGPT 作为数据科学助手**:利用 AI 提高生产力,起草数据查询并集思广益。
* **测试与练习**:通过测验和编码挑战巩固 Python、数据分析和机器学习知识。
本课程适合对数据科学感兴趣的初学者、学生、转行者及非技术背景的专业人士,帮助他们掌握 Python 编程、数据分析、统计、机器学习和云计算的核心技能,并通过真实项目获得实践经验。





