Datadog:性能监控工具(从零到英雄)
掌握APM与Datadog工具,构建高效监控系统
学习内容:
了解APM和Datadog工具使用的基本和高级概念。
掌握Datadog Agent的安装和配置,包括IIS集成。
学习Datadog APM服务监控、跟踪观察和错误跟踪,涵盖.NET Core API与SQL服务层监控。
掌握在.NET应用程序中使用Datadog自定义标签的方法。
使用时间序列、查询值、热门列表、表格、饼图、服务地图和看门狗等小部件创建仪表板。
为主机和服务创建警报/监视器,监控延迟、错误率、成功调用率及SQL查询持续时间。
通过创建Datadog SLO理解SLA、SLO、SLI和错误预算(DevOps)。
监控应用的可用性、可靠性、可扩展性和持续时间,分析最慢查询。
集成监视器与Slack和PagerDuty,实现合成监控与API/浏览器测试。
掌握日志管理(NLog使用)、Notebook问题分析及团队协作方法。
学习在Datadog中使用MongoDB设置和监控NodeJS应用(自定义指标与跟踪)。
课程内容主题:
Introduction(课程介绍与APM基础)
Datadog注册、定价与Agent安装
Datadog Agent配置与IIS集成
基础设施监控(主机地图与列表)
Metrics Explorer与指标类型分析
APM下载、安装与服务跟踪(火焰图、错误追踪、性能分析)
自定义标签与异常处理
仪表板创建与变量使用
警报/监视器配置(Slack/PagerDuty集成)
SLA/SLO/SLI与错误预算管理
合成监控与API/浏览器测试
日志管理与Notebook协作
NodeJS与MongoDB应用监控
课程要求:
几乎无需编程经验,仅需少量.NET或NodeJS编码技能(针对特定章节)。
课程详细描述:
本课程将帮助您从零开始构建完整的应用性能监控系统,涵盖Datadog工具的核心功能与高级用法。通过实践操作,您将学会:
1. **APM与监控基础**:理解应用性能管理(APM)的核心概念,掌握Datadog工具的注册、定价及Agent安装配置流程。
2. **基础设施监控**:利用Datadog监控主机资源,生成主机地图与基础设施列表,分析基础指标。
3. **APM深度实践**:部署APM监控.NET Core应用,追踪请求路径、分析错误日志、使用火焰图定位性能瓶颈,并通过自定义标签实现精细化监控。
4. **仪表板与可视化**:创建包含时间序列、查询值、热门列表等组件的仪表板,通过变量动态展示数据,优化监控视图。
5. **警报与通知**:配置主机和服务的警报规则,集成Slack和PagerDuty实现自动化通知,确保问题及时响应。
6. **SLA/SLO管理**:基于成功率指标创建SLO,关联日期与错误预算,提升DevOps运维效率。
7. **日志与协作**:使用NLog管理日志,通过Notebook分析问题并协同团队解决,提升故障排查效率。
8. **NodeJS与MongoDB监控**:在Datadog中部署NodeJS应用,结合MongoDB实现自定义指标与跟踪监控。
课程适合开发人员、DevOps工程师、SRE及IT管理者,帮助您提升应用性能、可靠性与安全性,满足现代系统高可用性、可扩展性及可观测性的需求。





