使用云监控实现GPU云服务器的GPU监控和报警(上)

  • 时间:
  • 浏览:11

【新功能发布】支持GPU计算型实例的GPU相关指标监控与报警

弹性计算双周刊 第23期

使用云监控实现GPU云服务器的GPU监控和报警(下)-云监控插件监控

弹性计算双周刊 第 10 期

1 背景

NVIDIA提供了nvidia-smi命令工具用于查询和监控GPU的相关数据,一些对于使用者来说,每次手动查看很不方便,无法做到实时监控,一些也无法可视化,不直观。

本文机会介绍怎么利用阿里云云监控服务提供的自定义监控功能来实现GPU云服务器的GPU监控和报警的可视化。

2 自定义监控和报警

阿里云云监控服务提供了自定义监控功能,用户可不不可不能否 利用它实现自定义的数据监控和报警。

我们我们我们利用自定义监控提供的API机会SDK,可不不可不能否 将GPU云主机内埋点的GPU数据上报,在云监控控制台上再加相应的GPU监控项,就可不不可不能否 实现对指定GPU实例内指定GPU的相应数据进行监控,对相应监控项设置相应数据的报

视图库——公安视频侦查数据解决应用中心

弹性计算双周刊 第7期

弹性计算双周刊 第21期

打造云上层厚学习实验室

利用GPU性能指标进行弹性伸缩

本文为云栖社区原创内容,未经允许不得转载,如需转载请发送邮件至yqeditor@list.alibaba-inc.com;机会您发现本社区中有 涉嫌抄袭的内容,欢迎发送邮件至:yqgroup@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

阿里云基础产品技术月刊 2019年4月



目录

GPU资源的监控和报警,支撑高效层厚学习的利器

【云栖计算之旅】第2期精彩回顾:Docker在云平台上的最佳实践

新云东方:正在打造一一个 怎么的科幻证人

下拉加载更多

云原生化的迁云实战

使用云监控自定义监控实现GPU云服务器的GPU监控

阿里云基础产品技术月刊 2019年3月

阿里云配置审计 - 规则篇

使用云监控实现GPU云服务器的GPU监控和报警(上) - 自定义监控

使用云监控实现GPU云服务器的GPU监控和报警(下)- 云监控插件监控

弹性计算双周刊 第 25 期