英伟达开发GPU定位技术?官方回应!

用于监测整个GPU的运行状况和库存。
作者 | ZeR0
编辑 | 漠影
芯东西12月11日报道,今日,英伟达宣布正在开发用于可视化和监测GPU集群的软件解决方案,并再度强调:“NVIDIA GPU没有硬件跟踪技术、终止开关和后门。”
此前据外媒报道,英伟达已开发出位置验证技术,可显示其芯片在哪个国家运行。今日英伟达在一篇博客文章中提供了更多相关细节,包括计划将客户端软件智能体开源。
根据英伟达博客文章,这项新软件解决方案是为了确保AI数据中心保持最佳状态运行而设计,向云合作伙伴和企业提供洞察仪表板,可帮助数据中心运营商监测整个AI GPU集群运行状况,提高整个计算基础设施的GPU正常运行时间。
该功能将以软件选件的形式提供给用户安装,并利用GPU的“机密计算能力”。这项服务由客户选择、自行安装和控制,用于监测GPU使用情况、配置和错误。
通过这项服务,数据中心运营商将能够:
追踪功耗峰值,在不超出能耗预算的前提下最大化单位功耗性能。
监测整个集群的利用率、内存带宽和互连运行状况。
及早发现热点和气流问题,以避免过热降频和组件过早老化。
确认软件配置和设置一致,以确保结果可复现以及运行可靠。
发现错误和异常情况,及早发现故障部件。
这些功能可以帮助企业和云提供商可视化其GPU集群、解决系统瓶颈并优化生产力,从而提高投资回报。
此可选服务提供实时监测,让每个GPU系统与外部云服务通信和共享GPU指标。服务将配备客户端软件智能体,客户可安装该智能体,将节点级GPU遥测数据流式传输到托管在NVIDIA NGC的门户网站上。
客户可在仪表板中可视化其GPU集群利用率,既可以全局查看,也可以按计算区域(在同一物理或云位置注册的节点组)查看。

该客户端工具智能体也计划开源,以提供透明度和可审计性。它将提供一个实际示例,展示客户如何将英伟达工具整合到他们自己的GPU基础设施监测解决方案中。
这一软件能够帮助企业了解其GPU库存情况,但无法修改GPU配置或底层运行机制。它提供的是只读遥测数据,并由客户自行管理及自定义。
该服务还支持客户生成详细介绍GPU集群信息的报告。
另据外媒今日报道,英伟达周三透露,“没有功能允许英伟达远程控制或对已注册系统采取行动”,发送给英伟达服务器的遥测数据是“只读的”,这意味着该公司的服务器不能将数据写回芯片,“英伟达GPU内部没有允许英伟达或远程参与者禁用英伟达GPU的功能”。
该功能将首先在英伟达最新的Blackwell芯片上实现,英伟达也在研究前几代芯片的选择。
发布于:北京
相关推荐
英伟达开发GPU定位技术?官方回应!
GPU芯片变 “追踪器”?英伟达芯片定位功能引发隐私安全争议
英伟达称技术领先行业一代,回应谷歌芯片竞争
英伟达的未来,不只是GPU
英伟达称技术领先行业一代,回应谷歌TPU竞争
禁止第三方兼容CUDA?英伟达没想卡国产GPU的脖子
GPU泡沫将破?英伟达再创新高
一块GPU 1000%利润,谁炒高了英伟达H100?
英伟达GPU市场份额达到92%,远超AMD和英特尔
英伟达GPU,警钟敲响
网址: 英伟达开发GPU定位技术?官方回应! http://www.xishuta.com/newsview145349.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
