首页 科技快讯 华为打得过英特尔和英伟达GPU缩水版,关键看昇腾910B带宽和内存

华为打得过英特尔和英伟达GPU缩水版,关键看昇腾910B带宽和内存

来源:晰数塔互联网快讯 时间:2024年04月18日 06:05

上周,Meta、谷歌与英特尔几乎同时官宣了下一代AI芯片。与前两家主要用于自己的算力基础设施不同,英特尔主要面向客户出售最新的Gaudi 3,当然也包括中国客户。

在最近公布的Gaudi 3白皮书中,英特尔遮遮掩掩地介绍了中国独享的两款芯片型号:更适用于数据中心或高性能计算环境的HL-328,以及更泛用的HL-388。两者的热设计功率(TDP)都是450W,低于同类其他款型,预示着算力性能的下降。

标注PRC的为满足出口中国的政策的型号;OAM为更适用于数据中心的型号;TDP为热设计功率,HBM为高带宽存储器,容量大小均为128GB,带宽均为3.7TB/s,缓存均为96MB。

美国曾多次明令要求英伟达、英特尔与AMD等芯片巨头,限制对华销售的AI芯片的性能,最重要的标准之一,就是总处理性能(TPP)不得高于4800。在这个限制条件下,中国版的Gaudi 3在BF16精度下可能只有148 TFLOPS的性能,基本与H20处于同一水平。在算力指标上,两者几乎与标准版相比都缩水了90%左右。

中国版的Gaudi 3可能与标准版一样,仍然是2个晶片(die)相连的形式。这有助于降低性能密度(PD)的指标,满足美国去年底更新的限制政策。

但英特尔尚未官方确认这几点。市场要到今年6月与9月才能先后拿到这两款中国版的芯片。在此之前,对英特尔如何采取了哪些手段来降低算力性能,只能归于猜测。一种猜测是大幅削减内核数量,另一种猜测则是降低时钟频率。Semianalysis曾在分析H20如何“缩水”的时候分析过,前一种方式是硬件阉割,很难恢复,后一种则有办法破解,并暗示美国政府要好好查查,英伟达到底怎么做的。最近就有消费级显卡RTX 4090 D超频突破限制的传言。

不过,在白皮书中,中国独享版的芯片在高带宽存储器(HBM)的容量与带宽,缓存,以及互联与扩展等指标上都没有缩水。

AI加速并不只是一个算力问题,它越来越是一个内存问题。更高的内存与带宽,能够提高多卡互联环境中的实际利用率(MFU)。还是Semianalysis,它在分析H20如何“缩水”的时候又暗示了,如果一款芯片已经因为内存墙问题,实际效率降得很低,那么用相同的内存去处理更低的算力,实际效率反而提升了,这就会导致整体性能的下降,并没有算力指标下降来得那么严重。卡间互联与服务器互联的速率指标,则会影响到计算集群规模的扩展性。

无论是英伟达、英特尔还是AMD,它们都是追求盈利的企业,希望从中国市场获取利润,会想方设法满足中国客户的需求,至少在部分指标上仍保留对国产替代的优势。它们仍有牢固的生态优势,还开始打起了价格战,甚至通过媒体“哭穷”:每生产一块H20,就意味着少生产一块H100;HBM没有下降,又在物料成本中占了相当比重。

此前,英伟达在禁令后,将A100与H100缩水成算力略低,带宽略低的A800与H800,马上遭到美国的封堵;此后,又基于H200缩水成算力大幅降低,内存和带宽与互联略微降低的H20。事实上,在内存容量与带宽等指标上,H20相对H100反而有了提升。

它与华为的昇腾910B走了差异化竞争的路线,后者拥有更高的算力,但市场期望国产芯片中能诞生一款在内存容量与带宽,以及卡间互联与服务器间互联上有进一步提升的AI芯片。

低算力+高内存/互联,仍然可以通过构建大规模计算集群的方式,满足较高参数规模的大模型的训练、微调与推理,就是有点贵;对于高算力+低内存/互联的芯片来说,构建稳定高效的大规模计算集群会有一点工程挑战,在相对较小的垂类大模型的训练与推理上更有性价比。

Gaudi3的中国专享版走的也是低算力、高内存、高互联的路子,只不过内存与H20相比存在代差。市场对Gaudi3抢走英伟达的市场并不乐观,它的中国专享版同样如此。英伟达的H20已经在今年一季度小批量交付,预计在二季度大批量交付。投行KeyBanc资本调研了供应链客户称,H20的出货量“远高于预期”,有望在今年创收超过90亿美元。

目前,还没有针对英伟达最新的B200的中国版的消息。AMD最新的MI300的缩水版,据传称为MI309,已经被美国打了回去,嫌它还不够弱。

如果这一代的中国特供版AI芯片仍是H20占据主流,那么英伟达在中国的好日子将在2025年之后临近终点。Semianalysis在分析H20的竞争力的时候表示,中国自研HBM开始出样,华为AI芯片的产能也在爬升。

我们是不是该担心一下,美国到时候会放松一下限制出口的门槛,用性价比更高的B20冲击一下中国的国产替代市场。

发布于:上海

相关推荐

华为打得过英特尔和英伟达GPU缩水版,关键看昇腾910B带宽和内存
百度向华为订购1600片昇腾910B AI芯片 60%订单已交付
传英伟达阉割版AI芯片H20开始预售:性能不如华为,价格却更高!
AI芯片大战背后:英特尔对英伟达虎视眈眈,国内芯片公司蠢蠢欲动
阻击华为!NVIDIA三款中国特供AI GPU来了:精准缩水 美国没话说
周鸿祎:360采购了1000片华为昇腾AI芯片、比百度还早!
特供芯片来了,加价!
AI“芯”突围:英特尔Gaudi 3硬刚英伟达
算力重回市场中心?华为昇腾引发国产AI算力热潮,概念股盘点!
“逃离”英伟达

网址: 华为打得过英特尔和英伟达GPU缩水版,关键看昇腾910B带宽和内存 http://www.xishuta.com/newsview115586.html

所属分类:行业热点

推荐科技快讯