首页 科技快讯 天玑9500芯片问世,最有看点的不是跑分

天玑9500芯片问世,最有看点的不是跑分

来源:晰数塔互联网快讯 时间:2025年09月23日 10:37



全球智能手机市场经历两年下滑,在2024年一扫颓势,根据Canalys数据,出货量增长7%。今年上半年继续增长4%。

同时,CounterPoint Research发布报告称,600美元以上的高端机型上半年同比增速达到8%,创下历史新高[1]。

终端设备的竞争也是核心零部件的竞争,SoC厂商自然身处其中,扮演重要角色。叠加生成式AI带来的算力跃进,联发科凭借天玑系列芯片,稳稳地站上了出货量第一的位置。

今年9月,联发科推出AI算力翻倍的旗舰SoC天玑9500。在人工智能向终端设备渗透的加速周期,军备竞赛的第一枪就此打响。

架构的胜利

移动SoC的设计是个系统性工程。决定楼层高度的是地基,决定芯片能力上限的是底层架构。

如果把开发一颗芯片比作建造一座大楼,芯片架构设计就是建筑方案设计,根据“大楼”的定位和需求,确定楼层数、风格、电梯和楼梯布局。

天玑系列连续几代性能稳步提升的背后,是联发科对芯片架构大刀阔斧的改造过程。

2023年发布的天玑9300,用行业首发的全大核CPU架构完成了多核性能的逆袭。今年的天玑9500沿用“1+3+4”的第三代全大核架构,同时抛弃了Cortex-X4系超大核,全面转投性能更强的C1系列架构。

所谓“1+3+4”,指1个C1-Ultra,3个C1-Premium,均为最新一代C1系超大核,外加4个C1-Pro。

C1-Ultra作为“黑鹰”Cortex-X925的后一代,结合台积电第三代3nm制程,不仅让天玑系列首次迈入“4”开头时代——主频高达4.21GHz,同时还实现了IPC的两位数提升。

相比上代产品,天玑9500的单核性能提升32%,多核性能增加17%。



业内常用时钟频率和IPC(Instruction Per Clock)的乘积来衡量CPU的性能。简单来说,前者相当于单位时间搬砖的次数,后者相当于一次搬多少块砖。

理论上两者越大越好,但人干活会出汗,芯片计算会发热。高频需要更高的电压支持,代价是发热量和耗电量急剧增加。

天玑9500通过C1-Ultra更宽的指令流水线、更聪明的乱序执行和升级的预取技术,进一步实现了IPC的突破。更高的IPC,意味着更低频率的等效性能——在有限中尽可能创造无限,是芯片架构的魅力所在。

CPU架构以外,天玑9500的更大的亮点在于GPU和NPU性能双突破。

GPU采用最新一代Mali G1-Ultra MC12,凭借联发科与ARM联合研发的全新“Drage”架构,光追性能提升超过一倍,游戏画面的流畅性进一步提升。同时,能效比提升超过40%,有效延长手机续航。

而NPU方面,创新采用“超性能+超能效”的双NPU架构,算力较上一代直接翻倍,其中超能效NPU引入“存算一体”架构,通过减少数据搬运能耗和延迟,提升AI计算效率,实现轻负载AI模型Always-On运算,让“随时响应”和“长续航”得以兼容,赋能主动式 AI应用。

缓存的进一步扩容,是天玑9500的隐藏“大招”。

苹果从2013年的A7开始效仿桌面处理器加入L3缓存,时至今日,最新发布的A19 Pro相比前代产品,最后一级缓存整整提高了50%。

苹果保持大缓存设计习惯的背后,是因为CPU和内存性能之间存在剪刀差。在处理器内部,CGN(CPU、GPU、NPU)通常要从内存调取数据,做对应的计算工作,最后再把结果搬回内存。

因此决定计算快慢的,除了CGN的计算速度之外,还有数据的“搬运速度”,当数据搬运速度低于计算速度,就造成了“内存墙”,拖垮计算效率。



这种情况下,缓存作为数据的临时仓库,便成为近年来堆料的核心阵地,也是天玑系列一以贯之的设计思路。

在前代产品的基础上,天玑9500再接再厉,L3从12MB大幅增加到16MB,SLC维持10MB水平,为需要密集计算的应用打下基础。

激进的IPC升级,“存算一体”架构的引入,加上缓存针对性的扩容,组合成了联发科的芯片设计水平的代表作,也将移动SoC的技术竞争推向了新的高度。

摆正算力和功耗的天平

半导体行业一个普遍共识是,没有完美的芯片,只有完美的Trade-off。

在芯片设计中,性能(Performance)、功耗(Power)、面积(Area)组成了一个不可能三角,芯片设计能力的体现,始终是在不可能的三角中寻找最平衡的区间。

当智能手机大踏步进入AI时代,对“平衡”的把控能力就更加迫切。

由于网络延迟和隐私保护等原因,近年来,AI推理从云端向端侧迁移,既是行业共识,也是不可逆转的趋势。与之对应,算力瓶颈俨然成为困扰终端厂商的棘手问题。



微软首席电气工程师保罗・楚诺克算过一笔账[2],按照61%的利用率,每块H100一年要消耗大约3740度电,相当于一个美国家庭的平均功耗。云端训练芯片对功耗可以宽容,但端侧要求明显严苛。

在寸土寸金的手机里,芯片设计公司追逐的圣杯,是在功耗恒定的情况下挤出更多算力,即“计算效率”。

这种设计思路既推动了NPU(神经网络加速器)的脱颖而出,也贴合了天玑9500的设计哲学:既要保证“算力够用”,又要解决“功耗降不下来”的难题。

根据英特尔研究,一个采用7nm制程的AI芯片,光数据搬运产生的功耗就高达35pJ/bit,占总功耗的63.7%。也就是说,减少数据搬运,是降低功耗的重要途径。

因此在天玑9500中,联发科采用了创造性的双NPU架构,两颗NPU各司其职,一个作为性能核心支持端侧运行参数量大的模型,另一个采用“存算一体”架构,作为能效核心,运行参数量较小的模型。

所谓“存算一体”架构,核心是将NPU内部的计算单元与缓存融为一体,从根本减少搬运路程。使得天玑9500将AI算力提高到100TOPS的同时,最大程度避免了高功耗问题。

端侧大模型搭配小模型是智能手机AI部署的一大趋势。天玑9500的超能效NPU,可以实现轻负载AI模型Always-On运算,对实时翻译和对话式AI这类应用来说,用户体验可以从“请求-响应”变成“随时响应”。模型始终在线,但更加省电。


在权威机构ETHZ的AI Benchmark测试里,天玑9500获AI性能榜单冠军

和端侧AI类似,手机游戏同样受困于性能和功耗的两难抉择,一直以来也是检验芯片实力的“照妖镜”。对算力和功耗的平衡艺术,在剑与魔法的世界公平的考验着每一家芯片设计公司。

消费电子领域,硬件与软件大多互为催化剂,游戏公司对画质和沉浸式体验的追逐,会倒逼芯片公司发力游戏体验。后者性能的提升,又会推动前者的进步。

从天玑9200首发移动端硬件光线追踪开始,联发科接连布局全局光照效果、OMM追光引擎,让移动端游戏体验直逼主机级效果。天玑9500再接再厉,通过在移动端率先支持主机级Ray-tracing Pipeline技术,带来了前所未有的沉浸式主机级光追效果。



除此之外,天玑9500首发GPU Dynamic Cache (动态缓存)架构,让GPU可以利用SLC系统级高速缓存,从而进一步降低功耗,同样意在提高游戏体验。

在性能和能耗这个困扰手机游戏多年的命题上,天玑9500通过几代产品的技术积累,提供了一个尽可能完美的解决方案。

按照测算,天玑9500支持的光追下游戏帧率从9300的60帧跃升至行业领先的120帧,功耗逆势降低14%,将反差做到了极致。

在一个又一个场景中创造惊艳的体验,是对物理学最浪漫的诠释。

稳稳站上第一梯队

2007年的第一代iPhone发布会上,乔布斯拿出手机拨通了位于旧金山的一家星巴克电话,玩笑称要预定4000份拿铁,店员不明所以,但现场观众掌声雷动——这一幕被现场的媒体定格,成为了电子产业史上绕不开的里程碑。

然而,乔布斯玩笑式的电话,却成为未来十多年里,产业界求索的图腾。

2011年,苹果智能语音助手Siri随iPhone 4S隆重登场,掀开了消费电子产业对人工智能的想象。时至今日,大量AI功能被塞进手机里的同时,两大趋势越发凸显:

一是AI不再是相机美颜和语音助手的附属功能,反而变成重构手机体验的新引擎;

二是智能手机的竞争焦点,逐步从比拼硬件参数向软硬强耦合的产品力转移,其根本思路就是围绕真实场景,针对用户需求做突破。


2011年,Siri第一次亮相

结合IDC的定义,30TOPS是AI手机SoC的入门槛。这从事实层面将时间线拉到了天玑9300上市的2023年。

人工智能时代赋予联发科的角色,不是纯粹的“算力供应商”,而是基于对用户需求场景的深刻洞察,将代码和电路变成实实在在的用户体验,支撑起无从察觉却无处不在的智能未来。

从解决大模型入端带来的算力激增与功耗约束之间的矛盾,到满足游戏用户对GPU极致渲染能力与持久续航之间的双重期待,用户需求为先,一直是联发科设计研发的出发点。

在今年的天玑开发者大会上,联发科提出了 Agentic AI UX的五大愿景:主动及时、知你懂你、互动协助、学习进化、专属隐私信息守护。在天玑9500上,联发科与终端厂商联合打造的量产的端侧AI功能,恰恰是这种愿景的延伸与产物。

在与vivo的合作中,联发科为后者定制的NPU,帮助其实现了全球首发的视频录制功能,为vivo X300系列提供了强大的追焦系统,可支持毫秒级运动追踪与瞬时快门响应,还打造了能够“学习进化”的AI定制美颜功能。

在OPPO最新旗舰Find X9上,针对搜索这一场景,联发科通过系统级整合赋能OPPO AI 端侧落地,与OPPO共同打造了“知你懂你”的AI意图搜索应用,帮助用户实现一键即搜。



为了改善文生图与文生文这两个普及最广、工作场景中效率提升最为显著的AI应用,天玑9500凭借内置的生成式AI引擎2.0与Transformer专用固化电路,实现了多项端侧AI能力的突破:

支持4K超高画质文生图在手机端侧直接生成,同时将文生文大语言模型的端侧响应速度提升了一倍。由此最大程度解决了高并发时段响应延迟、生成效率低下的问题。

上网、游戏、办公……真实的需求场景始终是放大芯片与大众需求的连接器,使得芯片这个技术与资本高度密集的产业,始终有足够的市场和动力,快速向前滚动和发展。

当人工智能的蔓延再次冲击原本井然有序的市场格局,联发科用务实的研发理念和对市场需求的理解,一步步站上了全球芯片设计产业的第一梯队。

AI时代的到来,市场纷纷大讲未来,联发科对于未来有着清晰的技术规划和持续投资,更加值得关注的是,这家厂商同样注重当下——从引领端侧视频生成、4K文生图等等这些落地应用,我们看到,先进的AI,更是触手可及的AI。

当“天玑”(Dimensity)这个芯片品牌在2019年第一次亮相时,恐怕很少有人能预料,联发科在此后的手机市场变化中所扮演的角色,更难以想象,一代又一代的天玑芯片所创造的持续价值。



参考资料

[1]2025年上半年全球高端智能手机销量创历史新高,CounterPoint Research

[2]算力巨兽能耗惊人:英伟达H100 AI芯片总耗电量将超欧洲小国,IT之家

作者:徐珊珊

编辑:何律衡

责任编辑:徐珊珊

封面图片来自ShotDeck

相关推荐

天玑9500再次被确认:CPU架构更换,且配备全新CSS技术!
超200万!天玑9300跑分曝光:预定安卓最强处理器?
首创双NPU架构一鸣惊人,联发科天玑9500重磅加码主动式AI体验
联发科天玑9500早期规格曝光,CPU或继续升级
骁龙8 Elite 2、天玑9500再曝光,性能大幅升级
天玑芯片影像不行?我不同意!
传第二代骁龙8至尊版主频高达5GHz,天玑9500主频仅4GHz
传高通第二代骁龙8至尊版主频高达5GHz,天玑9500主频仅4GHz
天玑9400问世:旗舰SoC竞争升级
或首发天玑9300,疑似vivo X100跑分成绩曝光

网址: 天玑9500芯片问世,最有看点的不是跑分 http://www.xishuta.com/newsview142195.html

所属分类:人工智能

推荐科技快讯