首页 科技快讯 浪潮信息:元脑企智一体机率先完成对Kimi K2大模型的适配支持

浪潮信息:元脑企智一体机率先完成对Kimi K2大模型的适配支持

来源:晰数塔互联网快讯 时间:2025年08月02日 13:22

(来源:银柿财经)

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

7月31日,浪潮信息(000977.SZ)宣布,元脑企智一体机已率先完成对Kimi K2万亿参数大模型的适配支持,并实现单用户70 tokens/s的流畅输出速度,为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。

Kimi K2是月之暗面推出的开源万亿参数大模型,创新使用了MuonClip优化器进行训练,大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力,评测指标达到业界领先水平。自发布以来,K2在开发者和研究社区引起广泛关注,迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座,其搭载FP8计算引擎,配备1128GB HBM3e高速显存,单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽,为Kimi K2提供了专家间高速并行通信,最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络,为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

来源:浪潮信息

浪潮信息已完成元脑企智一体机对K2的适配,支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架,通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗,并复用deepGEMM等高效算子,实现单用户并发下输出速度超过70 tokens/s,25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时,能够获得流畅、低延迟的交互体验。

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成,为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台,企业可利用低代码、可视化界面,便捷地进行数据准备、模型微调、知识检索(RAG)和智能体(Agent)构建。

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业,帮助企业快速、安全、经济地构建专属大模型应用,加速产业智能化转型步伐。

相关推荐

浪潮信息:元脑企智一体机率先完成对Kimi K2大模型的适配支持
Kimi K2 不仅抢了开源第一,还抢了自家论文署名:我「夸」我自己
Kimi K2不仅抢了开源第一,还抢了自家论文署名:我“夸”我自己
浪潮信息推出元脑服务器操作系统KOS AI定制版
可支持千亿大模型训练,摩尔线程推出全国产GPU千卡智算中心|最前线
浪潮信息参展世界人工智能大会,“多元多模”智算中心备受关注
超越DeepSeek,中国又一款大模型登顶!
电科数字发布全新申威DeepSeek大模型一体机,筑牢自主可控人工智能安全屏障
大模型Kimi爆火,能解国产GPT的“意难平”么?
Kimi、阿里、资本大佬,联手玩了个高端局

网址: 浪潮信息:元脑企智一体机率先完成对Kimi K2大模型的适配支持 http://www.xishuta.com/newsview139799.html

所属分类:行业热点

推荐科技快讯