首页科技快讯浪潮信息：元脑企智一体机率先完成对Kimi K2大模型的适配支持

浪潮信息：元脑企智一体机率先完成对Kimi K2大模型的适配支持

来源：晰数塔互联网快讯时间：2025年08月02日 13:22

（来源：银柿财经）

元脑企智一体机已成功部署于金融、制造、能源、医疗等多个关键行业，帮助企业快速、安全、经济地构建专属大模型应用，加速产业智能化转型步伐。

7月31日，浪潮信息（000977.SZ）宣布，元脑企智一体机已率先完成对Kimi K2万亿参数大模型的适配支持，并实现单用户70 tokens/s的流畅输出速度，为企业客户高效部署应用大模型提供高处理性能和完善的软件工具平台支持。

Kimi K2是月之暗面推出的开源万亿参数大模型，创新使用了MuonClip优化器进行训练，大幅提升了模型的学习效率。K2在代码生成、数学推理、Agent多步骤任务上展现出领先能力，评测指标达到业界领先水平。自发布以来，K2在开发者和研究社区引起广泛关注，迅速获得在编码辅助和Agent驱动自动化任务中的部署应用。

元脑企智一体机采用元脑服务器NF5688G7作为算力底座，其搭载FP8计算引擎，配备1128GB HBM3e高速显存，单台服务器即可支持K2 万亿参数全量模型部署。NF5688G7服务器具备900GB/s的GPU P2P带宽，为Kimi K2提供了专家间高速并行通信，最大化并行效率。该服务器可支持3200Gbps的RDMA扩展网络，为预填充-解码分离部署和大规模专家并行预留了充足的扩展空间。

来源：浪潮信息

浪潮信息已完成元脑企智一体机对K2的适配，支持64K上下文长度和多路用户实时并发访问。基于SGLang推理框架，通过减少MoE对齐块大小内核的小批量模式开销和fused_moe的内存消耗，并复用deepGEMM等高效算子，实现单用户并发下输出速度超过70 tokens/s，25用户并发时每用户输出速度超过25 tokens/s。优化后的计算性能可保证用户在进行复杂的代码生成、长文本书写或Agent调用时，能够获得流畅、低延迟的交互体验。

元脑企智一体机提供了元脑企智(EPAI)平台与K2大模型的无缝集成，为企业用户提供了一套软硬件协同优化、开箱即用的端到端大模型私有化部署解决方案。通过元脑企智平台，企业可利用低代码、可视化界面，便捷地进行数据准备、模型微调、知识检索（RAG）和智能体（Agent）构建。