异构多线程,重大突破
根据加州大学河滨分校的一篇研究论文,同时异构多线程 (SHMT) 可能是同时利用设备CPU、GPU和 AI 加速器功能的解决方案。论文声称,这种新的多线程技术可以将性能提高一倍,并将功耗减半,从而使效率提高四倍。然而,作为一个概念验证,不要兴奋得太快;现在还处于早期阶段。
许多设备已经使用多线程技术,例如同时多线程 (SMT),它将处理器核心划分为两个线程,以提高计算效率。然而,SHMT 跨越多个设备:CPU、GPU 和至少一个人工智能驱动的加速器。这个想法是让每个处理器同时处理不同的事情,甚至将 GPU 和 AI 资源分散到多个任务上。
根据 Hung-Wei Tseng 和 Kuan-Chieh Hsu 撰写的论文,SHMT 可以将性能提高 1.95 倍,并将功耗降低 51%。这些结果记录在 Nvidia 的 Maxwell 时代的Jetson Nano上,该设备配备四核 Cortex A57 Arm CPU、4GB LPDDR4 和 128 核 GPU。此外,研究人员还在 Jetson 的 M.2 插槽中安装了Google Edge TPU,以提供人工智能加速器,因为 Jetson 自带了一个。
研究人员通过创建质量感知工作窃取 (QAWS) 调度程序实现了这一结果。本质上,调度程序经过调整以避免高错误率并在所有组件之间均匀平衡工作负载。根据 QAWS 政策,需要高精度和准确度的任务不会分配给有时容易出错的人工智能加速器,如果某个组件未达到性能预期,任务将动态地重新分配给其他组件。

性能加倍、功耗减半、效率提高四倍,您可能想知道其中的问题是什么。根据该论文,“SHMT 的局限性不在于模型本身,而更多在于程序员是否可以重新审视算法以展示使 SHMT 易于利用的并行性类型。” 该声明指的是如何编写软件才能利用 SHMT,并且并非所有软件都能充分利用它。
众所周知,重写软件是一件痛苦的事情。例如,当苹果公司从英特尔转向其用于 Mac PC 的内部Arm 芯片时,必须做大量的跑腿工作。具体到多线程,开发人员可能需要一段时间来调整。软件花了几年时间才利用多核 CPU,我们可能会考虑类似的时间表,让开发人员利用多个组件来完成同一任务。
此外,本文还详细介绍了 SHMT 的性能提升如何取决于问题规模。1.95 倍的速度提升来自论文测试的最大问题规模,但较小的问题规模会带来较低的性能提升。在问题规模最小的情况下,基本上没有性能优势,因为问题规模越小,所有组件并行工作的机会就越少。
随着各种计算机越来越多地配备人工智能处理器等多种计算设备,开发人员可能不可避免地希望使用更多硬件来加快速度。即使 SHMT 没有达到本文概述的最佳情况,如果它或类似技术获得主流动力,它仍然可以推动个人电脑和智能手机的发展。
发布于:安徽
相关推荐
异构多线程,重大突破
36氪首发|「清醒异构」完成天使+轮融资,开发自动并行工具加速工业智能制造发展,释放更多异构算力
Linux 补丁显示龙芯 3A6000 系列处理器将支持同步多线程SMT 技术
宋继强:AI计算迈入超异构时代
大势所趋的芯片异构
国产数据库重大突破
骁龙8Gen 4:台积电N3E、Nuvia内核多线程性能高于M2
龙芯3A6000处理器首次支持同步多线程:性能追上10代酷睿
异构智能体自主协作,大模型扮演了什么角色?
我国芯片领域取得重大突破
网址: 异构多线程,重大突破 http://www.xishuta.com/newsview109662.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
