低价挑战英伟达!传奇芯片大师吉姆·凯勒曝设计关键:舍弃HBM
2024-07-16 12:01:26 technews(台)Jim Keller 目前在 AI 芯片初创公司 Tenstorrent 担任首席执行官。他认为,很多市场都没得到 NVIDIA 很好的服务,随着 AI 应用扩展到智能手机、电动车和云服务,越来越多公司正寻找更便宜的解决方案,有很多小公司不愿为 NVIDIA 高阶 GPU 支付 2 万美元。
Jim Keller 在芯片设计界享有盛誉,也是 AMD Zen 系列的首席设计师,许多人认为这帮助 AMD 东山再起、奋力追赶上英特尔。此外,他也是开发特斯拉自驾软件Autopilot芯片组的重要人物。
日本人工智能独角兽公司 Preferred Networks 运算架构部门副总裁兼技术长 Junichiro Makino 形容,「他(Jim Keller)简直就是一个传奇」。
Tenstorrent 成立于2016年,准备今年底出售第二代多用途AI芯片。该公司声称,它在某些领域拥有比英伟达 AI GPU 更高的能效和处理效率。此外,其Galaxy系统比英伟达DGX效率高三倍,价格更是便宜33%。
Keller 指出,之所以能做到这点,是因为 Tenstorrent 没使用高带宽内存(HBM),「即使是使用 HBM 的人,也在为成本以及构建 HBM 所需的设计时间而挣扎,因此决定不使用该技术」。
HBM 是生成式 AI 芯片的重要组成,在 NVIDIA 产品成功中发挥重要作用,然而这也是 AI 芯片能耗巨大、价格高昂的罪魁祸首之一。
在典型的人工智能芯片组中,GPU 每次执行进程时向存储器发送数据,这需要 HBM 高速数据传输能力。然而,Tenstorrent 专门设计自己的芯片,以大幅减少这种传输。Keller 指出,有了这种新方法,其公司芯片设计可在 AI 开发的某些领域取代 GPU 和 HBM。
此外,Tenstorrent 还在设计产品以尽可能实现成本效益,目前许多公司也在寻求更好的内存解决方案,但 Keller 也坦承,要颠覆庞大的现有 HBM 产业,还需要数年时间。他也预期,与其只由一间公司取代英伟达,不如涌现更多新公司,填补美国公司未涉足的各种人工智能市场。
Tentorrent 芯片主要特点是 100 多个核心中,每个核心都有小型 CPU,即「大脑中的微型大脑」。通常情况下,单个芯片核心只有一个小型电脑和内存,只负责解决一个给定的任务,但 Tenstorrent 的核心能独立「思考」,决定先处理哪些数据,或者放弃不必要的任务,从而提高整体效率。
Tentorrent指出,由于每个核心都相对独立,可将更多或更少核心堆栈,使应用更广泛。例如,智能手机或可穿戴设备只需少量芯片即可,而 AI 数据中心可将 100 个芯片组合在一起使用,使用上也更加灵活。Keller 指出,目前还无法预测 AI 最佳应用是什么,因此公司策略是打造适合各种产品的技术。