文 | 晏秋

编辑 | 杨逍

2023年6月5日,美国芯片初创公司Etched.ai宣布获得536万美元种子轮融资,本轮融资由Primary Venture Partners 领投,MAX Ventures和天使投资人、前Ebay首席执行官Devin Wenig参与跟投,目前公司估值约为3400万美元。本轮资金将用于制造大型语言模型(LLM)的AI加速芯片,形成规模化的初创团队,进行RTL前端开发。

Etched.ai位于加尼福尼亚州,由两名从哈佛大学辍学的学生Gavin Uberti和Chris Zhu共同创立。公司旨在构建超级智能硬件,设计用于语言模型推理的专用芯片。

这种芯片具有四个特点:一是类型单一,仅仅用于大型语言模型的运行,最大限度地降低软件堆栈的复杂性;二是保留重要元素,摒弃了一些无法使用传统的缓存或高精度数据的大型语言模型;三是技术成熟,加速芯片来自专业化的研发;四是具有成本效益上的优势。

随着transformer模型在复杂度和数量上的增加,高效的硬件成为运行模型的刚需。在AI加速器领域,不少公司开始针对特定工作负载搭建专门的架构,数据中心的专用架构主要集中在DLRM(深度学习推荐模型),而边缘地带则以CNN(卷积神经网络)为主要模式。目前,Meta宣布已经构建了自己的DLRM推理芯片。

因此,谈及创业灵感,创始人Uberti表示,在为Arm Cortex M4 和Cortex M7内核开发芯片时,他注意到在Arm的指令集中并没有8位的MAC SIMD 指令,而是16位指令,这就意味着在MAC SIMD的操作过程中运营速度低下。“这个问题非常棘手,我每天都要面对和处理它,这也让我和Chris一起思考,如何才能突破现有的技术瓶颈。同时,我们也在见证着大型语言模型领域的变革。” 面对这种市场需求,Uberti和Chris认为,可以创建专门的芯片,提供更快捷、更高效的处理。比特币挖矿芯片就是专用 ASIC 产品的一个典型代表。

然而,另一方面,如果 Etched.ai 芯片过于专业化,助力新型人工智能产业的腾飞,也可能会给人类带来负面影响甚至社会性灾难。“这的确可能成为一个风险,但如果我们回顾四年前的 GPT-2,将它与Meta最近的 Llama 模型相比,它们实际上只有两个区别——大小和激活函数。虽然它们的训练方式有所不同,但这对推理来说并不重要。” Uberti说,“我们无需对科技的负面效应太过担心,因为创新不会凭空而来,整合现有资源就需要花费很长一段时间”。

现阶段,Etched.ai在研发代号名为Sohu的芯片。这是一个拥有大量内存的芯片,与处理 GPT-3的 Nvidia H100 PCIe卡相比,每美元的吞吐量可以增加140倍。Etched.ai还在不断扩大团队规模,努力吸收更多优秀的技术人才和工程师,并拟定于明年年初筹集A轮融资,2024年将推出Sohu芯片产品。

团队成员方面,Etched.ai的首席执行官兼联合创始人Gavin Uberti是世界奥林匹克数学竞赛冠军,也是人工智能编译方面的专家。首席技术官兼联合创始人Chris Zhu也是数学和人工智能领域的研究员,专注于硬件的研发。首席架构Mark Ross曾担任过Cypress Semiconductor的CTO,深耕芯片设计多年。

相关文章