比英伟达快20倍!哈佛辍学生发布大模型芯片 属于AI的“矿机革命”要来了?
《科创板日报》6月27日讯(编辑 朱凌)你还记得加密货币的矿机吗?2013年,专为比特币挖矿而设计的ASIC芯片问世,与之前占主导地位的CPU和GPU相比,ASIC的挖矿效率实现了质的飞跃,革命性地改变比特币挖矿格局。
而近日,一家叫做Etched的硅谷初创公司凭借其用于AI的ASIC芯片,从最底层的架构层面为主流AI大模型公司所采用的Transformer计算提供更优性价比的选择,在AI硬件领域掀起了波澜。
Etched由哈佛辍学生Gavin Uberti和Chris Zhu于2022 年创立,他们开发了一款名为Sohu的专为Transformer模型设计ASIC芯片。
Etched声称,Sohu芯片推理Llama-3 70B的速度比英伟达的H100快20倍,而功耗却大大降低。
Etched刚刚获得了1.2亿美元的新融资,由 Primary Venture Partners 和 Positive Sum Ventures 领投,Peter Thiel、Github首席执行官Thomas Dohmke和前Coinbase首席技术官Balaji Srinivasan等知名投资者也参与了本轮融资。
随着Transformer模型不断推动生成式AI突破,Sohu芯片被认为有望在AI推理侧打破英伟达GPU一家独大的格局,重塑AI计算的格局。
专用于Transformer
GPU中包含多种运算单元,如FP64、FP32、INT、TensorCore等结构。处理任意CUDA代码需要复杂的编译器,芯片开发商往往需要在软件开发上投入了超过数十亿美元的成本,但成效有限。
而Etched则缩小了焦点。通过专用于运行Transformers,Etched可以简化软件开发,并侧重TensorCore,针对性地提升AI运算能力。
由于大多数AI公司使用特定的Transformer推理库,如TensorRT-LLM、vLLM或HuggingFace的TGI,这些框架足以满足大多数需求。
而文本、图像或视频等不同应用中的Transformer模型基本相似,这使得客户可以在不改变核心模型代码的情况下调整模型超参数。
顶尖AI公司通常需要定制解决方案,聘请工程师对GPU内核进行精心优化。而Etched通过开放从驱动程序到内核的整个软件栈,消除逆向工程的需要。这种开放性允许工程师根据需要实施定制Transformer层,提高了灵活性。
此外,Sohu芯片减少了用于存储器的空间,而将更多空间用于计算用途的晶体管,并通过只有一个大内核的设计,减少了用来协调不同内核的低效计算。
不过,如果迅速出现替代Transformer的新算法,则Sohu芯片将失去价值。“我们正在人工智能领域下最大的赌注,”Gavin Uberti在接受采访时说。”如果Transformer消失了,我们就会死。但如果它们继续存在,我们就是有史以来最大的公司。”
ASIC竞争格局开放
事实上,大型云厂商也在通过自研或代研ASIC加入AI军备竞赛。当下,海外ASIC设计巨头的财报已然出现了一些积极的变化。根据博通2024财年一季报,该季度,公司网络业务收入为33亿美元,同比增长46%,主要得益于2家超大规模客户对定制人工智能加速器的强劲需求。
博通预计AI占2024财年半导体收入的25%,现上调指引至35%,超过100亿美元,其中70%是AI加速器。
近日就有消息称,字节跳动正与博通合作开发一款5纳米用于AI的ASIC芯片,并由台积电生产,但字节跳动否认了该消息。
国盛证券在3月20日的研报中指出,从全局来看,ASIC放量与对应的算力降本,是大模型走向一个更大产业的必经之路,但AI的算力叙事足够宏大,与比特币的一轮代替便成终局不同,我们认为在AI芯片的发展上,将会经历多轮螺旋上升式的发展,最终达到全社会的AGI,新的模型与算法通过通用性GPU被发现和初步开发,通过专用ASIC将需求繁荣,繁荣的生态吸引更多用户与参与者,最终培育出新的、更强的算法,循环往复,螺旋上升,最终达成AGI的宏伟目标。
国盛证券建议关注一线晶圆厂、ASIC设计龙头、散热厂商、ASIC芯片公司、服务器。其中,对于ASIC芯片公司,推荐寒武纪、芯原股份、嘉楠科技。
标签: 伟达
相关文章
-
英伟达和OpenAI将对英国AI基础设施进行重大投资详细阅读
英伟达和OpenAI正就支持一项聚焦英国的重大投资展开磋商,该投资旨在提升英国的人工智能基础设施。 一位知情人士称这两家科技公司正洽谈一项规...
2025-09-13 10 伟达
-
晶盛机电(300316):英伟达新一代GPU有望采用碳化硅中介层 SIC衬底新应用打开公司成长空间详细阅读
投资要点 事件:英伟达计划在新一代GPU 芯片的CoWoS 工艺中以碳化硅取代硅中介层,预计2027 年导入。 英伟达高阶GPU 均采用CoW...
2025-09-07 16 伟达
-
传G42寻求芯片供应商多元化 减少对英伟达(NVDA.US)依赖详细阅读
智通财经APP获悉,据报道,阿布扎比支持的科技集团G42计划为阿联酋-美国人工智能(AI 园区实现芯片供应商多元化,不再局限于英伟达(NVDA.US ...
2025-09-01 16 伟达
-
人形机器人行业周报:国务院印发《关于深入实施“人工智能+”行动的意见》 英伟达正式发布JETSONTHOR详细阅读
本周重要事件与核心观点: 产业动态: 国务院印发《关于深入实施“人工智能+”行动的意见》。新华社北京8 月26 日电国务院日前印发《关于深入实...
2025-08-31 12 伟达
-
开盘:美股周一小幅低开 本周市场聚焦英伟达财报详细阅读
北京时间8月25日晚,美股周一小幅低开。投资者正密切关注英伟达即将公布的财报,并且重新审视关税及其对通胀和企业利润的影响。分析师称,资金从科技股流...
2025-08-26 20 伟达
-
午盘:美股涨跌不一 英特尔与英伟达推动纳指走高详细阅读
北京时间8月26日凌晨,美股周一午盘涨跌不一,英特尔与英伟达推动纳指走高。投资者正密切关注英伟达即将公布的财报,并且重新审视关税及其对通胀和企业利...
2025-08-26 18 伟达