Cerebras上市:AI芯片多元化的「诺曼底时刻」来了吗?【黑马雷达 第008期】

一位工程师背对镜头,手持整片晶圆站在半导体制造车间窗前,暖色光线映照出芯片表面的精密电路纹路。来源:投黑马 Touheima.com

一、为什么现在是关键窗口

AI芯片赛道正在经历一个被大多数人低估的结构性转折——不是某家公司变强了,而是整个供应链的权力结构开始松动。

2026年5月14日,Cerebras Systems在纳斯达克敲响上市钟声。开盘价350美元,盘中一度触及385美元高点,相比发行价185美元上涨108%。最终收于311.07美元,首日涨幅68%。这是2019年Uber以来美国科技圈最大规模的IPO,通过出售3000万股,合计募资约55.5亿美元。

但真正值得关注的不是股价,而是这笔钱背后的信号。

IPO认购需求超过可用股票的20倍以上,原本150至160美元的预期发行区间被直接击穿,最终定价185美元。资本市场用真金白银投了一张票:我们需要「不是英伟达」的AI芯片选择。

过去两年,全球AI算力的押注高度集中——集中在英伟达,集中在H100和B200的订单排队上。这种集中带来了效率,也制造了风险。如果把今天的AI军备竞赛比作一场大战,英伟达就是那条几乎垄断了全部弹药供应的后勤线。所有人都依赖它,所有人也都清楚,这种依赖有多危险。

于是,一场寻找「第二条补给线」的行动,一直在暗中推进。Cerebras的上市,是这场行动浮出水面的标志性事件。

二、核心变量:一张「不像芯片」的芯片,重新定义AI算力的几何形状

要理解Cerebras为什么能在IPO市场掀起如此大的骚动,得先搞懂它到底造了什么。

英伟达的GPU,无论多么强大,本质上还是一枚「小」芯片——多块芯片通过高速互联组成集群,协同完成大模型的训练和推理任务。这套架构在过去十年里统治了整个行业,但它有一个天生的短板:芯片之间的数据通信延迟,在处理超大规模模型时,会成为一个无法忽视的瓶颈。

Cerebras的创始人Andrew Feldman不是第一次做这种「架构级别的异见者」。2010年代初,他在SeaMicro就论证过,当时流行的服务器架构对互联网工作负载来说「几何形状就是错的」——事实证明他是对的,AMD最终以超过3.34亿美元收购了SeaMicro。

这一次,Feldman把同样的逻辑用在了AI芯片上。

Cerebras的核心产品是WSE(Wafer Scale Engine),一块和整片晶圆一样大的芯片。没有多块芯片互联,没有通信延迟,神经网络的所有计算在同一块硅片上完成。Cerebras声称,其推理速度比「领先的基于GPU的方案」快15倍。

这里的核心变量不是「快多少」,而是「架构层面的范式差异」。

传统GPU集群的扩展逻辑是「加更多芯片」——但每加一块,通信开销就多一分,性能提升的边际效益递减。WSE的逻辑完全不同:把所有计算单元放在同一块硅片上,数据在片上流动,延迟降低几个数量级。这不是改良,而是重写了AI算力的基本几何形状。

伊利诺伊大学香槟分校教授Deming Chen给出了一个冷静的注脚:「较小的芯片对大多数用例仍然更实用,更便宜、更灵活、更容易扩展。Cerebras在某些工作负载中表现出色,但它不会替代一切。」

这句话恰恰点明了WSE的战略定位——它不是要取代GPU,而是在GPU力不从心的场景里开辟第二战场。当推理工作负载持续爆炸式增长(多家机构预测2027年推理算力需求将超过训练算力),WSE的「零通信延迟」优势将从技术亮点变成商业刚需。

投黑马认为,AI芯片赛道正在从「单一架构统治」走向「多架构并存」,而推理场景的爆发是驱动这一转折的核心变量。

三、竞争格局分析

AI芯片的竞争从来不只是硅片之间的比拼,更是生态、客户关系和路径依赖的博弈。当前格局中,六个玩家的卡位逻辑正在分化。

英伟达:不可撼动的王座,但护城河的性质正在改变

英伟达的统治力无需赘述。5月20日即将发布的2027财年第一季度财报,市场预计当季营收约780亿美元,同比增长约75%。但更值得关注的是英伟达护城河的本质——不是芯片性能,而是CUDA软件生态。全球数百万开发者、数十万个开源项目、整个深度学习框架栈都绑定在CUDA上。这是十五年积累的成果,不是靠一张更快的芯片就能填平的。

护城河:CUDA生态的锁定效应,加上全链条产品矩阵(训练+推理+网络互联),让客户的迁移成本极高。

隐患:估值已经充分反映了垄断溢价(市销率约25倍)。一旦「非英伟达」选项在生产级部署中被验证可行,溢价回调的空间不可忽视。更深层的风险在于,当大客户(如OpenAI、谷歌、亚马逊)同时推进自研芯片时,英伟达的议价权正在被逐步稀释。

投黑马判断:短期内无可替代,但中长期面临「生态解绑」的慢性压力。

Cerebras:架构异见者的生产级大考

Cerebras的技术差异化已经得到市场认可——首日68%的涨幅就是证据。但技术差异化和商业化规模之间,还隔着一条巨大的鸿沟。

护城河:WSE架构在推理延迟上的物理优势是结构性的,竞争对手无法通过软件优化抹平。客户名单已出现OpenAI和AWS等重量级名字。

隐患:客户集中风险刺眼。根据S-1招股说明书,阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)一家贡献了62%的营收,占应收账款的77.9%。187倍的市销率对比英伟达的25倍,不是贵一点,是贵了将近八倍。Motley Fool分析师说得很直接:「我会谨慎劝阻投资者立即跳进。」

投黑马判断:技术逻辑成立,但从「备胎测试」到「生产级部署」的跨越尚未完成,这是未来两年的核心观察点。

AMD:老二的逆袭窗口

AMD今年以来涨幅已超过94%,这不是偶然。MI300X在推理性价比上的表现让大客户多了一个真实的选项,而ROCm软件栈的持续改进正在降低从CUDA迁移的门槛。

护城河:x86 CPU+GPU的全栈整合能力,加上与大型云厂商的深度合作关系。

隐患:软件生态仍然是短板。ROCm的成熟度与CUDA差距明显,开发者社区的规模不在一个量级。如果不能在两年内让ROCm达到「够用」的临界点,硬件性价比的优势将被软件摩擦力抵消。

投黑马判断:最现实的「第二选择」,但成败系于软件生态的追赶速度。

英特尔:涅槃重生还是回光返照?

英特尔同期涨幅高达218%,市场押注的是Gaudi系列AI加速器和代工业务的双重转型。新任CEO的激进重组给市场注入了信心,但执行力仍需验证。

护城河:制造能力(如果代工转型成功)和企业级市场的渠道积累。

隐患:多线作战消耗巨大,AI加速器、CPU业务、代工业务三条战线同时烧钱。历史上多次战略转型未能兑现的记忆,让机构投资者的耐心有限。

投黑马判断:高赔率但高风险的赌注,适合配置型投资者而非集中押注。

Groq:推理专用芯片的另一种可能

Groq的LPU(Language Processing Unit)走的是和Cerebras不同的推理加速路线——不是做大芯片,而是用全新的确定性计算架构消除GPU推理中的内存瓶颈。其公开演示的推理速度令人印象深刻,每秒输出token数远超传统GPU方案。

护城河:架构层面的延迟优势和确定性调度带来的能效比。

隐患:产能受限,目前仍依赖云端API服务模式,尚未大规模出货物理芯片。商业模式能否从「演示级惊艳」过渡到「生产级可靠」,仍是未知数。

投黑马判断:值得持续追踪的非共识标的,但当前阶段更适合观察而非重仓。

云厂商自研芯片(谷歌TPU / 亚马逊Trainium / 微软Maia)

大客户自研芯片是英伟达最大的长期威胁。谷歌TPU已经迭代到第六代,亚马逊Trainium 2正在全面铺开,微软Maia首批芯片已进入自有数据中心。

护城河:自研芯片与自有云平台深度绑定,优化空间远超通用方案。

隐患:自研芯片通常只服务内部工作负载,不具备外部生态效应。如果无法吸引第三方开发者,其影响力将被限制在「降低自身成本」的层面。

投黑马判断:不是直接投资标的,但其进展速度是衡量英伟达护城河侵蚀程度的关键指标。

四、被市场低估的早期机会

Cerebras的IPO不是一个孤立事件,而是AI芯片多元化浪潮的序章。以下三个方向是投黑马判断中被市场显著低估的左侧机会。

机会一:AI推理优化中间件

核心逻辑:当AI芯片从「英伟达一家独大」走向「多架构并存」时,企业面临的核心痛点不是「选哪家芯片」,而是「如何在不同芯片之间高效调度推理工作负载」。一个大模型可能在英伟达GPU上训练,在Cerebras WSE上做批量推理,在Groq LPU上做实时推理——这需要一个跨架构的推理编排层。

三层过滤:需求真实(多架构部署已是大客户的既定路线)+ 当前方案稀缺(现有方案高度绑定单一架构)+ 认知差显著(市场关注芯片本身,忽略了中间件的平台价值)。

追踪信号:如果2026年下半年出现获得A轮以上融资的独立推理编排平台公司,说明机会正在兑现。关注开源社区中跨架构推理框架(如vLLM、TensorRT-LLM的多后端支持)的贡献者活跃度。

机会二:晶圆级封装与先进封装技术

核心逻辑:Cerebras的WSE证明了一件事——芯片的物理尺寸限制正在被突破。无论是WSE的整片晶圆方案,还是英伟达、AMD采用的Chiplet多芯粒封装路线,先进封装技术都是AI芯片性能跃升的关键瓶颈。台积电的CoWoS产能已经排到2027年,这个供需缺口不会短期消失。

三层过滤:需求真实(所有AI芯片公司都在争抢封装产能)+ 当前方案稀缺(全球先进封装产能高度集中)+ 认知差显著(市场关注芯片设计公司的估值,低估了封装环节的战略价值)。

追踪信号:关注封装设备龙头的订单增速(如ASMPT、Besi)、非台积电封装产能的扩建公告、以及Chiplet标准化组织UCIe的成员扩展情况。

机会三:AI芯片的垂直行业定制化

核心逻辑:当通用AI芯片的军备竞赛越打越贵,一条被忽略的路线正在浮现——为特定垂直行业(自动驾驶、机器人、边缘推理)定制专用芯片。通用大芯片追求的是「什么都能做」,但垂直行业要的是「做这一件事做到极致且功耗最低」。这是一个完全不同的价值主张。

三层过滤:需求真实(自动驾驶和机器人领域对低功耗实时推理的需求正在爆发)+ 当前方案稀缺(大多数边缘AI芯片仍是通用架构的缩小版,非原生定制)+ 认知差显著(市场聚焦数据中心大芯片,忽略了边缘垂直芯片的长尾市场规模)。

追踪信号:关注地平线、爱芯元智等边缘AI芯片公司的新一轮融资和设计导入(Design Win)公告;关注英伟达Jetson产品线是否出现被垂直专用芯片替代的案例。

五、关键变量追踪

变量一:非英伟达芯片的生产级部署进展

Cerebras的WSE、AMD的MI300X、Groq的LPU——目前都有客户在测试,但「测试」和「大规模生产部署」之间有本质区别。

可观测信号①:关注OpenAI、Anthropic等头部模型公司是否在财报或公开声明中披露「非英伟达芯片」的推理算力占比。一旦这个数字从个位数跳到两位数,就是格局变化的确认信号。

可观测信号②:关注AWS、Azure、GCP三大云平台上,基于非英伟达芯片的推理实例(如AWS的Trainium实例)的定价变化和客户采用数据。价格战的启动意味着非英伟达方案已经具备规模化竞争力。

变量二:推理算力需求的增长斜率

AI的商业化落地正在从「训练为王」转向「推理为王」。每一次用户调用ChatGPT、每一次Agent执行任务、每一次AI实时处理视频流,消耗的都是推理算力。如果推理需求的增长斜率持续陡峭,那么WSE这类推理优化架构的价值窗口就会持续打开。

可观测信号①:关注主要AI应用(ChatGPT、Claude、Gemini)的用户量和调用频次增长数据。月活用户翻倍意味着推理算力需求可能是四倍增长(考虑Agent等复杂场景)。

可观测信号②:关注推理芯片的ASP(平均售价)趋势。如果推理芯片的单位价格持续上升而非下降,说明需求远超供给,芯片公司拥有定价权。

变量三:CUDA生态的解绑速度

英伟达护城河的本质是软件生态锁定。如果开源社区和竞争对手能够加速CUDA的替代方案(如OpenAI的Triton、AMD的ROCm、谷歌的XLA),那么芯片之间的竞争将更多回归硬件性能和性价比本身。

可观测信号①:关注PyTorch和JAX框架中,非CUDA后端的PR合并数量和CI测试覆盖率。这是生态解绑最直接的度量指标。

可观测信号②:关注Hugging Face模型库中明确标注「支持非CUDA推理」的模型比例变化。当这个比例从不足5%增长到20%以上时,生态解绑进入实质阶段。

三变量联动逻辑: 推理需求爆发(变量二)→ 催生多架构部署的商业动力(变量一)→ 加速CUDA生态解绑(变量三)→ 进一步降低非英伟达芯片的采用门槛 → 推理需求的增长被更多架构承接 → 飞轮加速。这个飞轮一旦转起来,AI芯片赛道的竞争格局将不可逆地走向多元化。

投黑马 · 独家评级

赛道热度:🔥🔥🔥🔥🔥  Cerebras首日68%涨幅+20倍超额认购,市场对AI芯片多元化的渴望已无法忽视
左侧机会:⭐⭐⭐⭐    非英伟达架构的生产级验证尚未完成,仍处于左侧布局的黄金窗口
布局紧迫度:⚡⚡⚡⚡⚡  下半年SpaceX/OpenAI/Anthropic排队上市将虹吸市场注意力,AI芯片多元化标的的定价窗口正在收窄

推荐关注层次:
AI推理优化中间件 > 先进封装产业链 > 垂直行业定制芯片

七、分层布局建议

第一层:低风险·长周期——AI芯片基础设施层

投资逻辑:无论哪家芯片公司最终胜出,先进封装、EDA工具、半导体设备都是「卖铲子」的确定性受益者。AI芯片竞争越激烈,基础设施层的需求越旺盛。

选股标准:在先进封装(CoWoS/Chiplet)或EDA领域拥有技术壁垒,且客户覆盖多家AI芯片公司(非单一客户依赖)的企业。

时间窗口:2026年下半年至2028年,先进封装产能缺口预计持续存在,设备订单的确定性最高。

第二层:中风险·中周期——非英伟达AI芯片的头部玩家

投资逻辑:AMD、Cerebras、Groq等公司的命运取决于一个核心问题——非英伟达芯片能否在2027年底前占据推理市场10%以上的份额。如果答案是肯定的,当前估值(尤其是AMD)仍有显著上行空间。

选股标准:已获得至少两家头部AI公司(如OpenAI、谷歌、Meta、亚马逊)的生产级部署或明确采购意向,且软件生态建设有可量化进展。

时间窗口:2026年Q3至2027年Q2,关键验证期。英伟达5月20日财报和各竞争对手的年中客户进展披露将是密集催化剂窗口。

第三层:高风险·短周期——AI芯片赛道的非共识机会

投资逻辑:推理编排中间件、垂直行业定制芯片、以及尚未上市的芯片初创公司(如Groq、SambaNova、Tenstorrent),代表着市场尚未充分定价的非共识方向。高赔率但高波动,适合小仓位配置。

选股标准:技术路线与英伟达GPU架构有本质差异(非改良型),且有至少一个可验证的商业化场景(哪怕规模尚小)。

时间窗口:2026年下半年IPO窗口期是关键——如果Cerebras之后有更多AI芯片公司上市,市场的定价锚将被迅速重塑。

风险披露

风险一:英伟达护城河被低估。如果CUDA生态的锁定效应比预期更强,非英伟达芯片的采用速度将大幅放缓,Cerebras等公司的估值面临回调。影响第二、三层。概率:中等偏高。

风险二:推理需求增长不及预期。如果AI应用的商业化落地速度放缓(用户增长见顶、企业采购预算收紧),推理算力需求的增长斜率将趋缓,WSE等推理优化架构的价值窗口可能延后打开。影响全部三层。概率:中等。

风险三:客户集中风险引发连锁反应。Cerebras 62%营收依赖单一客户的结构性风险如果兑现(大客户缩减订单或延迟付款),不仅冲击Cerebras自身,还可能让市场对整个「非英伟达」叙事产生信任危机。影响第二、三层。概率:低但影响大。

风险四:半导体周期性下行。AI芯片目前处于超级上行周期,但半导体行业的周期性从未消失。如果宏观经济衰退导致企业IT支出全面收缩,即使AI需求仍在增长,芯片公司的估值也会承受系统性压力。影响全部三层。概率:低,但不可忽视。

结语

历史上,没有任何一个技术平台能永远保持垄断。英伟达不是第一个,也不会是最后一个被挑战者盯上的王座。Cerebras在纳斯达克敲响的钟声,不一定是英伟达的噩梦,但一定是AI芯片生态走向多元化的起点。对于左侧投资者而言,当所有人都在找「第二张牌」的时候,真正的机会不在那张牌本身——而在发牌的过程中。

投黑马 · 信号解读

Cerebras以187倍市销率登陆纳斯达克,定价逻辑已超越传统估值框架——市场买的不是当前营收,而是AI芯片格局从「一超独霸」走向「多架构并存」的期权价值。这与2000年代初AMD挑战英特尔时的市场情绪高度相似,区别在于这一次的赛道天花板高出几个数量级。

投黑马提醒:Cerebras的成败取决于能否在未来18个月内将OpenAI和AWS从「测试用户」转化为「生产级客户」。62%营收依赖单一客户的结构必须改变,否则187倍市销率将难以维系。这不是一个「买不买」的问题,而是一个「什么时候买」的问题。

核心追踪信号:2026年Q3至Q4期间,如果Cerebras公布的客户营收占比中MBZUAI降至40%以下且北美头部AI公司占比升至30%以上,将是客户结构改善的确认信号。同步关注英伟达5月20日财报中对竞争格局的措辞变化——如果首次在风险披露中具名提及Cerebras,意味着王座上的玩家已经感受到了压力。

── 投黑马研究团队