<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	xmlns:media="http://search.yahoo.com/mrss/" >

<channel>
	<title>英伟达 &#8211; 投黑马</title>
	<atom:link href="https://touheima.com/tag/%E8%8B%B1%E4%BC%9F%E8%BE%BE/feed/" rel="self" type="application/rss+xml" />
	<link>https://touheima.com</link>
	<description>AI 时代的左侧研究机构</description>
	<lastBuildDate>Mon, 01 Jun 2026 08:17:20 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=7.0</generator>

<image>
	<url>https://touheima.com/wp-content/uploads/2023/12/Touheima-icon-1-150x150.png</url>
	<title>英伟达 &#8211; 投黑马</title>
	<link>https://touheima.com</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>英伟达杀入PC市场；GitHub Copilot今日起按量收费；软银750亿欧元押注法国AI &#124; 马上知道</title>
		<link>https://touheima.com/firstknow-20260601-nvidia-rtx-spark/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Mon, 01 Jun 2026 07:57:16 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI基础设施]]></category>
		<category><![CDATA[AI芯片]]></category>
		<category><![CDATA[GitHub]]></category>
		<category><![CDATA[SpaceX]]></category>
		<category><![CDATA[一级市场]]></category>
		<category><![CDATA[宇树科技]]></category>
		<category><![CDATA[机器人]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[软银]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=2133</guid>

					<description><![CDATA[英伟达RTX Spark超级芯片杀入PC市场，128GB内存让笔记本本地跑大模型；GitHub Copilot今日取消固定月费改按Token收费，开发者社区炸锅；软银750亿欧元押注法国建欧洲最大AI算力集群。10条科技商业硬新闻，左侧信号一网打尽。]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><a href="https://touheima.com/firstknow_list/">马上知道</a> / 2026年6月1日 / 阅读时间约8分钟</p>



<h2 class="wp-block-heading">AI &amp; 一级市场</h2>



<h3 class="wp-block-heading">英伟达发布RTX Spark超级芯片，ARM架构正式杀入PC战场</h3>



<p class="wp-block-paragraph">5月31日，英伟达CEO黄仁勋在台北Computex大会上发布RTX Spark超级芯片，宣布正式进军个人电脑市场。</p>



<p class="wp-block-paragraph">这颗芯片采用双芯粒设计，集成20核ARM CPU（10颗Cortex-X925性能核+10颗A725能效核）与Blackwell架构GPU（6144个CUDA核心），支持最高128GB LPDDR5X统一内存，带宽达300GB/s。芯片由台积电3nm工艺制造，联发科负责CPU与I/O芯粒设计。</p>



<p class="wp-block-paragraph">微软、戴尔、惠普、华硕、联想、MSI等厂商将于今年秋季首批推出超过30款笔记本和10款台式机。黄仁勋称这将开启「PC的新时代」——让Windows电脑具备本地运行AI智能体的能力。（据企业官方公告）</p>



<figure class="wp-block-image size-large"><img fetchpriority="high" decoding="async" width="1024" height="572" src="https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-1024x572.webp" alt="英伟达RTX Spark超级芯片产品特写" class="wp-image-2131" srcset="https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-1024x572.webp 1024w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-300x167.webp 300w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-768x429.webp 768w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-1536x857.webp 1536w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-nvidia-rtx-spark-cover2-2048x1143.webp 2048w" sizes="(max-width: 1024px) 100vw, 1024px" /><figcaption class="wp-element-caption">RTX Spark采用双芯粒架构，集成ARM CPU与Blackwell GPU</figcaption></figure>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>英伟达从数据中心向消费端的这一步，本质是把AI推理能力从云端拉回终端。128GB统一内存意味着本地可以跑百亿参数模型——这直接威胁到云端推理的商业模式。对一级市场而言，端侧AI芯片、本地模型优化、隐私计算这三条创业赛道的窗口正在同时打开。高通和苹果的护城河，从今天起要重新评估了。</p>
</blockquote>



<h3 class="wp-block-heading">软银豪掷750亿欧元，在法国建欧洲最大AI算力集群</h3>



<p class="wp-block-paragraph">5月31日，软银集团宣布将在未来数年投资最高750亿欧元（约合人民币5900亿元），在法国北部建设总容量达5吉瓦的AI数据中心群。</p>



<p class="wp-block-paragraph">首期项目投资450亿欧元，计划2031年前在上法兰西大区三个地点（敦刻尔克、博斯凯勒、布尚）建成3.1吉瓦算力容量。软银还将与施耐德电气合作建设AI基础设施与机器人制造中心。作为OpenAI的重要投资方，这是软银在欧洲规模最大的一笔AI基础设施投入。（据多家媒体报道）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>孙正义押注的逻辑很清晰：全球AI算力需求远超当前供给，谁先把电力变成Token谁就掌握下一个十年的基础设施税。750亿欧元砸下去，法国北部将变成欧洲AI的「水电站」。对早期投资者的启示是：围绕超大规模数据中心的配套生态——冷却技术、电力调度、光模块——将在未来18个月迎来密集订单。</p>
</blockquote>



<h3 class="wp-block-heading">宇树科技获英伟达选为人形机器人研究平台首个合作方</h3>



<p class="wp-block-paragraph">6月1日，英伟达宣布选定中国人形机器人公司宇树科技（Unitree），作为其首款面向研究机构销售的机器人系统平台。</p>



<p class="wp-block-paragraph">这套系统将提供给斯坦福大学、苏黎世联邦理工学院等全球顶尖实验室使用。宇树此前已是日本航空在羽田机场部署人形机器人的供应商，单台成本约1.54万美元。据悉宇树正在筹备IPO。（据多家媒体报道）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>英伟达为宇树背书的信号远比一单硬件生意重要——这意味着宇树的硬件将成为全球机器人研究的「标准实验器材」，类似当年Arduino对创客生态的意义。当一家中国公司成为全球机器人研究的默认平台时，围绕它的软件生态、零部件供应链和应用开发机会才是一级市场应该关注的。</p>
</blockquote>



<h3 class="wp-block-heading">SpaceX AI冲刺1.75万亿美元IPO，下周启动路演</h3>



<p class="wp-block-paragraph"><a href="https://touheima.com/radar-20260521-spacex-ipo/">SpaceX</a> AI（SpaceX与xAI合并后的新实体）确认将于6月12日在纳斯达克挂牌，股票代码SPCX，计划融资约750亿美元，目标估值1.75万亿美元——将成为人类历史上规模最大的IPO。</p>



<p class="wp-block-paragraph">路演将于6月4日正式启动，6月11日定价。不过马斯克近日在X平台的发言与招股书内容出现矛盾——他称SpaceX与Anthropic的算力租赁协议仅为180天短约，而招股书中并未披露此细节，引发市场对信息透明度的担忧。（据公开市场信息）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>1.75万亿估值的底层假设是：火箭发射+卫星通信+AI大模型+社交平台形成闭环飞轮。但马斯克在社交媒体上随口「补充」招股书信息的做法，恰恰暴露了这家公司治理结构的最大风险。对一级市场而言，真正值得关注的不是SPCX本身，而是这笔IPO如果成功，将为私募市场中的AI+硬科技公司重新定锚估值天花板。</p>
</blockquote>



<h2 class="wp-block-heading">科技商业</h2>



<h3 class="wp-block-heading">GitHub Copilot今日取消固定月费，按Token计量引发开发者反弹</h3>



<p class="wp-block-paragraph">6月1日，GitHub正式将Copilot所有付费计划从固定月费切换为基于Token消耗的「AI Credits」计费模式。</p>



<p class="wp-block-paragraph">各档月费不变（Pro 10美元、Pro+ 39美元、Business 19美元/人、Enterprise 39美元/人），但对应的不再是「无限使用」而是等值的AI Credits额度（1 Credit = 0.01美元）。代码补全和Next Edit建议仍免费，但智能体编程（Agentic Coding）会大量消耗Credits。社区反馈显示，一次深度Agentic编程会话可消耗30-40美元——Pro用户的月度额度一次用完。官方公告帖收到900多个踩和400多条抗议评论。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>微软这步棋的真实意图是筛选用户：用免费补全留住长尾开发者保市占率，用按量付费从重度AI编程用户身上收割利润。但反过来看，这也给开源替代方案（Cursor、Continue、Cody）打开了一个巨大的获客窗口——当老大开始涨价时，正是挑战者融资的最佳时机。</p>
</blockquote>



<h3 class="wp-block-heading">台积电3nm核心负责人达博辞职归国，加盟中科大</h3>



<p class="wp-block-paragraph">5月29日，曾主导台积电日本3nm量产线相关技术的中国科学家达博，正式辞去日本国立材料研究所（NIMS）终身教职，带领整建制团队全职回国，加盟中国科学技术大学担任讲席教授。</p>



<p class="wp-block-paragraph">达博是甘肃人，中科大本硕博九年，2013年赴日研究，在NIMS仅一年即获终身教职，成为该机构史上最年轻终身学者。他在电子束利用率领域的突破性成果被日本学界评为「具有与准晶发现相当的原创性意义」。辞职前，设备厂商泛林曾提出无偿捐赠支持，仍未能挽留。（据多家媒体报道）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>比一个人回来更值得注意的是「整建制团队」回来——这意味着一条完整的技术能力链条在迁移，不只是一颗种子。电子束光刻恰好是EUV之后的下一代候选方案之一。对早期投资者而言，这类顶尖人才归国往往预示着12-18个月后会出现相关方向的天使轮项目。</p>
</blockquote>



<h3 class="wp-block-heading">神舟二十一号航天员平安抵京，在轨210天刷新中国纪录</h3>



<p class="wp-block-paragraph">5月30日，神舟二十一号乘组航天员张陆、武飞、张洪章乘飞机平安抵达北京，进入隔离恢复期。</p>



<p class="wp-block-paragraph">三人于2025年11月1日进驻中国空间站，在轨驻留210天，刷新中国航天员单乘组在轨最长纪录。任务期间完成3次出舱活动，其中张陆成为目前出舱次数最多的中国航天员。他们搭乘的是神舟二十二号飞船返回舱，5月29日晚在东风着陆场成功着陆。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>210天驻留对商业航天的意义在于：验证了中国空间站长期载人运营的可靠性，这是未来开放商业载荷和太空旅游的技术前提。随着空间站进入常态化运营阶段，围绕微重力实验、在轨制造和天地往返运输的商业航天创业公司，正在从「概念期」进入「客户验证期」。</p>
</blockquote>



<h3 class="wp-block-heading">2026智博会天津收官：364项合作落地，具身智能首次独立成馆</h3>



<p class="wp-block-paragraph">5月31日，2026世界智能产业博览会在天津国家会展中心闭幕。为期四天的展会汇聚超过700家企业，达成合作意向364项，发布248项新成果（其中54%为全球或全国首发）。</p>



<p class="wp-block-paragraph">最大亮点是具身智能首次独立设馆——80多家国内外企业展示近150种机器人设备，搭建「机器人小镇」覆盖生产、商业、娱乐、家庭、养老五大场景。上海创智学院在闭幕日发布开源具身世界模型τ₀-WM，让机器人具备「行动前预演」能力。（据多家媒体报道）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>具身智能从「AI分论坛的一个议题」升级为「独立展馆」，这个信号比任何融资新闻都更能说明产业节奏。150种机器人同台竞技的背后是：通用本体硬件已不再是瓶颈，竞争正在向「谁的世界模型更好」转移。τ₀-WM的开源意味着创业公司可以跳过世界模型从零训练的阶段，直接在应用层创新。</p>
</blockquote>



<h3 class="wp-block-heading">AMD Computex多线出击：AM5承诺支持到2029</h3>



<p class="wp-block-paragraph">5月31日，AMD在Computex上宣布多项产品更新，最重要的战略信号是确认AM5平台将支持到2029年，保障用户投资不打水漂。</p>



<p class="wp-block-paragraph">新品方面，发布Ryzen 7 5800X3D十周年纪念版（6月25日上市，349美元）、AM5平台的Ryzen 7 7700X3D（7月16日，329美元），以及全球发售的Radeon RX 9070 GRE显卡。同时推出EXPO Ultra Low Latency内存标准，游戏帧率平均提升4%。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>「AM5支持到2029」这句话看似面向消费者，实则是对整个PC生态链的定心丸——主板厂商敢备料、内存厂商敢适配、OEM敢做长周期规划。在英伟达ARM芯片即将搅局PC市场的当口，AMD选择用平台稳定性来守住x86阵地。这场ARM vs x86的PC大战，2027年才会见分晓。</p>
</blockquote>



<h2 class="wp-block-heading">轻松一刻</h2>



<h3 class="wp-block-heading">谷歌要在东京表参道开店，跑去和苹果做邻居</h3>



<p class="wp-block-paragraph">6月1日，谷歌宣布今年夏天将在东京表参道开设全球首家美国以外的直营零售店——Google Store表参道。</p>



<p class="wp-block-paragraph">店面位于东急Plaza表参道「Omokado」一楼，距离苹果表参道店步行仅几分钟。店内将展示和销售Pixel手机、Nest智能家居、Fitbit等全线硬件产品，还能作为网购自提点。日本是谷歌设立海外办公室的第一个国家，选址表参道显然是要在苹果的「主场」插旗。（据企业官方公告）</p>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="765" src="https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-1024x765.webp" alt="东京表参道林荫道上相邻的谷歌和苹果零售店 标题：表参道上的新邻居" class="wp-image-2130" srcset="https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-1024x765.webp 1024w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-300x224.webp 300w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-768x573.webp 768w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-1536x1147.webp 1536w, https://touheima.com/wp-content/uploads/2026/06/firstknow-20260601-google-store-tokyo-ghibli-2048x1529.webp 2048w" sizes="(max-width: 1024px) 100vw, 1024px" /><figcaption class="wp-element-caption">谷歌在东京表参道开设美国以外首家直营店，与苹果做邻居</figcaption></figure>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>谷歌选在苹果隔壁开店这件事本身就很有喜感——像是优等生转学后非要坐在班长旁边。但认真说，硬件直营店是谷歌从「服务公司」转型「生态公司」的信号，Pixel+Nest+Fitbit需要一个让消费者「摸得到」的场景。</p>
</blockquote>



<h2 class="wp-block-heading">今日左侧信号</h2>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>信号</strong>：端侧AI算力从「够用就好」跃迁到「本地跑大模型」</p>



<p class="wp-block-paragraph"><strong>追踪方向</strong>：英伟达RTX Spark的128GB统一内存让PC本地运行百亿参数模型成为现实，叠加GitHub Copilot涨价推动开发者回归本地工具——端侧AI推理芯片、模型压缩/量化技术、隐私优先的本地AI应用三条赛道即将进入密集融资期。建议深挖 → <a href="https://touheima.com/signal-20260405-q1-vc-record-ai-capital-concentration/">前沿信号</a></p>
</blockquote>



<p class="has-text-align-right wp-block-paragraph"><strong>── 投黑马研究团队</strong></p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Cerebras上市：AI芯片多元化的「诺曼底时刻」来了吗？【黑马雷达 第008期】</title>
		<link>https://touheima.com/radar-20260515-ai-chip-cerebras/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Tue, 19 May 2026 06:59:30 +0000</pubDate>
				<category><![CDATA[黑马雷达]]></category>
		<category><![CDATA[AI芯片]]></category>
		<category><![CDATA[AMD]]></category>
		<category><![CDATA[Cerebras]]></category>
		<category><![CDATA[CUDA]]></category>
		<category><![CDATA[Groq]]></category>
		<category><![CDATA[IPO]]></category>
		<category><![CDATA[WSE]]></category>
		<category><![CDATA[先进封装]]></category>
		<category><![CDATA[左侧布局]]></category>
		<category><![CDATA[推理加速]]></category>
		<category><![CDATA[芯片多元化]]></category>
		<category><![CDATA[英伟达]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=2105</guid>

					<description><![CDATA[AI芯片赛道正在经历结构性转折。Cerebras以187倍市销率登陆纳斯达克，首日暴涨68%，20倍超额认购——资本市场用真金白银投票：我们需要「不是英伟达」的选择。谁在赢？谁被低估？布局窗口还有多久？
]]></description>
										<content:encoded><![CDATA[
<h2 class="wp-block-heading">一、为什么现在是关键窗口</h2>



<p class="wp-block-paragraph">AI芯片赛道正在经历一个被大多数人低估的结构性转折——不是某家公司变强了，而是整个供应链的权力结构开始松动。</p>



<p class="wp-block-paragraph">2026年5月14日，Cerebras Systems在纳斯达克敲响上市钟声。开盘价350美元，盘中一度触及385美元高点，相比发行价185美元上涨108%。最终收于311.07美元，首日涨幅68%。这是2019年Uber以来美国科技圈最大规模的IPO，通过出售3000万股，合计募资约55.5亿美元。</p>



<p class="wp-block-paragraph">但真正值得关注的不是股价，而是这笔钱背后的信号。</p>



<p class="wp-block-paragraph">IPO认购需求超过可用股票的20倍以上，原本150至160美元的预期发行区间被直接击穿，最终定价185美元。资本市场用真金白银投了一张票：我们需要「不是英伟达」的AI芯片选择。</p>



<p class="wp-block-paragraph">过去两年，全球AI算力的押注高度集中——集中在英伟达，集中在H100和B200的订单排队上。这种集中带来了效率，也制造了风险。如果把今天的AI军备竞赛比作一场大战，英伟达就是那条几乎垄断了全部弹药供应的后勤线。所有人都依赖它，所有人也都清楚，这种依赖有多危险。</p>



<p class="wp-block-paragraph">于是，一场寻找「第二条补给线」的行动，一直在暗中推进。Cerebras的上市，是这场行动浮出水面的标志性事件。</p>



<h2 class="wp-block-heading">二、核心变量：一张「不像芯片」的芯片，重新定义AI算力的几何形状</h2>



<p class="wp-block-paragraph">要理解Cerebras为什么能在IPO市场掀起如此大的骚动，得先搞懂它到底造了什么。</p>



<p class="wp-block-paragraph">英伟达的GPU，无论多么强大，本质上还是一枚「小」芯片——多块芯片通过高速互联组成集群，协同完成大模型的训练和推理任务。这套架构在过去十年里统治了整个行业，但它有一个天生的短板：芯片之间的数据通信延迟，在处理超大规模模型时，会成为一个无法忽视的瓶颈。</p>



<p class="wp-block-paragraph">Cerebras的创始人Andrew Feldman不是第一次做这种「架构级别的异见者」。2010年代初，他在SeaMicro就论证过，当时流行的服务器架构对互联网工作负载来说「几何形状就是错的」——事实证明他是对的，AMD最终以超过3.34亿美元收购了SeaMicro。</p>



<p class="wp-block-paragraph">这一次，Feldman把同样的逻辑用在了AI芯片上。</p>



<p class="wp-block-paragraph">Cerebras的核心产品是WSE（Wafer Scale Engine），一块和整片晶圆一样大的芯片。没有多块芯片互联，没有通信延迟，神经网络的所有计算在同一块硅片上完成。Cerebras声称，其推理速度比「领先的基于GPU的方案」快15倍。</p>



<p class="wp-block-paragraph">这里的核心变量不是「快多少」，而是「架构层面的范式差异」。</p>



<p class="wp-block-paragraph">传统GPU集群的扩展逻辑是「加更多芯片」——但每加一块，通信开销就多一分，性能提升的边际效益递减。WSE的逻辑完全不同：把所有计算单元放在同一块硅片上，数据在片上流动，延迟降低几个数量级。这不是改良，而是重写了AI算力的基本几何形状。</p>



<p class="wp-block-paragraph">伊利诺伊大学香槟分校教授Deming Chen给出了一个冷静的注脚：「较小的芯片对大多数用例仍然更实用，更便宜、更灵活、更容易扩展。Cerebras在某些工作负载中表现出色，但它不会替代一切。」</p>



<p class="wp-block-paragraph">这句话恰恰点明了WSE的战略定位——它不是要取代GPU，而是在GPU力不从心的场景里开辟第二战场。当推理工作负载持续爆炸式增长（多家机构预测2027年推理算力需求将超过训练算力），WSE的「零通信延迟」优势将从技术亮点变成商业刚需。</p>



<p class="wp-block-paragraph">投黑马认为，AI芯片赛道正在从「单一架构统治」走向「多架构并存」，而推理场景的爆发是驱动这一转折的核心变量。</p>



<h2 class="wp-block-heading">三、竞争格局分析</h2>



<p class="wp-block-paragraph">AI芯片的竞争从来不只是硅片之间的比拼，更是生态、客户关系和路径依赖的博弈。当前格局中，六个玩家的卡位逻辑正在分化。</p>



<p class="wp-block-paragraph"><strong>英伟达：不可撼动的王座，但护城河的性质正在改变</strong></p>



<p class="wp-block-paragraph">英伟达的统治力无需赘述。5月20日即将发布的2027财年第一季度财报，市场预计当季营收约780亿美元，同比增长约75%。但更值得关注的是英伟达护城河的本质——不是芯片性能，而是CUDA软件生态。全球数百万开发者、数十万个开源项目、整个深度学习框架栈都绑定在CUDA上。这是十五年积累的成果，不是靠一张更快的芯片就能填平的。</p>



<p class="wp-block-paragraph">护城河：CUDA生态的锁定效应，加上全链条产品矩阵（训练+推理+网络互联），让客户的迁移成本极高。</p>



<p class="wp-block-paragraph">隐患：估值已经充分反映了垄断溢价（市销率约25倍）。一旦「非英伟达」选项在生产级部署中被验证可行，溢价回调的空间不可忽视。更深层的风险在于，当大客户（如OpenAI、谷歌、亚马逊）同时推进自研芯片时，英伟达的议价权正在被逐步稀释。</p>



<p class="wp-block-paragraph">投黑马判断：短期内无可替代，但中长期面临「生态解绑」的慢性压力。</p>



<p class="wp-block-paragraph"><strong>Cerebras：架构异见者的生产级大考</strong></p>



<p class="wp-block-paragraph">Cerebras的技术差异化已经得到市场认可——首日68%的涨幅就是证据。但技术差异化和商业化规模之间，还隔着一条巨大的鸿沟。</p>



<p class="wp-block-paragraph">护城河：WSE架构在推理延迟上的物理优势是结构性的，竞争对手无法通过软件优化抹平。客户名单已出现OpenAI和AWS等重量级名字。</p>



<p class="wp-block-paragraph">隐患：客户集中风险刺眼。根据S-1招股说明书，阿联酋穆罕默德·本·扎耶德人工智能大学（MBZUAI）一家贡献了62%的营收，占应收账款的77.9%。187倍的市销率对比英伟达的25倍，不是贵一点，是贵了将近八倍。Motley Fool分析师说得很直接：「我会谨慎劝阻投资者立即跳进。」</p>



<p class="wp-block-paragraph">投黑马判断：技术逻辑成立，但从「备胎测试」到「生产级部署」的跨越尚未完成，这是未来两年的核心观察点。</p>



<p class="wp-block-paragraph"><strong>AMD：老二的逆袭窗口</strong></p>



<p class="wp-block-paragraph">AMD今年以来涨幅已超过94%，这不是偶然。MI300X在推理性价比上的表现让大客户多了一个真实的选项，而ROCm软件栈的持续改进正在降低从CUDA迁移的门槛。</p>



<p class="wp-block-paragraph">护城河：x86 CPU+GPU的全栈整合能力，加上与大型云厂商的深度合作关系。</p>



<p class="wp-block-paragraph">隐患：软件生态仍然是短板。ROCm的成熟度与CUDA差距明显，开发者社区的规模不在一个量级。如果不能在两年内让ROCm达到「够用」的临界点，硬件性价比的优势将被软件摩擦力抵消。</p>



<p class="wp-block-paragraph">投黑马判断：最现实的「第二选择」，但成败系于软件生态的追赶速度。</p>



<p class="wp-block-paragraph"><strong>英特尔：涅槃重生还是回光返照？</strong></p>



<p class="wp-block-paragraph">英特尔同期涨幅高达218%，市场押注的是Gaudi系列AI加速器和代工业务的双重转型。新任CEO的激进重组给市场注入了信心，但执行力仍需验证。</p>



<p class="wp-block-paragraph">护城河：制造能力（如果代工转型成功）和企业级市场的渠道积累。</p>



<p class="wp-block-paragraph">隐患：多线作战消耗巨大，AI加速器、CPU业务、代工业务三条战线同时烧钱。历史上多次战略转型未能兑现的记忆，让机构投资者的耐心有限。</p>



<p class="wp-block-paragraph">投黑马判断：高赔率但高风险的赌注，适合配置型投资者而非集中押注。</p>



<p class="wp-block-paragraph"><strong>Groq：推理专用芯片的另一种可能</strong></p>



<p class="wp-block-paragraph">Groq的LPU（Language Processing Unit）走的是和Cerebras不同的推理加速路线——不是做大芯片，而是用全新的确定性计算架构消除GPU推理中的内存瓶颈。其公开演示的推理速度令人印象深刻，每秒输出token数远超传统GPU方案。</p>



<p class="wp-block-paragraph">护城河：架构层面的延迟优势和确定性调度带来的能效比。</p>



<p class="wp-block-paragraph">隐患：产能受限，目前仍依赖云端API服务模式，尚未大规模出货物理芯片。商业模式能否从「演示级惊艳」过渡到「生产级可靠」，仍是未知数。</p>



<p class="wp-block-paragraph">投黑马判断：值得持续追踪的非共识标的，但当前阶段更适合观察而非重仓。</p>



<p class="wp-block-paragraph"><strong>云厂商自研芯片（谷歌TPU / 亚马逊Trainium / 微软Maia）</strong></p>



<p class="wp-block-paragraph">大客户自研芯片是英伟达最大的长期威胁。谷歌TPU已经迭代到第六代，亚马逊Trainium 2正在全面铺开，微软Maia首批芯片已进入自有数据中心。</p>



<p class="wp-block-paragraph">护城河：自研芯片与自有云平台深度绑定，优化空间远超通用方案。</p>



<p class="wp-block-paragraph">隐患：自研芯片通常只服务内部工作负载，不具备外部生态效应。如果无法吸引第三方开发者，其影响力将被限制在「降低自身成本」的层面。</p>



<p class="wp-block-paragraph">投黑马判断：不是直接投资标的，但其进展速度是衡量英伟达护城河侵蚀程度的关键指标。</p>



<h2 class="wp-block-heading">四、被市场低估的早期机会</h2>



<p class="wp-block-paragraph">Cerebras的IPO不是一个孤立事件，而是AI芯片多元化浪潮的序章。以下三个方向是投黑马判断中被市场显著低估的左侧机会。</p>



<p class="wp-block-paragraph"><strong>机会一：AI推理优化中间件</strong></p>



<p class="wp-block-paragraph">核心逻辑：当AI芯片从「英伟达一家独大」走向「多架构并存」时，企业面临的核心痛点不是「选哪家芯片」，而是「如何在不同芯片之间高效调度推理工作负载」。一个大模型可能在英伟达GPU上训练，在Cerebras WSE上做批量推理，在Groq LPU上做实时推理——这需要一个跨架构的推理编排层。</p>



<p class="wp-block-paragraph">三层过滤：需求真实（多架构部署已是大客户的既定路线）+ 当前方案稀缺（现有方案高度绑定单一架构）+ 认知差显著（市场关注芯片本身，忽略了中间件的平台价值）。</p>



<p class="wp-block-paragraph">追踪信号：如果2026年下半年出现获得A轮以上融资的独立推理编排平台公司，说明机会正在兑现。关注开源社区中跨架构推理框架（如vLLM、TensorRT-LLM的多后端支持）的贡献者活跃度。</p>



<p class="wp-block-paragraph"><strong>机会二：晶圆级封装与先进封装技术</strong></p>



<p class="wp-block-paragraph">核心逻辑：Cerebras的WSE证明了一件事——芯片的物理尺寸限制正在被突破。无论是WSE的整片晶圆方案，还是英伟达、AMD采用的Chiplet多芯粒封装路线，先进封装技术都是AI芯片性能跃升的关键瓶颈。台积电的CoWoS产能已经排到2027年，这个供需缺口不会短期消失。</p>



<p class="wp-block-paragraph">三层过滤：需求真实（所有AI芯片公司都在争抢封装产能）+ 当前方案稀缺（全球先进封装产能高度集中）+ 认知差显著（市场关注芯片设计公司的估值，低估了封装环节的战略价值）。</p>



<p class="wp-block-paragraph">追踪信号：关注封装设备龙头的订单增速（如ASMPT、Besi）、非台积电封装产能的扩建公告、以及Chiplet标准化组织UCIe的成员扩展情况。</p>



<p class="wp-block-paragraph"><strong>机会三：AI芯片的垂直行业定制化</strong></p>



<p class="wp-block-paragraph">核心逻辑：当通用AI芯片的军备竞赛越打越贵，一条被忽略的路线正在浮现——为特定垂直行业（自动驾驶、机器人、边缘推理）定制专用芯片。通用大芯片追求的是「什么都能做」，但垂直行业要的是「做这一件事做到极致且功耗最低」。这是一个完全不同的价值主张。</p>



<p class="wp-block-paragraph">三层过滤：需求真实（自动驾驶和机器人领域对低功耗实时推理的需求正在爆发）+ 当前方案稀缺（大多数边缘AI芯片仍是通用架构的缩小版，非原生定制）+ 认知差显著（市场聚焦数据中心大芯片，忽略了边缘垂直芯片的长尾市场规模）。</p>



<p class="wp-block-paragraph">追踪信号：关注地平线、爱芯元智等边缘AI芯片公司的新一轮融资和设计导入（Design Win）公告；关注英伟达Jetson产品线是否出现被垂直专用芯片替代的案例。</p>



<h2 class="wp-block-heading">五、关键变量追踪</h2>



<p class="wp-block-paragraph"><strong>变量一：非英伟达芯片的生产级部署进展</strong></p>



<p class="wp-block-paragraph">Cerebras的WSE、AMD的MI300X、Groq的LPU——目前都有客户在测试，但「测试」和「大规模生产部署」之间有本质区别。</p>



<p class="wp-block-paragraph">可观测信号①：关注OpenAI、Anthropic等头部模型公司是否在财报或公开声明中披露「非英伟达芯片」的推理算力占比。一旦这个数字从个位数跳到两位数，就是格局变化的确认信号。</p>



<p class="wp-block-paragraph">可观测信号②：关注AWS、Azure、GCP三大云平台上，基于非英伟达芯片的推理实例（如AWS的Trainium实例）的定价变化和客户采用数据。价格战的启动意味着非英伟达方案已经具备规模化竞争力。</p>



<p class="wp-block-paragraph"><strong>变量二：推理算力需求的增长斜率</strong></p>



<p class="wp-block-paragraph">AI的商业化落地正在从「训练为王」转向「推理为王」。每一次用户调用ChatGPT、每一次Agent执行任务、每一次AI实时处理视频流，消耗的都是推理算力。如果推理需求的增长斜率持续陡峭，那么WSE这类推理优化架构的价值窗口就会持续打开。</p>



<p class="wp-block-paragraph">可观测信号①：关注主要AI应用（ChatGPT、Claude、Gemini）的用户量和调用频次增长数据。月活用户翻倍意味着推理算力需求可能是四倍增长（考虑Agent等复杂场景）。</p>



<p class="wp-block-paragraph">可观测信号②：关注推理芯片的ASP（平均售价）趋势。如果推理芯片的单位价格持续上升而非下降，说明需求远超供给，芯片公司拥有定价权。</p>



<p class="wp-block-paragraph"><strong>变量三：CUDA生态的解绑速度</strong></p>



<p class="wp-block-paragraph">英伟达护城河的本质是软件生态锁定。如果开源社区和竞争对手能够加速CUDA的替代方案（如OpenAI的Triton、AMD的ROCm、谷歌的XLA），那么芯片之间的竞争将更多回归硬件性能和性价比本身。</p>



<p class="wp-block-paragraph">可观测信号①：关注PyTorch和JAX框架中，非CUDA后端的PR合并数量和CI测试覆盖率。这是生态解绑最直接的度量指标。</p>



<p class="wp-block-paragraph">可观测信号②：关注Hugging Face模型库中明确标注「支持非CUDA推理」的模型比例变化。当这个比例从不足5%增长到20%以上时，生态解绑进入实质阶段。</p>



<p class="wp-block-paragraph"><strong>三变量联动逻辑：</strong> 推理需求爆发（变量二）→ 催生多架构部署的商业动力（变量一）→ 加速CUDA生态解绑（变量三）→ 进一步降低非英伟达芯片的采用门槛 → 推理需求的增长被更多架构承接 → 飞轮加速。这个飞轮一旦转起来，AI芯片赛道的竞争格局将不可逆地走向多元化。</p>



<h2 class="wp-block-heading has-text-align-center">投黑马 · 独家评级</h2>



<pre class="wp-block-code"><code>赛道热度：&#x1f525;&#x1f525;&#x1f525;&#x1f525;&#x1f525;　　Cerebras首日68%涨幅+20倍超额认购，市场对AI芯片多元化的渴望已无法忽视
左侧机会：&#x2b50;&#x2b50;&#x2b50;&#x2b50;　　　　非英伟达架构的生产级验证尚未完成，仍处于左侧布局的黄金窗口
布局紧迫度：&#x26a1;&#x26a1;&#x26a1;&#x26a1;&#x26a1;　　下半年SpaceX/OpenAI/Anthropic排队上市将虹吸市场注意力，AI芯片多元化标的的定价窗口正在收窄

推荐关注层次：
AI推理优化中间件 ＞ 先进封装产业链 ＞ 垂直行业定制芯片</code></pre>



<h2 class="wp-block-heading">七、分层布局建议</h2>



<p class="wp-block-paragraph"><strong>第一层：低风险·长周期——AI芯片基础设施层</strong></p>



<p class="wp-block-paragraph">投资逻辑：无论哪家芯片公司最终胜出，先进封装、EDA工具、半导体设备都是「卖铲子」的确定性受益者。AI芯片竞争越激烈，基础设施层的需求越旺盛。</p>



<p class="wp-block-paragraph">选股标准：在先进封装（CoWoS/Chiplet）或EDA领域拥有技术壁垒，且客户覆盖多家AI芯片公司（非单一客户依赖）的企业。</p>



<p class="wp-block-paragraph">时间窗口：2026年下半年至2028年，先进封装产能缺口预计持续存在，设备订单的确定性最高。</p>



<p class="wp-block-paragraph"><strong>第二层：中风险·中周期——非英伟达AI芯片的头部玩家</strong></p>



<p class="wp-block-paragraph">投资逻辑：AMD、Cerebras、Groq等公司的命运取决于一个核心问题——非英伟达芯片能否在2027年底前占据推理市场10%以上的份额。如果答案是肯定的，当前估值（尤其是AMD）仍有显著上行空间。</p>



<p class="wp-block-paragraph">选股标准：已获得至少两家头部AI公司（如OpenAI、谷歌、Meta、亚马逊）的生产级部署或明确采购意向，且软件生态建设有可量化进展。</p>



<p class="wp-block-paragraph">时间窗口：2026年Q3至2027年Q2，关键验证期。英伟达5月20日财报和各竞争对手的年中客户进展披露将是密集催化剂窗口。</p>



<p class="wp-block-paragraph"><strong>第三层：高风险·短周期——AI芯片赛道的非共识机会</strong></p>



<p class="wp-block-paragraph">投资逻辑：推理编排中间件、垂直行业定制芯片、以及尚未上市的芯片初创公司（如Groq、SambaNova、Tenstorrent），代表着市场尚未充分定价的非共识方向。高赔率但高波动，适合小仓位配置。</p>



<p class="wp-block-paragraph">选股标准：技术路线与英伟达GPU架构有本质差异（非改良型），且有至少一个可验证的商业化场景（哪怕规模尚小）。</p>



<p class="wp-block-paragraph">时间窗口：2026年下半年IPO窗口期是关键——如果Cerebras之后有更多AI芯片公司上市，市场的定价锚将被迅速重塑。</p>



<p class="wp-block-paragraph"><strong>风险披露</strong></p>



<p class="wp-block-paragraph">风险一：英伟达护城河被低估。如果CUDA生态的锁定效应比预期更强，非英伟达芯片的采用速度将大幅放缓，Cerebras等公司的估值面临回调。影响第二、三层。概率：中等偏高。</p>



<p class="wp-block-paragraph">风险二：推理需求增长不及预期。如果AI应用的商业化落地速度放缓（用户增长见顶、企业采购预算收紧），推理算力需求的增长斜率将趋缓，WSE等推理优化架构的价值窗口可能延后打开。影响全部三层。概率：中等。</p>



<p class="wp-block-paragraph">风险三：客户集中风险引发连锁反应。Cerebras 62%营收依赖单一客户的结构性风险如果兑现（大客户缩减订单或延迟付款），不仅冲击Cerebras自身，还可能让市场对整个「非英伟达」叙事产生信任危机。影响第二、三层。概率：低但影响大。</p>



<p class="wp-block-paragraph">风险四：半导体周期性下行。AI芯片目前处于超级上行周期，但半导体行业的周期性从未消失。如果宏观经济衰退导致企业IT支出全面收缩，即使AI需求仍在增长，芯片公司的估值也会承受系统性压力。影响全部三层。概率：低，但不可忽视。</p>



<p class="wp-block-paragraph"><strong>结语</strong></p>



<p class="wp-block-paragraph">历史上，没有任何一个技术平台能永远保持垄断。英伟达不是第一个，也不会是最后一个被挑战者盯上的王座。Cerebras在纳斯达克敲响的钟声，不一定是英伟达的噩梦，但一定是AI芯片生态走向多元化的起点。对于左侧投资者而言，当所有人都在找「第二张牌」的时候，真正的机会不在那张牌本身——而在发牌的过程中。</p>



<h2 class="wp-block-heading has-text-align-center">投黑马 · 信号解读</h2>



<pre class="wp-block-code"><code>Cerebras以187倍市销率登陆纳斯达克，定价逻辑已超越传统估值框架——市场买的不是当前营收，而是AI芯片格局从「一超独霸」走向「多架构并存」的期权价值。这与2000年代初AMD挑战英特尔时的市场情绪高度相似，区别在于这一次的赛道天花板高出几个数量级。

投黑马提醒：Cerebras的成败取决于能否在未来18个月内将OpenAI和AWS从「测试用户」转化为「生产级客户」。62%营收依赖单一客户的结构必须改变，否则187倍市销率将难以维系。这不是一个「买不买」的问题，而是一个「什么时候买」的问题。

核心追踪信号：2026年Q3至Q4期间，如果Cerebras公布的客户营收占比中MBZUAI降至40%以下且北美头部AI公司占比升至30%以上，将是客户结构改善的确认信号。同步关注英伟达5月20日财报中对竞争格局的措辞变化——如果首次在风险披露中具名提及Cerebras，意味着王座上的玩家已经感受到了压力。</code></pre>



<p class="has-text-align-right wp-block-paragraph">── 投黑马研究团队</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>突发！黄仁勋最后一刻登上空军一号，英伟达释放了什么信号？</title>
		<link>https://touheima.com/firstknow-20260513-jensen-huang-air-force-one/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Wed, 13 May 2026 04:35:35 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI算力]]></category>
		<category><![CDATA[AI芯片]]></category>
		<category><![CDATA[H200]]></category>
		<category><![CDATA[Jensen Huang]]></category>
		<category><![CDATA[NVIDIA]]></category>
		<category><![CDATA[一级市场]]></category>
		<category><![CDATA[空军一号]]></category>
		<category><![CDATA[芯片出口]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=2066</guid>

					<description><![CDATA[英伟达CEO黄仁勋在最后一刻加入访华商业代表团，在专机经停阿拉斯加时被目击登机。此前名单中并无黄仁勋，行程反转引发行业对AI芯片出口前景的高度关注。
]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><a href="https://touheima.com/firstknow_list/">马上知道</a> / 2026年5月13日 / 阅读时间约3分钟</p>



<h2 class="wp-block-heading">黄仁勋临时加入访华商业代表团，阿拉斯加经停时登机</h2>



<p class="wp-block-paragraph">5月13日，英伟达CEO黄仁勋（Jensen Huang）在最后一刻加入了访华商业代表团。据现场媒体记者报道，黄仁勋在专机经停阿拉斯加安克雷奇期间被目击登机，这一消息迅速引发行业震动。</p>



<p class="wp-block-paragraph">此前公布的随访商界领袖名单中并未包含黄仁勋。直到5月12日晚间，名单上仍不见他的名字。据知情人士透露，黄仁勋在出发当天早上接到邀请电话后，随即飞往安克雷奇与代表团会合。</p>



<p class="wp-block-paragraph">英伟达在声明中表示：「Jensen是应邀出席峰会的，以支持美国和本届政府的目标。」白宫发言人Steven Cheung确认了黄仁勋的行程安排在最后时刻发生变化，并表示日程调整「刚好都能配合得上」。（据企业官方公告、据多家媒体报道）</p>



<p class="wp-block-paragraph">此前，黄仁勋缺席代表团一事曾引发行业广泛讨论，外界猜测可能与英伟达先进AI芯片的出口安排有关。过去一年，黄仁勋频繁与美国政府沟通，推动为AI产业发展扫清障碍，包括调整出口管制相关政策。据知情人士透露，随访高管均来自在中国拥有大量业务的企业，预计将参与此次访问的商业议程。（据多家媒体报道）</p>



<p class="wp-block-paragraph">去年12月，英伟达H200 AI芯片获准向中国出口，美方将从中收取25%的费用。但据美国商务部信息，由于中方企业尚未获准采购，实际出口尚未发生。与此同时，黄仁勋一直支持对更先进芯片维持出口限制，包括Blackwell处理器和即将推出的Vera Rubin系列。（据公开市场信息、据监管机构公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>从「缺席名单」到「深夜登机」，黄仁勋行程的戏剧性反转本身就是最值得解读的信号。随访高管均来自在华业务体量巨大的企业，商业议程指向明确。对一级市场而言，H200芯片出口一旦实际落地，中国AI算力产业链的供给格局将发生实质变化——从芯片分销到算力基础设施，多个环节的早期标的窗口可能同时打开。这通「最后一刻的电话」，比任何公开声明都更能说明英伟达在全球AI产业链中不可替代的战略权重。</p>
</blockquote>



<p class="has-text-align-right has-photology-brown-color has-text-color has-link-color wp-elements-33b0cb3772f2f6c2dbf91f5c02520ad5 wp-block-paragraph">── 投黑马研究团队</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>库克卸任苹果CEO特努斯9月接棒；OpenAI三高管出走Sora关停；Cursor估值冲500亿 &#124; 马上知道</title>
		<link>https://touheima.com/firstknow-20260421-openai-cursor/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Tue, 21 Apr 2026 01:04:49 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI编程工具]]></category>
		<category><![CDATA[Cursor]]></category>
		<category><![CDATA[Meta]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Snap]]></category>
		<category><![CDATA[人形机器人]]></category>
		<category><![CDATA[企业AI]]></category>
		<category><![CDATA[库克]]></category>
		<category><![CDATA[特努斯]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[苹果CEO]]></category>
		<category><![CDATA[量子计算]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1905</guid>

					<description><![CDATA[苹果CEO蒂姆·库克9月卸任，硬件工程高级副总裁特努斯接棒；OpenAI三高管同日离职Sora项目关停；AI编程工具Cursor估值冲500亿再融资；人形机器人半马冠军超越人类世界纪录。
]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><a href="https://touheima.com/firstknow_list/">马上知道</a> / 2026年4月21日 / 阅读时间约6分钟</p>



<h2 class="wp-block-heading">AI &amp; 一级市场</h2>



<h3 class="wp-block-heading">Cursor估值冲500亿再融资，英伟达将参与跟投</h3>



<p class="wp-block-paragraph">AI编程工具Cursor正在洽谈一轮至少20亿美元的新融资，完成后估值将达500亿美元，较六个月前翻近一倍。本轮由a16z和Thrive Capital领投，英伟达作为战略投资方计划参与。截至2026年2月，Cursor年化收入已突破20亿美元，较三个月前翻倍；每天约有1.5亿行企业代码通过Cursor生成，超三分之二的财富500强企业正在使用其服务，预计2026年底年化营收将突破60亿美元。（据公开市场信息）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>Cursor从10亿到20亿年化收入仅用三个月，这是企业级AI工具从「试用」跨越到「依赖」的典型拐点信号。一级市场应重点追踪编程AI周边的垂直工具层——代码审查、测试自动化、企业私有化部署，这些是Cursor无法吃尽、但天花板已被验证的相邻标的窗口。</p>
</blockquote>



<h3 class="wp-block-heading">OpenAI三高管同日离职，Sora项目宣告关停</h3>



<p class="wp-block-paragraph">2026年4月18日，OpenAI首席产品官凯文·威尔、Sora视频模型项目负责人比尔·皮布尔斯、企业应用CTO斯里尼瓦斯·纳拉亚南同日离职。OpenAI同步宣布将于4月26日正式关停Sora项目，旗下科研工具Prism团队并入编程产品Codex部门。Sora用户数从巅峰期约300万跌至100万，日均运营成本达百万美元，并持续面临版权诉讼压力。外界普遍认为OpenAI正收缩战线，将资源集中于企业级业务和编程工具Codex，为IPO阶段的盈利目标铺路。（综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>OpenAI砍掉Sora、押注Codex，传递出清晰产业信号：消费级AI视频工具仍是高成本、低留存的负担，企业编程基础设施才是当前AI最确定的商业化锚点。对AI视频赛道的早期投资者而言，技术演示≠商业模型——留意那些尚未找到企业付费场景的视频AI标的。</p>
</blockquote>



<h2 class="wp-block-heading">科技商业</h2>



<h3 class="wp-block-heading">库克卸任苹果CEO，硬件工程掌门特努斯9月正式接棒</h3>



<p class="wp-block-paragraph">苹果公司宣布，现任CEO蒂姆·库克将于2026年9月1日卸任，转任执行董事长；现任硬件工程高级副总裁约翰·特努斯将接任新CEO，同时加入公司董事会。库克自2011年接替乔布斯至今，在任14年，任内苹果市值从约3500亿美元增至超4万亿美元，年收入翻逾四倍，服务板块年收入突破千亿美元。特努斯2001年加入苹果，主导过多代iPhone、Mac、iPad及Apple Watch的硬件研发，推动了苹果自研芯片转型，并在任内带动Mac迎来历史最强销售周期。库克在给苹果社区的公开信中写道：「能够担任苹果CEO，是我一生中最大的荣幸。」（据企业官方公告）</p>



<figure class="wp-block-image size-full"><img decoding="async" width="960" height="507" src="https://touheima.com/wp-content/uploads/2026/04/20260421-firstknow-apple-ceo-ternus2.jpeg" alt="" class="wp-image-1904" srcset="https://touheima.com/wp-content/uploads/2026/04/20260421-firstknow-apple-ceo-ternus2.jpeg 960w, https://touheima.com/wp-content/uploads/2026/04/20260421-firstknow-apple-ceo-ternus2-300x158.jpeg 300w, https://touheima.com/wp-content/uploads/2026/04/20260421-firstknow-apple-ceo-ternus2-768x406.jpeg 768w" sizes="(max-width: 960px) 100vw, 960px" /></figure>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>库克用14年证明：伟大公司不必靠创始人光环撑着，严谨的运营者同样能把一家公司带上新的高度。他每天清晨读用户来信的习惯，是他与乔布斯最不同的地方，也是这段历程最温柔的注脚。特努斯接棒，是工程师灵魂的回归；苹果的下一个时代，或许比我们想象的更扎实、也更安静。</p>
</blockquote>



<h3 class="wp-block-heading">OPPO Find X9 Ultra今日发布，哈苏影像全系升级</h3>



<p class="wp-block-paragraph">OPPO于4月21日正式发布Find X9 Ultra旗舰手机，是2026年行业内唯一一款实现全系摄像头全面升级的Ultra机型，搭载双2亿像素传感器，与哈苏深度联合调校。同期，红米K90 Max同日亮相，首搭天玑9500+独显双芯，配备8000mAh超大电池，主打极致游戏性能。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>旗舰影像持续堆料背后，是摄像头模组与光学镜头供应链的直接受益逻辑。哈苏与OPPO的深度绑定进入成熟期，「手机+专业光学品牌」联名已成行业卡位标配；光学镜头精密加工、潜望式模组等供应链环节值得持续追踪。</p>
</blockquote>



<h3 class="wp-block-heading">Meta酝酿5月启动裁员8000人，下半年还将续裁</h3>



<p class="wp-block-paragraph">Meta计划于5月20日前后启动今年首轮裁员，规模约8000人（占全球员工总数约10%），下半年还将视AI发展进度持续裁员，总比例或达20%（约1.6万人）。扎克伯格表示裁员与AI资本投入密切相关——Meta去年净利润约600亿美元，但算力与AI基础设施支出持续加速，「用算力换人力」成为明确战略方向。（综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>Meta在高盈利状态下主动大规模裁员，说明「AI替代中间层岗位」已从概念变为执行共识。对一级市场的意义在于：企业内部AI工具——HR流程自动化、中层管理辅助、知识库与合规自动化——的采购预算正在被释放，相关B端SaaS赛道的早期窗口在持续扩大。</p>
</blockquote>



<h3 class="wp-block-heading">Snap宣布裁员16%，AI提效叠加激进投资者双重施压</h3>



<p class="wp-block-paragraph">Snap宣布裁减全球约1000名全职员工（占总数16%），并关闭超300个招聘职位，预计每年节省超5亿美元运营成本。此次裁员由激进投资机构Irenic Capital Management公开施压触发，同时要求剥离连续亏损的AR眼镜Spectacles业务。Snap目前超65%的新代码已由AI生成。消息公布后，Snap股价盘前大涨逾11%。（据公开市场信息）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>激进投资者的施压逻辑本质是：当AI将人效提升到新水位，「人多效低」的组织结构即成被狙击的目标。这一模式揭示了企业AI落地后期的价值重估逻辑——留意那些尚未完成「人效重构」的传统科技公司，可能是下一批被激进资本盯上的标的。</p>
</blockquote>



<h3 class="wp-block-heading">亚马逊拟收购苹果卫星供应商，布局iPhone卫星服务网络</h3>



<p class="wp-block-paragraph">亚马逊宣布计划收购Globalstar，这家公司是苹果手机卫星通信服务的核心供应商，为iPhone和Apple Watch提供卫星紧急救援功能。收购完成后，亚马逊将与苹果形成深度卫星基础设施合作，进一步扩展苹果的卫星服务网络覆盖范围。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>卫星通信正从「应急功能」升级为科技巨头的战略基础设施卡位。亚马逊Kuiper与苹果卫星服务的潜在整合，意味着低轨卫星与地面网络融合赛道提速——低轨卫星上下游的早期硬件标的与通信服务商，窗口期已明显打开。</p>
</blockquote>



<h3 class="wp-block-heading">英伟达开源量子AI模型「伊辛」，量子概念股全线暴涨</h3>



<p class="wp-block-paragraph">英伟达发布全球首个面向量子计算的开源AI模型家族NVIDIA Ising（「伊辛」），聚焦量子处理器校准与量子纠错两大核心痛点，运行速度较行业基准最高提升2.5倍，解码准确率最高提升约3倍，可将量子校准时间从数天压缩至数小时。英伟达将其定位为「AI作为量子计算的操作系统」。消息发布后，美股量子计算概念股集体暴涨，IonQ单日涨超20%，SEALSQ涨超21%。（据企业官方公告）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>英伟达进入量子控制层，不是宣告量子计算已然成熟，而是在提前布局「基础设施税」。真正的信号在于：量子纠错正从学术实验室走向工程工具层，量子控制电路、低温存储与校准软件等细分环节的早期投资窗口已出现——但量子计算商业化仍是3-5年尺度的故事，概念股短期暴涨与真实产业进展要谨慎区分。</p>
</blockquote>



<h2 class="wp-block-heading">轻松一刻</h2>



<h3 class="wp-block-heading">人形机器人半马冠军成绩突破人类世界纪录</h3>



<p class="wp-block-paragraph">2026年4月19日，「2026北京亦庄半程马拉松暨人形机器人半程马拉松」举办，超百支人形机器人赛队与1.2万名人类选手同场竞技。深圳荣耀智慧科技的「闪电」机器人以50分26秒净时成绩夺冠，不仅赢下冠军，更直接突破了人类男子半马57分20秒的现有世界纪录。去年首届仅有20支队伍，今年一跃扩大至百余支。（据公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong><br>去年机器人半马冠军还在「能跑完就算赢」，今年已在刷新人类世界纪录——具身智能的迭代速度，比大多数投资者的心理预期快了至少两个节拍。</p>
</blockquote>



<h2 class="wp-block-heading">今日左侧信号</h2>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>信号一</strong>：AI工具层正从消费级退潮、向企业级全面聚焦</p>



<p class="wp-block-paragraph"><strong>追踪方向</strong>：OpenAI砍掉Sora押注Codex、Cursor年化营收六个月翻倍，共同指向——企业编程基础设施是当前AI最确定的商业化场景。重点追踪：代码审查自动化、企业私有化部署工具、AI测试与安全合规工具；关键节点：Cursor IPO进程。</p>



<p class="wp-block-paragraph"><strong>信号二</strong>：苹果以硬件工程师接棒CEO，端侧AI硬件化路径信号明确</p>



<p class="wp-block-paragraph"><strong>追踪方向</strong>：特努斯主导苹果多代硬件周期，苹果的AI战略将继续以「端侧体验」为核心驱动。追踪方向：苹果端侧AI芯片与精密传感器供应链（定制模组生态），以及AR与空间计算硬件的早期周边标的。建议深挖 → 黑马雷达：苹果端侧AI供应链。</p>
</blockquote>



<p class="has-text-align-right wp-block-paragraph">── 投黑马研究团队</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>英伟达20亿入股Marvell；Tesla Q1交付超预期Cybertruck翻番 &#124; 马上知道</title>
		<link>https://touheima.com/firstknow-20260402-openai-122b-nvidia-marvell-tesla-q1/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Wed, 01 Apr 2026 23:22:33 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI基础设施]]></category>
		<category><![CDATA[Google Gemini]]></category>
		<category><![CDATA[OpenAI]]></category>
		<category><![CDATA[Tesla]]></category>
		<category><![CDATA[xAI]]></category>
		<category><![CDATA[一级市场]]></category>
		<category><![CDATA[半导体关税]]></category>
		<category><![CDATA[硅光子]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[风险投资]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1789</guid>

					<description><![CDATA[OpenAI融资1220亿美元刷新私募纪录、估值8520亿；英伟达战略入股Marvell布局硅光子与AI互联层；Tesla Q1交付36.6万辆、Cybertruck同比翻番。AI算力底层重组信号清晰。]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><a href="https://touheima.com/firstknow_list/">马上知道</a> / 2026年4月2日 / 阅读时间约4分钟</p>



<h2 class="wp-block-heading">AI &amp; 一级市场</h2>



<h3 class="wp-block-heading">OpenAI完成史上最大单轮私募融资，估值冲至8520亿美元</h3>



<p class="wp-block-paragraph">OpenAI于3月31日宣布完成1220亿美元融资，投后估值达8520亿美元，刷新全球私募融资历史纪录。本轮由软银联合领投，亚马逊承诺注资500亿美元（其中350亿美元以IPO达成或AGI里程碑为对赌条件），英伟达与软银各投入300亿美元，a16z与DE Shaw跟投，并首次向个人投资者开放银行渠道，从中筹得30亿美元。OpenAI当前月收入已达20亿美元，上年全年营收131亿美元；ChatGPT每周活跃用户超9亿，付费订阅用户逾5000万。公司同步将循环信贷额度扩大至47亿美元，并透露最早将于2026年底推进IPO。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> OpenAI的估值逻辑已从「研究机构」切换为「平台公司」，AI基础设施层赢家通吃格局初步成型。一级市场的机会不在复制OpenAI本身，而在挖掘其生态下游——API工具层、垂直应用层、以及能力曲线覆盖不足的专业场景早期标的。</p>
</blockquote>



<h3 class="wp-block-heading">英伟达20亿入股Marvell，硅光子+NVLink重构AI网络底层</h3>



<p class="wp-block-paragraph">英伟达于3月31日宣布向Marvell Technology战略投资20亿美元，双方在NVLink Fusion生态框架下深度协作——Marvell提供定制XPU与兼容NVLink的扩展网络设备，英伟达输出Vera CPU、ConnectX NIC、BlueField DPU及Spectrum-X交换机等核心组件。合作重点之一是硅光子技术：双方将共同开发以光替代铜线传输数据的方案，同时探索借助电信网络承载AI算力的新路径。消息发布后Marvell股价单日上涨逾13%。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> 英伟达开放NVLink生态并战略入股算力网络供应商，AI基础设施竞争已从GPU本身扩展至「互联层」。硅光子是下一代数据中心内网的关键使能技术，目前国内相关早期公司数量有限且估值低位，值得重点追踪。</p>
</blockquote>



<h3 class="wp-block-heading">2026年Q1全球风险投资创纪录：3000亿美元涌入，AI独占八成</h3>



<p class="wp-block-paragraph">Crunchbase最新数据显示，2026年第一季度全球风险投资额突破3000亿美元，覆盖约6000家初创公司，同比与环比均增逾150%。其中AI赛道吸金2420亿美元，约占全球总额80%。头部集中度极高：OpenAI、Anthropic、xAI、Waymo四家公司合计融资1880亿美元，占全球VC总额的65%；Q1全球历史前五大单轮融资中有四笔在本季落定，整体呈现「赢者通吃」特征。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> 资本极端集中于前沿大模型厂商，反而意味着中间层和应用层的竞争烈度尚未充分、定价效率仍低——这正是左侧投资者的结构性机会窗口。重点关注能从头部模型生态「分一杯羹」而非正面竞争的B2B工具与垂直AI公司。</p>
</blockquote>



<h3 class="wp-block-heading">Google Gemini 3.1 Pro推送消费端，记忆与跨平台功能加速落地</h3>



<p class="wp-block-paragraph">Google于4月1日起将Gemini 3.1 Pro正式推送至AI Pro与Ultra订阅用户，此前预览版已于2月19日面向开发者开放。3.1 Pro被定位为旗舰复杂任务模型，同期推出的Gemini 3.1 Flash-Live则聚焦语音优先场景，主打低延迟自然节奏交互。本次更新同步引入跨平台聊天导入、整合Gmail与Drive的个人智能模块，以及增强上下文记忆功能，打通Google全家桶数据生态。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> Gemini生态将Gmail、Drive、Search全面打通，Google在AI助手赛道的护城河已从模型能力延伸至数据网络效应。独立AI助手类创业公司面临渠道侧压力，一级市场需重新审视「通用AI助手」与「垂直AI工作流」的分野边界。</p>
</blockquote>



<h2 class="wp-block-heading">科技商业</h2>



<h3 class="wp-block-heading">Tesla Q1交付36.6万辆，Cybertruck同比增111%领跑全季</h3>



<p class="wp-block-paragraph">Tesla于4月2日发布2026年第一季度交付数据：总交付量365,645辆，与分析师共识一致，同比增长8.2%。其中Model 3/Y贡献312,200辆（同比+2.3%），Model S/X为12,445辆（同比-15.9%），Cybertruck以38,500辆的成绩实现111.5%同比增长，成为本季最大亮点；能源储存部署约14.4 GWh。整体数据标志着Tesla在连续两年销量下滑后出现企稳迹象。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> Cybertruck超高增速背后是客群价格不敏感的结构优势，受关税冲击相对有限。供应链投资者更应追踪Tesla能源储存业务——Megapack的产能爬坡与订单积压，是独立于整车的高质量增长引擎，三到五年维度值得左侧布局。</p>
</blockquote>



<h3 class="wp-block-heading">「解放日」关税一周年：半导体谈判报告截止期逼近，科技供应链新变量待定</h3>



<p class="wp-block-paragraph">2025年4月2日，特朗普签署行政令宣布「解放日」对等关税，开启美国近百年来最大规模贸易保护行动。一年后，美国最高法院于今年2月裁定部分关税援引紧急权力违宪，综合有效税率回落至约13.7%。与此同时，特朗普于今年1月另行对特定AI芯片（含英伟达H200、AMD MI325X）征收25%关税，并要求商务部与USTR于4月14日前提交半导体谈判结果报告——新一轮更广泛半导体关税的政策走向将于两周内明朗。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> 4月14日的半导体谈判报告是当前科技供应链最重要的近期催化剂。若关税范围扩大，将加速美国AI数据中心客户寻求替代算力方案的迫切度，国产AI基础设施赛道的政策性窗口或提前打开，左侧布局者需密切盯盘。</p>
</blockquote>



<h3 class="wp-block-heading">Grok 4.20多智能体架构重塑AI推理，Grok 5六万亿参数Q2亮相</h3>



<p class="wp-block-paragraph">xAI近期发布的Grok 4.20在推理架构上引入多代理协作机制——四个专业化AI代理（分别负责协调、实时信息核查、逻辑与编程、创意推理）并行运行，互相辩论后输出单一答案，该机制内置于推理层而非用户可见层。此前Grok 4.1已将幻觉率从12.09%降至4.22%，降幅达65%。xAI官方透露，Grok 5预计于2026年Q2正式发布，参数量约为6万亿，约为GPT-4估算参数规模的六倍。（据企业官方公告、综合公开信息整理）</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>【投黑马点评】</strong> 多代理推理架构落地，意味着「推理质量」的瓶颈正被系统化方法覆盖而非单纯依赖参数规模。一级市场需重新审视「更大参数=更强护城河」的底层假设，幻觉率与推理稳定性等企业部署指标，将成为新的差异化维度。</p>
</blockquote>



<h2 class="wp-block-heading">今日左侧信号</h2>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><strong>信号</strong>：AI基础设施「互联与传输」环节进入战略卡位期，头部算力玩家正通过战略入股与生态绑定提前锁定关键节点。</p>



<p class="wp-block-paragraph"><strong>追踪方向</strong>：英伟达入股Marvell并开放NVLink生态，将硅光子与AI网络设备纳入核心生态链，意味着「AI网络基础设施」已成为继GPU之后的下一个卡位战场。左侧投资者应重点关注：1）硅光子上下游早期公司（光芯片、光模块、光互连设备）；2）国内AI网络设备公司的战略地位变化——若美国4月14日后关税范围扩大至网络设备，国产替代窗口将大幅提前。建议深挖 → 前沿信号·算力基础设施系列</p>
</blockquote>



<p class="wp-block-paragraph">── 投黑马研究团队</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>Token经济时代：商业文明新货币的生产者、换算者与受益者【黑马雷达 第003期】</title>
		<link>https://touheima.com/radar-token-economy-ai-value-layer/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Sat, 21 Mar 2026 09:32:22 +0000</pubDate>
				<category><![CDATA[黑马雷达]]></category>
		<category><![CDATA[AI Agent]]></category>
		<category><![CDATA[AI基础设施]]></category>
		<category><![CDATA[Token经济]]></category>
		<category><![CDATA[企业AI]]></category>
		<category><![CDATA[商业模式重构]]></category>
		<category><![CDATA[大语言模型]]></category>
		<category><![CDATA[左侧投资]]></category>
		<category><![CDATA[推理成本]]></category>
		<category><![CDATA[早期机会]]></category>
		<category><![CDATA[算力经济]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1654</guid>

					<description><![CDATA[Token经济正在成为AI产业的新价值坐标系。生产成本两年跌去99%，但Token与商业价值之间的换算层几乎是空白——这才是左侧投资者真正的战场。]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph"><a href="https://touheima.com/radar_list/">黑马雷达</a> / 第003期 / 2026年3月 / 阅读时间约15分钟</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p class="wp-block-paragraph"><em>本文从黄仁勋「Token经济学」宣言切入，拆解Token作为新货币单位的生产逻辑、商品化压力与价值换算空白，绘制这场经济范式迁移中的赢家与输家全景，点名被市场低估的三类早期机会，并给出可持续追踪的三个核心变量信号。读完本文，你将理解为什么「谁来换算Token的商业价值」是当前AI产业链中最被低估的投资坐标。阅读要点：① Token经济学的底层逻辑是什么；② 为什么Token生产层正在商品化；③ 价值换算层为何是真正的战场；④ 三类被低估的早期机会；⑤ 左侧投资者应追踪的三个核心变量；⑥ 投黑马的分层布局建议。</em></p>
</blockquote>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">一、为什么Token经济是当前最值得严肃对待的投资命题</h2>



<p class="wp-block-paragraph">2026年3月，Token经济正在从一个技术术语演变为重新定义企业成本结构的基本单位。</p>



<p class="wp-block-paragraph">黄仁勋在英伟达年度GTC大会上给出了这样一幅图景：未来每一家使用AI的企业，都将把「每月可调用的Token数量」纳入员工成本核算——就像今天的「薪资 + 差旅预算」一样自然。企业的智能生产力，将以Token的产出效率来衡量。</p>



<p class="wp-block-paragraph">这不是一个遥远的预言。这是一个正在被悄然部署的经济框架。</p>



<p class="wp-block-paragraph"><strong>三个信号证明Token经济已经从概念进入现实：</strong></p>



<p class="wp-block-paragraph">第一，<strong>定价基础设施正在成熟。</strong> OpenAI、Anthropic、Google的API定价，全部以「每百万Token」为基本单位。这不是巧合，而是整个产业链在用同一套语言对话——Token正在成为AI产业的「度量衡」。</p>



<p class="wp-block-paragraph">第二，<strong>企业采购行为开始重构。</strong> 微软Copilot、Salesforce Agentforce、ServiceNow的企业级AI产品，已经开始向客户提供「Token额度包」的采购方式。企业HR部门正在被要求回答：「一名知识工作者每月需要消耗多少Token？」这个问题以前根本不存在。</p>



<p class="wp-block-paragraph">第三，<strong>推理模型使Token消耗量级跃升。</strong> 自OpenAI o1以来，推理型模型在给出答案前会执行大量内部「思考」步骤，Token消耗量是传统模型的5至20倍。加上Agent的多步骤任务执行，企业的Token账单正在以指数级增长。Token经济的规模效应，比大多数人预期的更快到来。</p>



<p class="wp-block-paragraph">但黄仁勋的演讲里有一个被主流媒体忽视的核心空白：<strong>他解释了Token如何被生产和消耗，却没有解释Token如何被换算为商业价值。</strong></p>



<p class="wp-block-paragraph">这个空白，是这篇文章真正想讨论的事情。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">二、Token经济的底层结构：三层拆解</h2>



<p class="wp-block-paragraph">理解Token经济，需要把它拆解为三个独立但相互依存的层次：</p>



<p class="wp-block-paragraph"><strong>第一层：Token生产层（算力基础设施）</strong></p>



<p class="wp-block-paragraph">这是黄仁勋最熟悉的领域。英伟达的GPU、Groq的LPU、Cerebras的晶圆级芯片，以及AWS、Google Cloud、Azure的推理云服务，都在这一层竞争。</p>



<p class="wp-block-paragraph">这一层的核心经济逻辑是：<strong>规模即优势，成本是唯一的护城河。</strong> 谁能以最低成本生产每一个Token，谁就在这一层获得定价权。</p>



<p class="wp-block-paragraph">但这也是这一层最大的问题所在——它正在快速商品化。两年前，生产100万个Token的成本约为33美元；今天，最便宜的模型已经将这一成本压缩至9美分。跌幅超过99%，且趋势没有放缓的迹象。当所有玩家都在使用同类芯片、同类架构优化时，Token生产本身将越来越像云存储——一门可以赚钱但难以维持超额利润的基础设施生意。</p>



<p class="wp-block-paragraph"><strong>第二层：Token分发层（模型与平台）</strong></p>



<p class="wp-block-paragraph">这是OpenAI、Anthropic、Google Gemini所占据的位置。它们不直接生产算力，而是将算力转化为可调用的智能服务，并向下游开发者和企业收取费用。</p>



<p class="wp-block-paragraph">这一层的护城河曾经非常清晰：模型能力的差异化。但随着开源模型（DeepSeek、Llama、Qwen）的能力快速追赶，闭源模型的溢价空间正在被压缩。闭源模型公司的真正护城河，正在从「模型能力」迁移向「生态系统」和「企业信任关系」——这是一个更软、更难量化、也更难维持的护城河。</p>



<p class="wp-block-paragraph"><strong>第三层：Token换算层（价值转化基础设施）</strong></p>



<p class="wp-block-paragraph">这是整个Token经济中<strong>最空白、最被低估、也最接近左侧机会的一层。</strong></p>



<p class="wp-block-paragraph">Token换算层要解决的问题是：一家企业消耗了100万个Token，这创造了多少商业价值？哪些Token调用是有效的，哪些是冗余的？如何在不损失业务质量的前提下，优化Token的使用效率？</p>



<p class="wp-block-paragraph">这个问题今天没有成熟的答案。企业只能通过月度账单事后追踪，无法做到实时监控、主动优化和ROI归因。而随着企业Token支出从「可以忽略」变成「财务重大项」，这一层的需求将从无到有，出现爆发性增长。</p>



<p class="wp-block-paragraph"><strong>Token生产层正在商品化；Token分发层的护城河在迁移；Token换算层几乎是空白。</strong></p>



<p class="wp-block-paragraph">左侧机会，在第三层。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">三、竞争格局：谁在赢，谁在输，为什么</h2>



<p class="wp-block-paragraph"><strong>英伟达：Token经济的最大受益者，也是最大的叙事构建者</strong></p>



<p class="wp-block-paragraph">黄仁勋的「Token经济学」演讲，是一次精心设计的叙事工程。它试图做到的事情是：把华尔街的注意力从「英伟达的GPU有多贵」转移到「Token生产效率有多重要」——而英伟达的芯片，恰好是目前生产Token效率最高的工具。</p>



<p class="wp-block-paragraph">这个叙事是自洽的，但有一个内在矛盾：如果Token生产成本持续趋零，即使英伟达的芯片每次都是最高效的，整个Token生产市场的总收入天花板也会随成本下降而收缩。英伟达的真正对赌，是Token消耗总量的增长速度将永远快于单价的下降速度。目前看来这一判断成立，但这是一个需要持续验证的假设，而非确定性结论。</p>



<p class="wp-block-paragraph">英伟达的护城河：CUDA生态的开发者锁定是真实的，短期内无可替代。 英伟达的隐患：专用推理芯片（Groq、Cerebras）在特定场景的成本优势已经显现，云厂商自研芯片（AWS Trainium、Google TPU）的替代渗透率在持续上升。</p>



<p class="wp-block-paragraph"><strong>OpenAI：从Token分发者到Token经济操作系统</strong></p>



<p class="wp-block-paragraph">OpenAI最新的战略动作，是试图从「卖Token」转型为「管理Token使用」。Operator、Tasks、以及正在测试的「企业Token配额管理」功能，本质上是在向Token换算层延伸——它想成为企业管理AI支出的中枢，而不只是AI能力的提供者。</p>



<p class="wp-block-paragraph">这是正确的战略方向，但执行面临两个障碍：企业客户对将核心AI支出数据托管给单一供应商的顾虑，以及OpenAI自身在企业服务能力上的历史积累不足。</p>



<p class="wp-block-paragraph">OpenAI的护城河：品牌认知最强，开发者生态最成熟，ChatGPT的消费者端数据优势无可复制。 OpenAI的隐患：商业化压力与安全使命之间的内部张力，以及对单一模型能力优势的过度依赖。</p>



<p class="wp-block-paragraph"><strong>微软：企业Token经济的最深层布局者</strong></p>



<p class="wp-block-paragraph">微软是这场Token经济战争中被市场最系统性低估的玩家。</p>



<p class="wp-block-paragraph">原因很简单：微软不需要赢得Token生产战，它只需要成为企业「Token使用管理」的默认入口。Copilot深度嵌入Office 365、Teams、Azure的全家桶，意味着对于绝大多数企业而言，「管理AI支出」天然从微软的产品界面开始。</p>



<p class="wp-block-paragraph">更重要的是，微软Azure正在演变为企业Token经济的「结算基础设施」——企业的AI预算、Token额度分配、使用追踪，越来越多地通过Azure的计费系统流转。这是一个典型的「坐在流量中间」的战略位置。</p>



<p class="wp-block-paragraph">微软的护城河：企业客户锁定最深，数据优势无可比拟，Azure作为结算基础设施的地位正在强化。 微软的隐患：创新速度受大公司体制制约，对OpenAI的依赖是双刃剑。</p>



<p class="wp-block-paragraph"><strong>Anthropic：协议层的安静布局者</strong></p>



<p class="wp-block-paragraph">Anthropic的Model Context Protocol（MCP）在Token经济框架下，具有比表面看起来更深远的战略意义。</p>



<p class="wp-block-paragraph">MCP定义了Agent如何与外部工具交互，本质上是在定义「一次任务调用应该消耗多少Token、以什么方式消耗」的标准。如果MCP成为行业协议，Anthropic就在Token的「使用规则」层面建立了类似TCP/IP的基础地位——不控制Token的生产，但影响Token的流动方式。</p>



<p class="wp-block-paragraph">Anthropic的护城河：安全研究最深，企业合规场景的信任度最高，MCP协议的先发优势。 Anthropic的隐患：商业化节奏偏慢，协议标准的行业采纳速度存在不确定性。</p>



<p class="wp-block-paragraph"><strong>开源阵营：Token经济的最大颠覆变量</strong></p>



<p class="wp-block-paragraph"><a href="https://touheima.com/firstknow-20260414-deepseek-v4-coreweave-meta-tesla-fsd/">DeepSeek</a> R1用600万美元的训练成本复现了GPT-4级别的推理质量，这件事的真正意义不在于模型能力的比较，而在于它对「Token生产成本下限」的重新定价。</p>



<p class="wp-block-paragraph">当开源模型可以在私有部署环境中以极低成本生产Token，「谁来生产Token」的问题将被彻底去中心化。这对Token分发层（OpenAI、Anthropic）的定价权构成持续压力，但对Token换算层（谁来帮企业用好Token）反而是利好——需求更加分散，换算工具的中立价值更加凸显。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">四、被市场低估的三类早期机会</h2>



<p class="wp-block-paragraph">大厂的竞争格局已经清晰，但对于左侧投资者而言，真正的Alpha永远不在大厂身上。大厂争夺的是Token生产层和分发层的控制权——这是资本密集、周期漫长、赢家通吃的消耗战。真正适合左侧布局的机会，藏在Token换算层的三个细分方向里。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>机会一：企业Token支出管理平台</strong></p>



<p class="wp-block-paragraph">这是Token经济中最接近「刚需基础设施」属性的早期机会，也是目前市场供给最稀缺的方向。</p>



<p class="wp-block-paragraph"><strong>核心逻辑：</strong> 当企业的月度Token账单从几千美元增长到几十万美元，CFO会开始问同一个问题：「这些钱花在了哪里，产生了什么价值？」今天没有任何成熟的工具可以回答这个问题。企业只能看到云厂商提供的原始账单，无法做到部门级、项目级、甚至员工级的Token支出归因。</p>



<p class="wp-block-paragraph"><strong>当前空白：</strong> 大厂有动力把这个功能内置到自己的平台，但它们的利益诉求是「让企业用更多Token」，而非「帮企业用更少但更高效的Token」——这个利益错位，是独立中立工具存在的结构性理由。</p>



<p class="wp-block-paragraph"><strong>护城河来源：</strong> 先发的数据网络效应。接入企业越多，跨企业的Token使用基准数据就越丰富，benchmarking能力就越强，对新客户的价值就越大。这是一个典型的数据飞轮。</p>



<p class="wp-block-paragraph"><strong>追踪信号：</strong></p>



<ul class="wp-block-list">
<li>Salesforce、ServiceNow等企业软件巨头是否开始在产品中内置Token用量仪表盘——若大厂开始做，说明市场需求已经成熟，独立工具的窗口即将收窄</li>



<li>头部咨询公司（麦肯锡、BCG）是否开始为客户提供「AI支出审计」服务——咨询公司通常是企业需求的先行指标，其服务目录的变化是需求爆发的领先信号</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>机会二：垂直场景的Token ROI计算引擎</strong></p>



<p class="wp-block-paragraph">这个机会比前者更细分，但壁垒更高、商业价值更直接。</p>



<p class="wp-block-paragraph"><strong>核心逻辑：</strong> 不同行业对「Token换算为商业价值」的计算逻辑完全不同。一家律所关心的是「一份合同审查消耗了多少Token，节省了多少律师小时」；一家电商公司关心的是「一次客服对话消耗了多少Token，对应的转化率提升是多少」；一家医院关心的是「一份临床文档的自动生成消耗了多少Token，减少了多少医生的非临床时间」。</p>



<p class="wp-block-paragraph">这些计算模型无法通用，必须深度定制。这给了垂直切入的早期公司建立真正护城河的机会——它们掌握的不只是工具，而是某个行业「Token价值换算」的独家知识体系。</p>



<p class="wp-block-paragraph"><strong>当前空白：</strong> 现有的可观测性工具（Langfuse、Braintrust等）聚焦于技术层面的Token追踪，尚未向业务价值层延伸。从「Token调用了多少次」到「这些调用产生了多少业务价值」，中间有一个巨大的翻译空白。</p>



<p class="wp-block-paragraph"><strong>护城河来源：</strong> 行业专属的价值计算模型 + 与客户系统的深度集成。一旦一家医院或律所把核心业务指标与Token消耗数据打通，迁移成本将极高。</p>



<p class="wp-block-paragraph"><strong>追踪信号：</strong></p>



<ul class="wp-block-list">
<li>Harvey、Abridge等垂直Agent公司是否开始向客户提供「Token ROI报告」——若头部垂直Agent公司开始将ROI可视化作为产品卖点，意味着客户对这类需求的意识正在觉醒</li>



<li>企业IT采购RFP（需求建议书）中是否开始出现「AI支出ROI追踪」作为评估维度——RFP的内容变化是企业采购意识最滞后但最可靠的确认信号</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>机会三：个人与小团队的Token预算工具</strong></p>



<p class="wp-block-paragraph">这是三个机会中最早期、也最容易被主流投资者忽视的方向——但它可能是Token经济最大的长尾市场。</p>



<p class="wp-block-paragraph"><strong>核心逻辑：</strong> 一人公司和小团队正在成为Token经济的重要消费主体。一个独立开发者、一个自由撰稿人、一个两人创业团队，每月可能调用来自五到十个不同AI服务的Token——Claude用于写作、Cursor用于编程、Perplexity用于研究、Midjourney用于设计……这些支出分散在不同账单里，既无法汇总，也无法优化。</p>



<p class="wp-block-paragraph">当「AI工具订阅费」成为个人或小团队的第二大固定支出（仅次于人力），对这类支出的管理需求将从零开始快速增长。</p>



<p class="wp-block-paragraph"><strong>当前空白：</strong> 现有的AI工具管理产品（如某些浏览器插件）停留在账户聚合层面，无法做到跨工具的Token等效换算和优化建议。这个空白目前几乎无人填补。</p>



<p class="wp-block-paragraph"><strong>护城河来源：</strong> 用户习惯的先发锁定 + 跨平台数据的积累。率先获取独立开发者社区用户的产品，将积累全球最丰富的「个人AI支出模式」数据集，这是后来者难以复制的资产。</p>



<p class="wp-block-paragraph"><strong>追踪信号：</strong></p>



<ul class="wp-block-list">
<li>Product Hunt上「AI支出管理」类产品的发布频率——这个平台是独立开发者需求最敏感的早期探测器，若此类产品开始密集出现，意味着需求已经从潜在变为显性</li>



<li>Stripe的年度报告中「AI工具订阅」类目的个人支出数据——Stripe处理了全球大量个人开发者的订阅支付，其数据是这个市场规模最可靠的代理指标</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">五、关键变量追踪：左侧投资者的信号地图</h2>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>变量一：Token商品化的速度与底线</strong></p>



<p class="wp-block-paragraph">这是Token经济最核心的结构性变量，它决定了整个产业链的利润分配格局。</p>



<p class="wp-block-paragraph">Token生产成本的下降是确定的，但「下降到哪里停止」是不确定的。如果Token成本趋近于真正的零，Token生产层将彻底失去定价权，利润将向换算层和应用层集中。如果成本在某个水平形成稳定区间（因为计算物理极限或寡头默契），生产层仍然可以维持一定的利润空间。</p>



<p class="wp-block-paragraph">这个变量的走向，将根本性地影响英伟达、云厂商和开源社区的相对竞争地位。</p>



<p class="wp-block-paragraph"><strong>具体可观测信号：</strong></p>



<ul class="wp-block-list">
<li>主流模型API的季度定价变化幅度——若每季度降幅从过去的30-50%收窄至10%以下，意味着Token生产成本正在接近当前技术架构的下限，商品化减速</li>



<li>DeepSeek、Llama等开源模型与GPT-4o、Claude 3.5的性能差距变化——差距每缩小10个百分点，闭源模型的定价溢价空间就压缩一分；若差距收窄至5%以内，Token分发层将面临定价体系的根本性重构</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>变量二：企业Token支出的预算化程度</strong></p>



<p class="wp-block-paragraph">这个变量是Token换算层需求爆发的触发器。当Token支出从「工具费用」升级为「独立预算科目」，企业对支出管理和ROI追踪工具的需求将从无到有，出现非线性增长。</p>



<p class="wp-block-paragraph">这个转变通常发生在两个条件同时满足之后：月度Token账单超过企业IT支出的5%，以及CFO开始要求AI项目提供ROI报告。</p>



<p class="wp-block-paragraph"><strong>具体可观测信号：</strong></p>



<ul class="wp-block-list">
<li>微软Azure、AWS在财报中披露的「AI服务」营收占云计算总营收的比例——当这一比例超过15%，意味着Token支出已经成为企业IT预算的重要组成部分，管理工具的需求将随之启动</li>



<li>Gartner、Forrester等咨询机构发布的企业AI支出调研报告中，「AI成本管理」和「ROI追踪」被列为首要挑战的比例——这类报告通常滞后市场6-9个月，但它们是企业CFO决策的重要参考，其内容变化会直接影响企业采购行为</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>变量三：Token配额成为劳动合同标准条款的速度</strong></p>



<p class="wp-block-paragraph">这是黄仁勋预言中最具颠覆性的那部分——「薪资 + 每月一定数量的Token」成为白领就业的标准包。这个变量一旦触发，将引发劳动力市场、企业人力成本核算和个人职业发展路径的系统性重构。</p>



<p class="wp-block-paragraph">目前这仍是少数科技公司的早期实验，但它的传播速度值得密切关注。</p>



<p class="wp-block-paragraph"><strong>具体可观测信号：</strong></p>



<ul class="wp-block-list">
<li>硅谷科技公司（Google、Meta、Salesforce等）的招聘JD中是否开始出现「AI工具配额」或「Copilot访问权限」作为薪酬福利条款——LinkedIn上的JD文本变化是这一趋势最早的公开数据来源</li>



<li>企业软件公司（Workday、SAP、Oracle）的HR模块是否开始增加「员工Token配额管理」功能——这些公司的产品路线图变化，是企业HR部门需求最滞后但最可靠的确认信号</li>
</ul>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>三个变量的联动逻辑</strong></p>



<p class="wp-block-paragraph">Token商品化加速 → 生产成本趋零 → 企业Token支出规模扩大（低价刺激更多调用）→ Token账单从可忽略变为预算重大项 → 企业开始要求ROI追踪 → Token换算层需求爆发 → Token配额开始进入劳动合同 → 个人Token预算管理需求随之启动 → 整个Token换算层的市场规模从零快速扩张。</p>



<p class="wp-block-paragraph"><strong>这个飞轮的启动信号，是企业Token支出首次进入CFO的视野。根据我们的追踪，这个时刻大概率在2026年底至2027年上半年之间到来。</strong></p>



<h2 class="wp-block-heading">投黑马 · 独家评级</h2>



<pre class="wp-block-code"><code>赛道热度：&#x1f525;&#x1f525;&#x1f525;&#x1f525;&#x1f525;　　Token经济框架已获黄仁勋背书，认知扩散加速
左侧机会：&#x2b50;&#x2b50;&#x2b50;&#x2b50;&#x2b50;　　换算层几乎空白，窗口处于最早期
布局紧迫度：&#x26a1;&#x26a1;&#x26a1;　　　需求爆发在12-18个月后，现在是播种期

推荐关注层次：
Token换算层基础设施 ＞ 垂直场景ROI引擎 ＞ 个人Token预算工具</code></pre>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">七、分层布局建议与风险披露</h2>



<p class="wp-block-paragraph"><strong>分层布局建议</strong></p>



<p class="wp-block-paragraph"><strong>第一层：Token换算层基础设施（低风险，长周期）</strong></p>



<p class="wp-block-paragraph">这是当前性价比最高的播种方向。押注逻辑不依赖于任何单一公司的胜出，而是基于一个几乎确定的结构性判断：只要Token经济持续扩张，企业对支出管理和ROI追踪工具的需求就必然从无到有。</p>



<p class="wp-block-paragraph">这一层类似于淘金热中的「卖铲子」——不需要判断哪个AI应用最终胜出，只需要确认Token规模化使用这件事会发生。</p>



<p class="wp-block-paragraph">选股标准：团队是否有企业财务软件或云成本管理的从业背景（而非纯AI工程背景）；产品是否对接了主流云厂商的计费API；是否已有3-5家真实付费的企业早期客户；商业模式是否与「帮企业节省Token支出」直接绑定（利益对齐）。</p>



<p class="wp-block-paragraph">时间窗口：建议在2026年底前完成核心布局，届时企业Token支出将开始进入CFO视野，需求将从潜在变为显性，估值随之进入右侧定价区间。</p>



<p class="wp-block-paragraph"><strong>第二层：垂直场景Token ROI引擎（中风险，中周期）</strong></p>



<p class="wp-block-paragraph">选择一到两个壁垒高、数据优势明显、且Token调用频率高的垂直行业重点布局。我们目前最看好法律和医疗两个方向：法律行业的合同审查和文档处理Token消耗量大、价值可量化；医疗行业的临床文档自动化有明确的时间节省指标，ROI换算相对清晰。</p>



<p class="wp-block-paragraph">这一层的关键选股标准：是否已经有行业客户的真实Token消耗数据；是否能将Token消耗与具体业务指标（律师小时、医生非临床时间）直接挂钩；产品路线图中是否有明确的「ROI报告」功能规划。</p>



<p class="wp-block-paragraph"><strong>第三层：个人Token预算工具（高风险，短周期）</strong></p>



<p class="wp-block-paragraph">这一层的市场时机最难把握——太早进入，个人Token支出尚未到达「需要管理」的量级；太晚进入，大厂会将聚合功能内置到浏览器或操作系统层面。最佳布局时机是独立开发者社区中开始出现自然增长的此类产品，且月活跃用户突破一万的那个时间点前后。</p>



<p class="wp-block-paragraph">这一层需要最强的产品判断力，也需要最快的决策速度。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p class="wp-block-paragraph"><strong>风险披露</strong></p>



<p class="wp-block-paragraph">左侧研究的诚实，要求我们同样清晰地列出这个判断可能出错的理由：</p>



<p class="wp-block-paragraph"><strong>风险一：大模型推理能力的跃升使Token消耗效率大幅提升</strong> 如果下一代推理模型可以用更少的Token完成同等质量的任务，企业Token账单的增长速度将低于预期，CFO的关注度也将延迟到来。届时，Token换算层的需求爆发时间表需要相应延长。这是概率中等但影响较大的执行风险。</p>



<p class="wp-block-paragraph"><strong>风险二：云厂商将Token管理工具内置化</strong> AWS、Azure、Google Cloud完全有能力将企业级Token支出管理作为云服务的标配功能推出，且可以凭借平台地位提供独立工具无法匹敌的数据深度。若三大云厂商同时行动，独立Token管理工具的商业空间将被大幅压缩。这是对第一层布局影响最直接的风险。</p>



<p class="wp-block-paragraph"><strong>风险三：Token经济框架被更新的计量范式取代</strong> 黄仁勋的Token经济学建立在当前大语言模型架构之上。若下一代AI系统采用根本不同的计算范式（如神经符号系统或量子计算加速），「Token」作为基本计量单位可能被新的概念取代，整个Token经济的基础设施投资将面临搁浅风险。这是概率最低但影响最大的尾部风险。</p>



<p class="wp-block-paragraph"><strong>风险四：隐私与数据主权监管的收紧</strong> Token换算层工具需要接入企业的AI调用数据才能提供有价值的分析。若欧盟、中国等主要市场的数据监管进一步收紧，跨境数据流动限制将显著增加此类工具的合规成本，并可能导致市场碎片化。垂直场景ROI引擎在医疗行业受此影响最大。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">结语</h2>



<p class="wp-block-paragraph">1971年，尼克松宣布美元与黄金脱钩，布雷顿森林体系崩溃。从那一天起，全球经济运行的基础货币从「黄金」切换为「美元信用」。</p>



<p class="wp-block-paragraph">这次切换用了将近十年才被市场完全消化——期间产生了无数的混乱、通胀、以及最终的财富重新分配。</p>



<p class="wp-block-paragraph">今天，黄仁勋正在宣告另一次类似的切换：衡量企业智能生产力的基础单位，正在从「人力工时」切换为「Token」。</p>



<p class="wp-block-paragraph">这次切换同样不会在一夜之间完成。企业需要时间重建成本核算体系，劳动合同需要时间纳入Token条款，CFO需要时间学会看懂Token账单。</p>



<p class="wp-block-paragraph">但方向是确定的，时间是唯一的变量。</p>



<p class="wp-block-paragraph">左侧投资者的机会，永远在切换发生之前、市场共识形成之后。Token换算层的空白，正在等待那些足够早看见它的人。</p>



<p class="wp-block-paragraph"><strong>在聚光灯照亮之前，我们已经在那里。</strong></p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading has-text-align-center">投黑马 · 信号解读</h2>



<pre class="wp-block-code"><code>黄仁勋的Token经济学宣言，本质上是一张尚未兑现的支票——他描述了Token如何被生产和消耗，却没有回答Token如何被换算为商业价值。这个空白，是当前AI产业链中最接近「基础设施级」的左侧机会。

左侧投资者真正需要盯住的信号只有一个：企业CFO第一次在季度财报电话会上主动提及「AI Token支出管理」——那一刻，Token换算层的需求将从潜在变为显性，窗口将从开放走向收窄。</code></pre>



<p class="has-text-align-right has-photology-brown-color has-text-color has-link-color wp-elements-33b0cb3772f2f6c2dbf91f5c02520ad5 wp-block-paragraph">── 投黑马研究团队</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>DeepSeek暴击美股，让整个硅谷坐立不安</title>
		<link>https://touheima.com/deepseek-hits-us-stocks-hard-making-the-entire-silicon-valley-uneasy/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Mon, 27 Jan 2025 12:52:59 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[ChatGPT]]></category>
		<category><![CDATA[DeepSeek]]></category>
		<category><![CDATA[美股]]></category>
		<category><![CDATA[英伟达]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1267</guid>

					<description><![CDATA[“东方神秘力量”暴击硅谷，带飞国内AI概念股。]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph">今日，“国产AI之光”DeepSeek把美股“打爆”了。<br>DeepSeek这些天俨然一副“杀疯了”的架势，今日再创历史时刻：力压ChatGPT，登顶美区App Store免费榜，在国内App Store免费榜同样位居第一。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="542" src="https://touheima.com/wp-content/uploads/2025/01/deepseek1.webp" alt="" class="wp-image-1252" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek1.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek1-300x163.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek1-768x416.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">美区App Store免费榜Top100中，DeepSeek和ChatGPT跻身前三，谷歌Gemini排第33名，其他明星AI聊天机器人App则了无踪影。在TikTok被迫下架的空档期，DeepSeek再度霸榜美国应用商店，展现出中国应用程序惊人的出海影响力。<br><br>市场迅速做出反应，刚被美国3.6万亿元“星际之门”AI巨型项目重振的纳斯达克100指数迷你期货，哐哐下跌超过300点。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="653" height="1024" src="https://touheima.com/wp-content/uploads/2025/01/deepseek2-653x1024.webp" alt="" class="wp-image-1253" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek2-653x1024.webp 653w, https://touheima.com/wp-content/uploads/2025/01/deepseek2-191x300.webp 191w, https://touheima.com/wp-content/uploads/2025/01/deepseek2-768x1203.webp 768w, https://touheima.com/wp-content/uploads/2025/01/deepseek2-980x1536.webp 980w, https://touheima.com/wp-content/uploads/2025/01/deepseek2.webp 1000w" sizes="auto, (max-width: 653px) 100vw, 653px" /></figure>



<p class="wp-block-paragraph">这是中国AI带给美国的最新暴击。<br>在国内，DeepSeek也“刷屏”股市，<a href="https://touheima.com/firstknow-20260424-gpt55-anthropic-trillion-meta-layoffs/">AI智能体</a>、AI语料等概念股领涨。相关炒作亦是闻风而动，与DeepSeek关联的股东、合作伙伴被相继挖出，名单涉及浙江东方、华金资本等股权关联方，浪潮信息、中科曙光、润泽科技、航锦科技等算力基础设施供应商，拓尔思、科大讯飞、金山办公等垂直领域合作方，南威软件、并行科技等技术合作方，每日互动、卓创资讯等数据与生态合作方……<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="947" src="https://touheima.com/wp-content/uploads/2025/01/deepseek3.webp" alt="" class="wp-image-1254" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek3.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek3-300x284.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek3-768x727.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">《黑神话：悟空》制作人冯骥专门发了篇小作文，盛赞DeepSeek<strong>“可能是个国运级别的科技成果”、“会让你对当前最先进的AI祛魅”</strong>，让知识和信息平权“又往前迈出了坚实的一步”。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="1022" src="https://touheima.com/wp-content/uploads/2025/01/deepseek4.webp" alt="" class="wp-image-1255" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek4.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek4-294x300.webp 294w, https://touheima.com/wp-content/uploads/2025/01/deepseek4-768x785.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">他总结了DeepSeek做到的六大突破：<strong>强大、便宜、开源、免费、联网、本土。</strong><br>这个横空出世的“神秘东方力量”，正凭借这些突破在硅谷引起连连巨震，令许多顶尖AI竞争对手手忙脚乱。<br>就在两天前，美国财经媒体CNBC针对DeepSeek制作了一期长达40分钟的专题视频报道，标题为《中国新型AI模型DeepSeek如何威胁美国主导地位》。目前这个视频观看量已经超过200万。<br></p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="282" src="https://touheima.com/wp-content/uploads/2025/01/deepseek5-1024x282.webp" alt="" class="wp-image-1256" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek5-1024x282.webp 1024w, https://touheima.com/wp-content/uploads/2025/01/deepseek5-300x83.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek5-768x211.webp 768w, https://touheima.com/wp-content/uploads/2025/01/deepseek5.webp 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">评论有上万条。其中一则高赞评论称受够了“威胁论”，任何中国和其他国家的进步都是美国的“威胁”；另一则评论拿DeepSeek与OpenAI作对比，说DeepSeek开放开源，OpenAI却封闭且保密，颇具讽刺意味。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="779" src="https://touheima.com/wp-content/uploads/2025/01/deepseek6.webp" alt="" class="wp-image-1257" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek6.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek6-300x234.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek6-768x598.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">应对来势汹汹的DeepSeek，OpenAI联合创始人兼CEO Sam Altman发文预告ChatGPT免费套餐将可用o3-mini。Meta被曝紧急成立4个作战小分队，层层拆解DeepSeek模型的技术秘诀。OpenAI等其他顶级AI公司的研究人员也一直在仔细研究DeepSeek模型如何做到更便宜高效。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="386" src="https://touheima.com/wp-content/uploads/2025/01/deepseek7.webp" alt="" class="wp-image-1258" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek7.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek7-300x116.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek7-768x296.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">DeepSeek成立于2023年5月，背靠国内对冲基金巨头，因开源和低价而闻名，素有“AI界拼多多”、“国产AI价格屠夫”之称。<br><br>就在一周前，DeepSeek推出性能媲美OpenAI o1模型的推理模型R1，成本仅用了o1的一小部分，而且开源，API付费价格远低于o1，App和网页版均支持免费使用，还支持联网搜索。<br><br>开源意味着只要你的电脑配置充足，你就可以用Ollama等应用把最大版本的R1模型下载到电脑本地，充分保护隐私和数据安全。</p>



<p class="wp-block-paragraph">你也可以把DeepSeek R1 1.5B版本部署到手机，让它在手机本地的Web浏览器上流畅运行。</p>



<p class="wp-block-paragraph">免费使用意味着在联网状态下，你不用花钱，就能享受ChatGPT付费用户每月花20美元、200美元才能使用的高端模型。</p>



<p class="wp-block-paragraph">这让大众看到了真正的AI自由。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="740" src="https://touheima.com/wp-content/uploads/2025/01/deepseek8.webp" alt="" class="wp-image-1259" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek8.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek8-300x222.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek8-768x568.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">短短几天之内，DeepSeek已经成为硅谷讨论最多的公司，被视作“威胁美国AI巨头”的存在。一些外媒将DeepSeek R1的问世比作“中国的ChatGPT时刻”，称其“打破了美国在AI领域无敌的论调”，令整个硅谷嗡嗡作响。<br><br>硅谷顶级风投a16z的创始人Marc Andreeseen发文评论说，DeepSeek是“我见过的最令人惊叹、令人印象深刻的突破之一”，“作为开源，是给世界的一份意义深远的礼物”。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="448" src="https://touheima.com/wp-content/uploads/2025/01/deepseek9.webp" alt="" class="wp-image-1260" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek9.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek9-300x134.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek9-768x344.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">斯坦福大学计算机科学系客座教授吴恩达在第55届世界经济论坛上说对DeepSeek的进展印象深刻，微软董事长兼CEO萨提亚·纳德拉表态“必须非常非常认真地对待中国的这些进展”。<br><br>许多网友夸赞DeepSeek成为“新晋开源AI之王”，其影响就像安卓之于移动生态。英伟达高级研究经理兼GEAR Lab联合创始人Jim Fan发文称赞：“一家非美国公司正在让OpenAI的最初使命继续存在——真正开放、前沿的研究，赋能所有人。”Meta首席AI科学家杨立昆说，DeepSeek的成功表明开源模型正在超越专有模型，开源将使每个人都从中受益。<br><br>在国内，DeepSeek R1的文笔已经风靡社交平台。它能够模仿不同语言风格，洋洋洒洒输出各种奇妙的金句，写出文采斐然的精彩文章，不过仍不能解决严重的幻觉问题。让DeepSeek R1一句话辣评竞品，它也能给出非常有梗的毒舌点评：<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="859" src="https://touheima.com/wp-content/uploads/2025/01/deepseek10.webp" alt="" class="wp-image-1261" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek10.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek10-300x258.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek10-768x660.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">AI社区的活力被持续激发。软件作曲家Riley Brown分享自己使用DeepSeek推理模型，在短短1小时内，创建了AI搜索引擎Perplexity AI的克隆版。他说自己没写一行代码。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="947" src="https://touheima.com/wp-content/uploads/2025/01/deepseek11.gif" alt="" class="wp-image-1262"/></figure>



<p class="wp-block-paragraph">来自AI实验室EXO Labs的Alex Cheema分享说，他把7台M4 Pro Mac mini和一台M4 Max MacBook Pro相连来运行DeepSeek R1，总内存496GB，利用EXO Labs的分布式推理和4bit量化来实现“在家AGI”。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="640" height="1005" src="https://touheima.com/wp-content/uploads/2025/01/deepseek12.gif" alt="" class="wp-image-1263"/></figure>



<p class="wp-block-paragraph">Y Combinator首席执行官Garry Tan今日发文分享他的使用体验：“经过几次查询后，DeepSeek搜索感觉更加可靠，因为看到推理过程（乃至它对自己知道什么和可能不知道什么有多么认真）会大大增加用户的信任。”<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="341" src="https://touheima.com/wp-content/uploads/2025/01/deepseek13.webp" alt="" class="wp-image-1264" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek13.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek13-300x102.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek13-768x262.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">此前一则在硅谷匿名八卦分享平台Blind上发布的消息广为流传，称Meta因DeepSeek的成功而陷入危机。另据The Information今日援引Meta员工消息，Meta AI基础设施主管Mathew Oldham等高管担心Meta的下一代Llama旗舰模型的表现不会像DeepSeek那么出色。<br><br>据说Meta生成式AI团队和基础设施团队已经启动4个作战小分队来剖析DeepSeek工作原理：</p>



<p class="wp-block-paragraph"><strong>小分队1和2试图搞清楚DeepSeek是如何降低训练和运行成本的；<br>小分队3负责研究DeepSeek可能使用了哪些数据来训练模型；<br>小分队4正在考虑基于DeepSeek模型的属性重组Meta模型的新技术。</strong></p>



<p class="wp-block-paragraph">Meta计划将从中吸取的经验用于改进Llama。下一个版本的Llama可能将在本季度发布，将包括多款模型。<br>“我们在开发过程中定期评估所有竞争模型，自从（公司的）生成式AI（团队）成立以来，我们就一直这样做。”Meta发言人Jon Carvill在一份声明中说，“Llama一直是建立开源AI模型生态系统的基础，我们对即将发布的Llama 4扩展这一领先地位感到非常兴奋。”<br><br>一些AI公司已经考虑转向DeepSeek。<br><br>Together AI是一家帮助开发者运行和调整开放权重模型的AI公司。其联合创始人兼CEO Vipul Ved Prakash说，过去两周，他们每天都将DeepSeek模型的运行能力提高1倍，以满足客户需求；许多客户已经从Anthropic的Claude 3.5 Sonnet转向DeepSeek模型，用于AI编程。<br><br>企业级AI代理开发商SuperFocus的联合创始人Steve Hsu一直在使用上个月发布的DeepSeek v3模型，认为它的性能与为SuperFocus大部分生成式AI功能提供支持的OpenAI旗舰模型GPT-4相似甚至更好。他说SuperFocus可能会在未来几周转向DeepSeek，因为DeepSeek可以免费下载、在自家服务器上存储和运行，并将增加销售产品的利润率。<br>“DeepSeek效应”令美股陷入动荡，更给美国AI公司们带来了空前紧迫感。<br><br>中国AI公司证明了用有限的计算资源，足以做出顶尖水平的模型。OpenAI估值已经高达1570亿美元，如果不能确保在AI前沿赛道遥遥领先，又不能展现出显著的投资回报率，如何证明其高估值和高开销的合理性？<br><br>AI经济效益悬而未决，而美国正计划大举砸钱投入AI基础设施。就在上周，美国新任总统特朗普宣布OpenAI、甲骨文、软银将成立一家合资企业“星际之门项目”，未来四年斥资5000亿美元（约合人民币3.6万亿元）建设新的AI数据中心。（特朗普宣布AI巨型项目：3.6万亿！）<br><br>今年早些时候，微软宣布将投入800亿美元用于AI数据中心建设。Meta创始人扎克伯格也在上周发文，称今年将是“AI决定性的一年”，Llama 4将成为领先的SOTA模型，Meta正在建设一个2GW+数据中心，将拥有超过130万块GPU，计划今年将600亿~650亿美元用于资本支出。<br></p>



<figure class="wp-block-image size-full"><img loading="lazy" decoding="async" width="1000" height="984" src="https://touheima.com/wp-content/uploads/2025/01/deepseek14.webp" alt="" class="wp-image-1265" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek14.webp 1000w, https://touheima.com/wp-content/uploads/2025/01/deepseek14-300x295.webp 300w, https://touheima.com/wp-content/uploads/2025/01/deepseek14-768x756.webp 768w" sizes="auto, (max-width: 1000px) 100vw, 1000px" /></figure>



<p class="wp-block-paragraph">记者Holger Zschaepitz评价DeepSeek可能是对美国股市的最大威胁，因为该模型引发了对数千亿美元资本支出的效用的质疑。Garry Tan则认为DeepSeek的成功对美国竞争对手有好处：“如果训练模型变得更便宜、更快、更容易，那么对推理（实际使用AI）的需求将增长和加速得更快，这确保了计算的供应将被使用。”<br></p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="730" height="1024" src="https://touheima.com/wp-content/uploads/2025/01/deepseek15-730x1024.webp" alt="" class="wp-image-1266" srcset="https://touheima.com/wp-content/uploads/2025/01/deepseek15-730x1024.webp 730w, https://touheima.com/wp-content/uploads/2025/01/deepseek15-214x300.webp 214w, https://touheima.com/wp-content/uploads/2025/01/deepseek15-768x1078.webp 768w, https://touheima.com/wp-content/uploads/2025/01/deepseek15.webp 1000w" sizes="auto, (max-width: 730px) 100vw, 730px" /></figure>



<p class="wp-block-paragraph">在去年7月接受《暗涌》采访时，DeepSeek创始人梁文锋曾谈道，DeepSeek押注了三个方向：一是数学和代码，二是多模态，三是自然语言本身。他认为过去三十多年IT浪潮里，中国基本没有参与到真正的技术创新里，随着经济发展，中国也要逐步成为贡献者，而不是一直搭便车。<br><br>股市的激烈波动或许短暂，通往AGI的发展路径也尚不明晰。但显而易见，DeepSeek R1正在改写AI游戏规则。它所代表的中国AI开源力量扇动翅膀，已经在全球科技产业刮起影响深远的飓风。</p>



<p class="wp-block-paragraph"><strong>撰文 |&nbsp;</strong>ZeR0<br><strong>摘编 |&nbsp;</strong>智东西</p>



<p class="wp-block-paragraph"></p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>英伟达芯片倒爷，快玩不动了</title>
		<link>https://touheima.com/nvidia-chips-are-running-out-of-fun/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Sun, 07 Apr 2024 12:06:55 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[AI]]></category>
		<category><![CDATA[NVIDIA]]></category>
		<category><![CDATA[芯片]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1083</guid>

					<description><![CDATA[在这一波英伟达囤积的算力释放之后，倒爷们会逐渐沉寂，最终大多数都会消失。]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph">3月30日，美国升级对华芯片出口禁令，表示将对中国出口的AI半导体产品采取“逐案审查”政策规则，全面限制英伟达、AMD以及更多更先进AI芯片和半导体设备向中国销售。</p>



<p class="wp-block-paragraph">这一举动实质影响有限——在2022年和2023年，美国已经两度收紧对华AI芯片出口。产业界普遍对出口的口子被重新扩大不抱幻想。从2022年下半年开始，中国公司就开始疯狂抢购英伟达等AI芯片，一张GPU售价一度飙涨至接近40万元。</p>



<p class="wp-block-paragraph">一个被普遍接受的观点是，在国产芯片能够逐渐替换英伟达之前，仍旧有至少三五年的过渡期。拥有足够多的英伟达芯片，目前暂时是大多数中国公司参与新一轮AI竞争的生命线。</p>



<p class="wp-block-paragraph">这也催生了一个特殊职业：倒卖英伟达芯片。传闻里，这生意一本万利，倒爷们神通广大，赚得盆满钵满。果真如此吗？</p>



<p class="wp-block-paragraph">我们试图讲述一位掮客在此间经历的疯狂、欲望和欺骗。人类历史上下一场科技革命最重要的燃料，世界上最稀缺的算力资源，如何在无数隐蔽的小黑屋和推销电话里，被决定了流向——这正是阿诚的故事的特别之处。</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="683" src="https://touheima.com/wp-content/uploads/2024/04/nvidia03-1024x683.png" alt="" class="wp-image-1079" srcset="https://touheima.com/wp-content/uploads/2024/04/nvidia03-1024x683.png 1024w, https://touheima.com/wp-content/uploads/2024/04/nvidia03-300x200.png 300w, https://touheima.com/wp-content/uploads/2024/04/nvidia03-768x512.png 768w, https://touheima.com/wp-content/uploads/2024/04/nvidia03.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<h5 class="wp-block-heading has-text-align-center">“5个亿”</h5>



<p class="wp-block-paragraph">阿诚号称自己搞成了5个亿的生意。<br><br>他曾是一个普通的英语老师。2023年9月，阿诚入职深圳一家卖英伟达芯片的分销公司。做的第一件事，是给自己整了一套全新的名片。即使那时他身上已经装了六七种不同身份的名片，随时可以对不同的人展开不同的说辞，但没有哪个身份比这张名片上的头衔更让他觉得有面子了——新纪元科技有限公司中国区销售总负责人。</p>



<p class="wp-block-paragraph">只要他不说，没有外人会猜到，包括总负责人在内这公司只有两个销售——阿诚是其中一个，再加上老板、财务、售后，他们就开始搞事了。</p>



<p class="wp-block-paragraph">在绝对的产品力面前，任何销售技巧都是多余的。在一个500人的芯片大群里，我只加了诚哥一个人，因为他的群昵称太有诱惑力了：诚哥H800。</p>



<p class="wp-block-paragraph">H800，英伟达特供中国的一款数据中心GPU，也是2023年大模型算力竞赛里中国公司能合法买到的最先进的GPU。当下，英伟达就是训练大模型所需算力的最优解。全世界都在抢购。有人说，大模型的风吹了一年多，只有两拨人赚到了钱：一拨人卖AI课、一拨人炒英伟达芯片。</p>



<p class="wp-block-paragraph">2023年10月，美国宣布扩大对华芯片管制，H800等四款产品也被要求禁运。当天，英伟达特供中国的A800和H800芯片停止接单。接下来，价格是按小时涨的，短短一周内，单张H800卡的报价几乎从20万元人民币翻了一番。一台H800服务器在10月初的服务器售价为220万元，到了10月底已经飙涨到300万元。</p>



<p class="wp-block-paragraph">半年后，在深圳南山附近的一家咖啡店里，诚哥问我，“你猜我们五个人，一个月卖了多少钱？”</p>



<p class="wp-block-paragraph">“5——个——亿哦。”许是很满意我已经惊讶到接不上话，他主动吐露了答案。我看着这个西装下穿着运动鞋、风尘仆仆的80后男人，他看起来真诚、老实，微微含着肚腩，给人一种腼腆的感觉，只有瞳孔因为兴奋而明显放大——我突然相信了，他刚才告诉我他老板说他炒芯片时的状态——“阿诚啊，你一炒芯片就眼睛发光，肯定是要发大财哇。”</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="720" src="https://touheima.com/wp-content/uploads/2024/04/nvidia02-1024x720.png" alt="" class="wp-image-1080" srcset="https://touheima.com/wp-content/uploads/2024/04/nvidia02-1024x720.png 1024w, https://touheima.com/wp-content/uploads/2024/04/nvidia02-300x211.png 300w, https://touheima.com/wp-content/uploads/2024/04/nvidia02-768x540.png 768w, https://touheima.com/wp-content/uploads/2024/04/nvidia02.png 1130w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<h5 class="wp-block-heading has-text-align-center">H100，财富密码</h5>



<p class="wp-block-paragraph">发财，首先要有机会。两年前，对阿诚来说，机会还显得那么有距离。</p>



<p class="wp-block-paragraph">那时他在英语教培机构工作，别说大财了，想在深圳买房要攒钱到下辈子。他不甘心。2021年7月。双减政策一出，阿诚是机构里第一个跑路的人。</p>



<p class="wp-block-paragraph">一个没了工作的35岁男人，在不少地方要被归类为中年loser（失败者）。但是深圳有自己独特的造富生态，单车变摩托的故事俯拾皆是。在阿诚看来，早年卖山寨机，“互联网+”兴起时玩地推，等到比特币行情起来了再用显卡挖矿，发币割韭菜的，很可能就是同一拨人。</p>



<p class="wp-block-paragraph">风口在变，身份都是自己给的。</p>



<p class="wp-block-paragraph">当时，这个风口是“炒芯片”。既然是炒，就说明有套利的空间。疫情后缺芯危机愈演愈烈，珠三角活跃着上万个芯片黄牛，一些公司一个月就可以招聘100个芯片销售。阿诚折腾起了芯片。在外人看来。从英语老师转行卖芯片实在是匪夷所思，但是在诚哥的口中，这个难度并不存在，“公司招人时，对我发了个面试邀请，我就过来了”。<br>不需要专业知识吗？我很怀疑。</p>



<p class="wp-block-paragraph">“其实……”他顿了一下说，“很多时候都是现学的。”</p>



<p class="wp-block-paragraph">他认为，高杠杆的事情才有得赚。倒卖信息差就是杠杆最高的赚钱方式。越是风口上的行业，信息差越高，杠杆越高。如果在风口上，个人能力的参差似乎并不重要。</p>



<p class="wp-block-paragraph">问题是，一穷二白的人如何跟上风口？</p>



<p class="wp-block-paragraph">诚哥其实也不知道，他能做的，就是跑动得勤快一些。短短一年不到，他加了几百个行业群，跑了几百场会，换了几百张名片，他的身上有一种深圳式的搞钱执着。即使千里迢迢跑到外地去参会他也很少觉得辛苦。</p>



<p class="wp-block-paragraph">他深信一点：只要圈子对了，赚钱就像呼吸一样简单。</p>



<p class="wp-block-paragraph">珠三角成为中国电子信息产业集聚地已经快40年，近些年一个越来越明显的变化是，国际局势任何风吹草动，都可能改变这里一群人的生计。</p>



<p class="wp-block-paragraph">2022年底，大模型开始席卷科技圈。诚哥发现，有一个词高频地出现在圈子中。这些人无论原来是在挖矿、玩NFT、搞元宇宙，现在，他们有了一个新的财富密码：H100。</p>



<p class="wp-block-paragraph">H100，英伟达这一轮市场行情的起点。如果说英伟达当下是训练大模型所需算力的最优解，H100就是最优解中的明珠。</p>



<p class="wp-block-paragraph">大模型的竞争会被称为算力军备竞赛，是因为大模型本质上还是一种大力出奇迹的暴力美学，换句话说，想要获得更强大的模型效果，就得靠堆卡，堆更多、更强大的卡。<br><br>供需极度失衡。行业媒体GPU Utils曾经做过一个测算，H100一年的出货量大约也只有55万张。但是，仅美国大型科技公司和少数几家明星初创公司，对H100的需求量一年内就达到了43万张。对Meta之类的巨头公司来说，囤上10万张H100在商业竞争中才有先机。而对初创企业来说，没有1万张H100，连坐上牌桌的资格都没有。</p>



<p class="wp-block-paragraph">中国也差不多的情况，但中国公司的需求被美国政府的出口限制强行摁住。2022年10月，美国对华启动芯片管制。几乎是在H100和比其性能稍弱的A100被禁运的同一时间，OpenAI发布了chatGPT，从那时起，有多少张英伟达卡，成了中国科技公司AI实力的一把标尺。几乎所有选择宣布加码大模型的互联网大厂，在财报会上一定会被问的一个问题是，公司储备了多少英伟达卡？</p>



<p class="wp-block-paragraph">第一拨行动者出现了。在2022年夏天之前，原价18万多元人民币的H100在中国需求量并不惊人，性价比低点的A100甚至有些滞销。然而，芯片禁令后市场上不多的存货就像被蝗虫过境，一扫而空。</p>



<p class="wp-block-paragraph">四个月后，中国的大模型业进入了“百模大战”时间，英伟达面向中国客户推出H800，这个版本被俗称为H100的“阉割版”，英伟达在这个版本里去掉了受美国政府那一轮禁令管制的参数。加上此前已经推出的A100低配版A800，英伟达的中国客户还算有卡可用。抢卡的竞争又来到了一个新赛点。</p>



<p class="wp-block-paragraph">至少有五类角色在疯狂抢购：电信运营商、服务器大厂、互联网和AI公司，以及业务和算力无关但是现金流充沛的大企业。</p>



<p class="wp-block-paragraph">英伟达芯片在中国市场有四种渠道流通。其中两种可以订购中国特供版的官方渠道：一条通过英伟达自己的经销商体系，一条通过英伟达认证过的服务器大厂经销商体系，这两条渠道上挤满了排队下单的大厂，交付的时间则取决于英伟达，最快也要到2023年底。为了插队，大厂高管们八仙过海式的拉关系，甚至不乏上市公司老板直接飞去美国见英伟达CEO（首席执行官）黄仁勋。</p>



<p class="wp-block-paragraph">另外两种渠道则通过黄牛，这个渠道多少有点暗箱操作：一类有海外背景，可以有特殊的海外渠道让H100/A100流入内地；另一类则是体量更小的散户，他们的货源来自内地，“至于具体是哪里，那就要看各自的本事了”。</p>



<p class="wp-block-paragraph">“一卡难求”的情况甚至还推高了国产芯片的市场空间。诚哥一开始没有渠道，卖不了英伟达芯片。他花了四个多月，帮一家号称“中国英伟达”的国产AI芯片公司成交了一笔200多万元的合同。</p>



<p class="wp-block-paragraph">可是，他却没能拿到一分佣金。</p>



<p class="wp-block-paragraph">诚哥认为，之所以说好的佣金也不给他，是因为这公司自己处境艰难。他的依据很简单，市场上愿意买英伟达之外芯片的厂商寥寥，“客户买英伟达的卡是拼手速，秒慢没；买这公司的卡要磨磨蹭蹭，讨价还价”。即便卖出去了，客户的目的只是为了符合国产芯片需占一定比例的采购要求，买了卡也通常是堆在库房。</p>



<p class="wp-block-paragraph">此时，对在2023年向英伟达下订单的大多数中国公司来说，H800遥遥无期，A800是唯一到货的产品。这一产品刚推出时售价为7.4万元，到了6月底，黄牛开出的高配版的售价逼近10万元，而到了7月下旬，价格已超过12万元。无论是出于抬高价格还是恐慌心理，市场在疯传，美国将要再次收紧芯片管制。</p>



<p class="wp-block-paragraph">入局者也越来越多了。如果说一年前的夏天，大量囤英伟达卡的公司必定业务和其有相关，现在也可能是一个卖味精的公司或者是一家女装公司。囤卡的散户也从过去长期依赖英伟达显卡挖矿的大佬，变成了现在可能是任何一个毫无背景的人。比如一个曾经的英语老师。</p>



<p class="wp-block-paragraph">诚哥就是那个时候入局的——新纪元这家公司当时成立才一个月，但有“渠道”。</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="768" src="https://touheima.com/wp-content/uploads/2024/04/nvidia04-1024x768.jpg" alt="" class="wp-image-1078" srcset="https://touheima.com/wp-content/uploads/2024/04/nvidia04-1024x768.jpg 1024w, https://touheima.com/wp-content/uploads/2024/04/nvidia04-300x225.jpg 300w, https://touheima.com/wp-content/uploads/2024/04/nvidia04-768x576.jpg 768w, https://touheima.com/wp-content/uploads/2024/04/nvidia04.jpg 1280w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<h5 class="wp-block-heading has-text-align-center">“先签了再说”</h5>



<p class="wp-block-paragraph">从外表上看，新纪元实在是不够新。在大厂林立的深圳南山，这里着实太简陋了：两间屋子，五把椅子，还有一些电脑和手机，就是全部家当。</p>



<p class="wp-block-paragraph">诚哥一进去就发现了这是个草台班子。虽然他之前只短暂卖过四个月国产AI芯片，但他已经是公司里经验最丰富的人。老板是个快60岁的老江湖，年纪不小，看起来却很有一股疯劲。他对阿诚直言不讳，招他来，是因为他有些经验但是又不多，“太会的人拿捏不住”。</p>



<p class="wp-block-paragraph">被寄予厚望的诚哥获得了使用单独办公室的权利。不是因为他资深，而是他不喜欢和同事们在一起打电话。</p>



<p class="wp-block-paragraph">这种古老的营销手段，在这个新圈子里却有用。诚哥和同事们获客的方式就是先在网上找到哪里出现了招投标的消息，再找到消息中参与公司的联系方式，直接打过去。</p>



<p class="wp-block-paragraph">诚哥有一个观察，人们对陌生电话常充满警惕，但是对推销英伟达的陌生电话格外宽容。在听完他说“你好，我是卖英伟达卡的”之后，几乎所有人都会愿意聊下去。无论对方是一家上市公司AI业务总监，或是某个大型实验室采购负责人，通常对话不需要进行十句，双方加上微信，诚哥便会把报价和合同推过去。</p>



<p class="wp-block-paragraph">在一个绝对的卖方市场里，有了货源就意味着有了权力。在中国，英伟达的两种官方渠道一类是原厂—总代理—经销商—市场；另一类是原厂—服务器大厂—经销商—市场。</p>



<p class="wp-block-paragraph">看起来，每种渠道只有四类角色，是一个组织严密的金字塔状；但事实是由于市场过热，这两个结构已经被冲击成网格式的蜂巢状了——换句话说，每一类角色的背后，都可能分化出无数二道贩子，交易也不再是逐级流通。</p>



<p class="wp-block-paragraph">诚哥的公司就是这样游离在第二种边缘。“我们老板和服务器大厂那边有些关系，能搞到卡。但我们没有大厂正规经销商的资质，充其量只能说是游击队。”不过，即使是游击队在当时也拥有了不一般的地位。诚哥说，他见客户从来都是“让客户过来”，和客户吃饭时“他们对能搞到货的人佩服得五体投地”。</p>



<p class="wp-block-paragraph">如今，阿诚回想起来那段日子，能想到的形容词只有一个，“疯狂，太疯狂了”。10月17日，美国扩大对华芯片管制范围，英伟达在中国市场流通的所有AI芯片均被列入其中。</p>



<p class="wp-block-paragraph">这份管制原定有30天公示期。这段时间也因此被行业人士视为“最后30天窗口期”。理论上说，最后30天，英伟达等企业会把所有先进AI芯片产能、库存都优先供给中国市场。这会是中国企业抢购英伟达芯片最后的“操作窗口”。</p>



<p class="wp-block-paragraph">此时，H800单卡市场价已经飙升至21万元一张左右。很快，新纪元公司就成交了一笔4亿元的合同。还没有来得及庆祝，就又签下了一个1亿多元的单。</p>



<p class="wp-block-paragraph">我在禁令出台当天和他通了一个电话，那时他刚刚接完一个十几亿元的订单垂询，声音嘶哑，但是是破音的那种兴奋。接下来，他的电话就再也没有打通过——他太忙了。</p>



<p class="wp-block-paragraph">过去对他发消息从来不回的大厂高管，为了买卡一天发十几条消息。一家公司问他们能搞到多少张，“280万元以下的H800服务器有多少台我们都收”。诚哥在那几天几乎疯狂，不需要吃饭，也不会疲劳，只要在呼吸，就可以卖卡。他根本没有考虑过有没有货源能交付。</p>



<p class="wp-block-paragraph">“先签了再说。”</p>



<p class="wp-block-paragraph">他闭上眼睛，想睡一会，脑海里又响起来狂躁的询问声，“有卡吗！有卡吗！有卡吗！买卡吗！买卡吗！买卡吗！”</p>



<p class="wp-block-paragraph">人类历史上下一场科技革命最重要的燃料，世界上最稀缺的算力资源，就这样在这些隐蔽的小黑屋和电话里，被决定了流向。</p>



<figure class="wp-block-image aligncenter size-full"><img loading="lazy" decoding="async" width="860" height="573" src="https://touheima.com/wp-content/uploads/2024/04/nvidia05.jpg" alt="" class="wp-image-1077" srcset="https://touheima.com/wp-content/uploads/2024/04/nvidia05.jpg 860w, https://touheima.com/wp-content/uploads/2024/04/nvidia05-300x200.jpg 300w, https://touheima.com/wp-content/uploads/2024/04/nvidia05-768x512.jpg 768w" sizes="auto, (max-width: 860px) 100vw, 860px" /></figure>



<h5 class="wp-block-heading has-text-align-center">数字游戏</h5>



<p class="wp-block-paragraph">仅仅是在一周之后，阿诚就开始怀疑，这一切不过是在玩数字游戏。</p>



<p class="wp-block-paragraph">10月25日，美国宣布禁令立刻生效，30天窗口期以一种戏剧性的方式被掐断。不久之后，和上次在英语培训机构一样，他先跑路了。</p>



<p class="wp-block-paragraph">原因很简单。那些天价订单生意，随着交付日期的临近，他太担心老板要卷款跑路了。这担心始终存在于公司所有人的心里。空手套白狼的例子太多了——假设A公司什么也没有，也可以和B先谈妥一笔供应合同，A再去找C拿货，C的货可能也是从D或者E处加价买来，中间A发现F的开价比B要高，于是此前的一切白纸黑字都可以作废。</p>



<p class="wp-block-paragraph">有多少合同能够落地？就像那笔4亿元的订单，货物从签单到完成交付中间隔了12周的时间，市场价涨了100多万元，而毁约只需要成单价1%的罚金，他很怀疑，老板不会选择交付。</p>



<p class="wp-block-paragraph">那么那批货到哪里去了呢？</p>



<p class="wp-block-paragraph">诚哥也不知道。他告诉我，自始至终，他没有见到那批货，就像他也没有见到那笔钱一样。</p>



<p class="wp-block-paragraph">更重要的是，诚哥突然发现，90%的倒爷赚不到大钱，这让我意外。他给我算了一笔账，假设一台H100八卡服务器出厂价250万元，终端市场价280万元，中间看起来有30万元的差价，但是很可能倒了十次不止，一家只能赚3万元。这些利润大部分被掌握货源的老板吞掉，他作为打工人，抽成是利润的3%。</p>



<p class="wp-block-paragraph">因此，这生意只有掌握货源的人才能赚到钱。他有一个切身感受，这两年来各家疯抢GPU的力度远远超过了真实需求，更类似于市场对美国随时有可能加码的芯片制裁的本能反应——只要科技竞争的阴影存在，高端AI芯片必然是期货。不少公司是在以此为投资。甚至可以说，找散户下单的公司，将来相当一部分还会选择再把芯片卖出去。</p>



<p class="wp-block-paragraph">归根结底，二道贩子这么多，是因为货源太稀缺了。“无论芯片通过什么方式进入国内，就像水流一样，封锁当然不可能完全封锁，但已经足够锁住大部分的水流了。”阿诚说。</p>



<p class="wp-block-paragraph">事实是，所有的疯狂都是徒劳。在2023年10月17日芯片禁令之后，合法渠道到货的H800寥寥无几。</p>



<p class="wp-block-paragraph">财报显示，2023年第三财季，英伟达中国大陆收入高达40.3亿美元，环比大涨47%。出口管制规则出台后，2023年第四财季英伟达中国大陆收入仅为19.5亿美元，环比大降52%。当季，中国大陆仅占英伟达总营收的8.8%，是历史最低点。</p>



<p class="wp-block-paragraph">英伟达和AI相关的数据中心业务在中国大陆的收入占比过去长期达到20%-25%。但自2023年10月起，该收入显著减少。英伟达高层表示，2023年第四财季，中国大陆在数据中心收入中的比例已降至个位数，预计下个财季也将保持这一水平。</p>



<p class="wp-block-paragraph">对大多数渴望暴富的人们来说，那些像做梦一样的日子，最后真的落了一场空。</p>



<figure class="wp-block-image aligncenter size-large"><img loading="lazy" decoding="async" width="1024" height="768" src="https://touheima.com/wp-content/uploads/2024/04/Nvidia06-1024x768.webp" alt="" class="wp-image-1076" srcset="https://touheima.com/wp-content/uploads/2024/04/Nvidia06-1024x768.webp 1024w, https://touheima.com/wp-content/uploads/2024/04/Nvidia06-300x225.webp 300w, https://touheima.com/wp-content/uploads/2024/04/Nvidia06-768x576.webp 768w, https://touheima.com/wp-content/uploads/2024/04/Nvidia06.webp 1200w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<h5 class="wp-block-heading has-text-align-center">抛物线后半段</h5>



<p class="wp-block-paragraph">不过，英伟达的行情仍在持续。</p>



<p class="wp-block-paragraph">2024年，英伟达将会推出H200等四款革命性AI计算产品。同时，根据瑞银近期的研究，其交付时间在缩短，已经从2023年末的8个至11个月缩短了一半时间。一些机构预测称，英伟达在今年将销售大约150万到200万个AI GPU，数量是2023年3倍。</p>



<p class="wp-block-paragraph">看起来，这些与中国无关了。但是，这里有一个连锁反应在后，英伟达在全球范围内供应能力的增长将会给中国企业带来更大的竞争压力。随着全球AI应用水平因GPU供应的大量增加而快速提升，中国必须寻找替代方案来应对。</p>



<p class="wp-block-paragraph">目前，通过官方渠道购买H/A800和H/A100已经不可能。黄牛之间流通的芯片价格略有回落，但依旧令人咋舌。离开新纪元以后，阿诚自己开了一家公司，刚刚给客户报了价，一台搭载八个H800的AI服务器价格还是约300万元。好在一些此前被囤积的芯片正在被释放，市场上现货充足，一般两周以内就能交付。</p>



<p class="wp-block-paragraph">因为生意不稳定，他还同时在另一家英伟达代理商那里上着班。即使AI芯片受限，他还是坚定看好英伟达包括游戏显卡和自动驾驶在内其他业务在中国的前景。</p>



<p class="wp-block-paragraph">这块市场英伟达无法放弃。在芯片禁令不久之后，英伟达再次针对中国市场推出了三款在数据传输速度等关键性能上进一步降低的芯片：H20、L20和L2。市场上传言，这些芯片性价比太低，并不受中国公司青睐。中国公司更愿意采购国产新品。</p>



<p class="wp-block-paragraph">阿诚对这种传闻嗤之以鼻。“那些只是外界的一厢情愿”。具备推理能力的L20最先面世，但是迅速被几家互联网大厂抢购一空，没有多少能流入到市场上。而适用于大模型训练的H20也不是中国公司不想买，而是买不到。H20在今年1月开始接受预订，但仅限大客户。</p>



<p class="wp-block-paragraph">中国公司想要通过正规渠道获得英伟达芯片，可能性越来越小了。</p>



<p class="wp-block-paragraph">这反而激发了部分公司对特殊途径的需求。无论是将芯片通过非禁运国家以转运的方式进入中国市场，还是考虑把数据中心业务建在海外，在业内人看来，即使审查的手段越来越严。愿意冒险的公司数量仍在明显变多。</p>



<p class="wp-block-paragraph">3月30日凌晨，美国商务部宣布了一项新的出口管制规定，对涉及美国和中国澳门等地区的对华半导体产品销售限制进行了调整，同时，美国对华出口的AI半导体产品将实施“逐案审查”政策，对技术等级、客户身份、合规计划等进行全面审查。也就是说，新规进一步限制英伟达、AMD以及其他先进AI芯片和半导体设备对中国的销售。</p>



<p class="wp-block-paragraph">想要通过特殊渠道让芯片流入中国，也越来越难了。</p>



<p class="wp-block-paragraph">这在意料之中。阿诚告诉我，这些变化在短期内影响不大。新规主要限制AI芯片未来流入中国的可能，但是中国市场在此前囤积的芯片已经足够很长一段时间供需。他注意到，交付周期在明显缩短。之前一些在疯狂抢卡的公司，现在已经开始卖卡和做算力租赁了。过去倒爷们只需要强调“有卡，速来”，现在还要强调“量大，可持续供应”。</p>



<p class="wp-block-paragraph">不过，可以预见，在这一波囤积的算力释放之后，倒爷们会逐渐沉寂，也许最终大多数都会消失。“中国区需求量的高峰期是在去年三季度。炒货的高峰期是在去年四季度，但是需求量已经在减少了。”他认为，中国公司对英伟达的需求已经过了抛物线的高点。接下来，英伟达在中国的发展重点不是是否衰退，而是衰退的曲线如何变化。</p>



<p class="wp-block-paragraph">技术的领先是有时间期限的。对中国公司来说，如果无法购买更先进的英伟达产品，现有存货的优势终将随着时间变化而减少。他听说了一些关于国产AI芯片如今供不应求的故事——情况和去年这时已经大不同了。他对华为芯片很感兴趣，有机会的话也想卖。</p>



<p class="wp-block-paragraph">不过眼下，阿诚还得先做好英伟达，年前他刚刚成交一单700万元的生意。“一切都会越来越好的。”他充满信心，因为现在的圈子多得是企业中高层和行业大人物。他向我谈起一个关系密切的中间人，告诉我对方“是某某亚太AI协会的领导，协会里有100多位院士”。他说，之前对方帮他介绍过1笔500台以上的大订单，如果成了，他要付给对方一台3万元的中介费，也就是对方至少可以赚1500万元。</p>



<p class="wp-block-paragraph">“可惜没有成。”我看着他一脸真诚的遗憾，有些常识不确定他知不知道，中国大陆并不允许公司注册名以亚太开头——所以我一看到以亚太为名的机构，很难不联想到注册在中国香港的皮包公司。</p>



<p class="wp-block-paragraph">（文中新纪元和阿诚均为化名）</p>



<p class="wp-block-paragraph"><strong>撰文｜</strong>顾翎羽<br><strong>编辑｜</strong>谢丽容<br><strong>摘编｜</strong>财经杂志</p>
]]></content:encoded>
					
		
		
			</item>
		<item>
		<title>英伟达会跌吗？来自其他科技巨头财报的迹象</title>
		<link>https://touheima.com/will-nvidia-stock-price-fall/</link>
		
		<dc:creator><![CDATA[投黑马]]></dc:creator>
		<pubDate>Mon, 04 Mar 2024 05:21:34 +0000</pubDate>
				<category><![CDATA[马上知道]]></category>
		<category><![CDATA[NVIDIA]]></category>
		<category><![CDATA[英伟达]]></category>
		<category><![CDATA[黄仁勋]]></category>
		<guid isPermaLink="false">https://touheima.com/?p=1035</guid>

					<description><![CDATA[AI是否像支持者所声称的那样具有革命性，还是仅仅是IT工具库中的一个有限补充？]]></description>
										<content:encoded><![CDATA[
<p class="wp-block-paragraph">上周五，英伟达又创下了历史新高。英伟达花了整整24年时间，才使其估值达到1万亿美元的罕见高度，但这一次乘着AI浪潮，<strong>实现第2个万亿美元却只用了八个月</strong>。</p>



<ul class="wp-block-list">
<li>如果你在2022年11月OpenAI刚刚发布ChatGPT时买入英伟达，并坚定持有到今天，你将获得564%的收益。</li>



<li>如果你嫌那时候太早，还没听说人工智能，那么如果你能在2023年3月GPT-4发布时买入英伟达，你将获得359%的收益。</li>



<li>如果你说去年下半年时有些人并不看好人工智能，觉得有些瓶颈一时半会突破不了，那么如果你在年底时想清楚，并且在今年1月买入英伟达，你将在短短的3个月里获得171%的收益。</li>
</ul>



<p class="wp-block-paragraph">对于英伟达的客户来说，很多科技领袖都在抱怨，要想买到英伟达的高阶GPU有多难，比如马斯克就曾调侃道：“现在GPU比毒品难买多了。”当时马斯克正在组建他的AI公司xAI。</p>



<p class="wp-block-paragraph">据WSJ报道，在加州帕洛阿尔托的一家豪华日本餐厅里，甲骨文创始人兼董事长埃里森和马斯克，一起与黄仁勋共进晚餐，埃里森回忆说：“<strong>马斯克和我在乞求，我想用这个词来形容我们再合适不过了。吃了一个小时的寿司，也乞求了一个小时。</strong>”</p>



<p class="wp-block-paragraph">我们今天这篇文章，将核心回答两个问题：一是英伟达的护城河坚固吗？二是苹果微软Meta谷歌等等科技巨头，都投入了大量资金进入AI，爆买英伟达芯片，这些投资到底给他们带来什么？</p>



<ul class="wp-block-list">
<li>当英伟达实现2万亿美元市值时，护城河坚固吗？</li>



<li>AI大革命还是股市投机？科技巨头的AI投资带来了什么？</li>
</ul>



<p class="wp-block-paragraph">由于利润暴涨，如果按市盈率（PE）计算，英伟达并不算高（英伟达是66，AMD是383，英特尔是110），并且英伟达的护城河也足够宽和深。未来一切要看客户们对AI的投资，能否转换为实际收入（有一些先行指标值得观察），否则仍然会陷入周期股的波折。以下，Enjoy：</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="848" src="https://touheima.com/wp-content/uploads/2024/03/nvidia01-1024x848.png" alt="" class="wp-image-1032" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia01-1024x848.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia01-300x248.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia01-768x636.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia01.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"><br><em>Morgan Stanley对英伟达的股价预测（2月21日）：<br>牛市情况（BULL Case）1000美元/股：利润率更高的数据中心，以人工智能为中心的软件和服务增长加速；基于GPU的人工智能PC受到青睐，客户端TAM大幅增加；汽车以及自动驾驶行业腾飞，给公司贡献重要的新增长点。<br>基本情况（BASE Case）795美元/股：2024年收入增长73.2%，2025年增长5.8%；由于供应仍然受限，数据中心业务将在2024年继续增长；英伟达在AI训练方面保持领先地位。<br>熊市情况（BEAR Case）425美元/股：芯片供应的速度快于需求，增长大幅放缓；人工智能开发成本大幅下降，强大的竞争对手进入市场，或者客户开始内购定制硬件解决方案。</em></p>



<h5 class="wp-block-heading has-text-align-center has-photology-brown-color has-text-color has-link-color wp-elements-10f6cc6dfa3ee9933e3ec5aae20ff29b">01<br>当英伟达实现2万亿美元市值时<br>护城河坚固吗？</h5>



<p class="wp-block-paragraph">翻开英伟达财报，确实满屏都写着：<strong>强劲</strong>。</p>



<p class="wp-block-paragraph">2月“暴击”华尔街的财报，不仅仅比市场最乐观的预期还高，并且对下一个季度依然给予了高增长预测，原因是科技巨头们会持续高投入于AI，这个趋势可能会持续全年，而原本有些人认为下半年这个趋势会减弱。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="814" height="1024" src="https://touheima.com/wp-content/uploads/2024/03/nvidia02-814x1024.png" alt="" class="wp-image-1031" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia02-814x1024.png 814w, https://touheima.com/wp-content/uploads/2024/03/nvidia02-238x300.png 238w, https://touheima.com/wp-content/uploads/2024/03/nvidia02-768x966.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia02.png 938w" sizes="auto, (max-width: 814px) 100vw, 814px" /></figure>



<p class="wp-block-paragraph">英伟达的业务划分很清晰，主要有五大业务线（核心来自其中两条）：</p>



<ul class="wp-block-list">
<li><strong>数据中心（Datacenter）</strong>：近期势头最猛的业务，同比增长高达409%，在总营收中占据83%；</li>



<li><strong>游戏（Gaming）</strong>：起家的核心业务（主要是游戏GPU），可以说没有游戏产业就没有英伟达，曾经在总营收中占大头，现在是13%；</li>



<li><strong>专业视觉（Professional Visualization）</strong>：针对数字内容创作等领域，在总营收中占2%；</li>



<li><strong>汽车（Automotive）</strong>：针对自动驾驶、智能座舱等领域，在总营收中占1%；</li>



<li><strong>OEM&amp;其他</strong>：针对笔记本电脑OEM和加密货币挖掘等等领域，在总营收中占1%。</li>
</ul>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="823" src="https://touheima.com/wp-content/uploads/2024/03/nvidia03-1024x823.png" alt="" class="wp-image-1030" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia03-1024x823.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia03-300x241.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia03-768x617.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia03.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">可以说，如今英伟达进入“美国市值前三、相当于意大利一国GDP”的征程，<strong>始于游戏产业</strong>。</p>



<p class="wp-block-paragraph">首先，我们来简单解释一下，<strong>为什么英伟达曾经用于游戏的GPU芯片（英伟达在这个领域占据了80%以上的份额），如今非常适合训练AI大模型？</strong></p>



<p class="wp-block-paragraph">在5年前，英伟达的芯片产品主要针对一个垂直市场——游戏。英伟达的GPU也称为图形处理器单元，最初就是为了游戏设计的，越来越逼真的游戏，需要在屏幕上同时渲染无数像素，达到更高的画质和体验。</p>



<p class="wp-block-paragraph"><strong>英伟达采取了并行处理的方式</strong>，将每次计算分成较小的块，然后将它们分配给芯片中的多个&#8221;内核&#8221;——处理器的大脑。这意味着，GPU的运行速度，远远快于以往按顺序完成任务的速度。</p>



<p class="wp-block-paragraph"><strong>这种技术如今非常适合训练大模型。</strong>因为大模型的基础是机器学习算法，而深度学习使用了人工神经网络，在这些网络中，计算机从海量数据集中提取规则和大规模计算，此时如果像GPU处理游戏一样，把任务分解成较小的块+并行处理，是提高速度的理想方案。高性能GPU可以拥有超过一千个内核，因此可以同时处理成千上万的计算。</p>



<p class="wp-block-paragraph"><strong>当英伟达意识到这一点之后，就开始专注于AI市场进行优化，</strong>以跟上大模型快速的发展步伐。如今，要想创建一个最复杂的AI大模型，通常会用到数万片英伟达先进的GPU H100。这些GPU的单价可达2.5万美元左右，成为了硅谷的稀缺品。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="668" src="https://touheima.com/wp-content/uploads/2024/03/nvidia04-1024x668.png" alt="" class="wp-image-1029" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia04-1024x668.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia04-300x196.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia04-768x501.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia04.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"><strong>更进一步的是，英伟达的护城河不仅仅是芯片速度快</strong>（即将推出H200，推理性能是目前主打产品H100的两倍，以及下一代数据中心GPU B100），<strong>它还有两道非常重要的护城河：芯片网络，与几乎构成了行业标准的软件平台</strong>。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="583" src="https://touheima.com/wp-content/uploads/2024/03/nvidia05-1024x583.png" alt="" class="wp-image-1028" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia05-1024x583.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia05-300x171.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia05-768x437.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia05.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"><strong>高性能芯片网络是英伟达重要的护城河。</strong>随着AI大模型参数量的飙升，负责训练这些大模型的数据中心，需要成千上万个GPU互相连接在一起，以提高计算能力，相比之下大多数计算机只使用少数几个GPU，这种技术被称为InfiniBand（无限带宽），它有着极高的高带宽和低延迟。英伟达在ChatGPT发布的9个月前，以70亿美元收购了以色列网络技术供应商Mellanox，就是为了能够把英伟达的芯片扩展为一整个数据中心的“超级芯片”，从而实现现代AI超级计算机。这也使得英伟达能够优化芯片网络的性能，这是竞争对手无法比拟的。</p>



<p class="wp-block-paragraph"><strong>另一道护城河是CUDA，</strong>这是一个允许客户微调处理器性能的软件平台，也是加速计算密集型任务最为依赖的软件生态基石。英伟达长期投资于CUDA，并鼓励开发人员用它来构建和测试AI应用，目前CUDA 拥有超过400万开发人员，在CUDA架构下已经编写了数百万行代码，这使得用英伟达芯片开发新AI程序变得更加容易，CUDA也成为事实上的行业标准。</p>



<p class="wp-block-paragraph"><strong>这两道护城河的存在，使得竞争对手即便造出了更好的硬件，也仍然是不够的。</strong>虽然英特尔和AMD都已加速推出自家AI芯片产品，以及英伟达的大客户亚马逊、谷歌和微软都在开发自主设计芯片，但英伟达仍然稳固地主导着AI芯片，<strong>因为它不仅能提供最好的芯片，还有最好的芯片网络和最好的软件，这使得任何眼红这块市场的竞争对手，都需要在这三个方面击败它，而在当下这几乎是不可能完成的任务。</strong></p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="740" src="https://touheima.com/wp-content/uploads/2024/03/nvidia06-1024x740.png" alt="" class="wp-image-1027" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia06-1024x740.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia06-300x217.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia06-768x555.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia06.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<h5 class="wp-block-heading has-text-align-center has-photology-brown-color has-text-color has-link-color wp-elements-fce95afacba5059b6fd0e1835341b3da">02<br>AI大革命还是股市投机？<br>科技巨头的AI投资带来了什么？</h5>



<p class="wp-block-paragraph">英伟达的2万亿美元市值能否持续，<strong>关键在于它的客户们拿着AI能做什么，不要将股市热潮，与实际的业务收入混淆。</strong></p>



<p class="wp-block-paragraph">对于英伟达的客户们来说，现在处于疯狂花钱的投入期，投资者对此倒也十分买账。很多科技巨头也成为了主要受益者，谷歌、亚马逊、苹果、微软、Meta市值从2023年开始至今平均增长了70%。这些公司也都在最近的财报电话会议上说，计划在今年增加资本支出，直接购买英伟达芯片。</p>



<p class="wp-block-paragraph">例如上个月，扎克伯格就在Instagram上说，Meta计划在今年年底前，要拥有35万枚英伟达H100芯片。按目前的芯片价格计算，这至少需要数十亿美元。</p>



<p class="wp-block-paragraph"><strong>芯片还被用于吸引资金和人才。</strong>英伟达所投资的一家公司CoreWeave，在去年把所持有的H100芯片，用作抵押物融资了23亿美元。一些高校实验室在招募人才时，也会炫耀自己有多少H100芯片，比如普林斯顿大学的一个AI研究项目就在招聘中强调，自己拥有“一流的计算基础设施，有300枚英伟达H100 GPU”。</p>



<p class="wp-block-paragraph">由于芯片的价值和重要作用，思科的CEO在一个峰会上说，这些芯片价值不菲，是（像黄金那样）由装甲车运送给思科的。</p>



<p class="wp-block-paragraph">微软成立了一个“GPU理事会”，由高管决定如何在微软内部项目之间，分配剩余的计算资源。谷歌也成立了一个执行委员会，负责决定在公司内部和外部用户之间，如何分配计算资源。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="614" src="https://touheima.com/wp-content/uploads/2024/03/nvidia07-1024x614.png" alt="" class="wp-image-1026" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia07-1024x614.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia07-300x180.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia07-768x461.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia07.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">如果从英伟达的财报来看，<strong>它非常依赖大客户。</strong>在上一财年，其中一个最主要的买家就为英伟达贡献了超过110亿美元销售额，占到总销售额的近五分之一。</p>



<p class="wp-block-paragraph">而在最近一个季度里，英伟达就从谷歌、微软和亚马逊等云计算公司，获得了超过92亿美元的销售额，占到了这三家公司同期约350亿美元资本支出的四分之一。</p>



<p class="wp-block-paragraph">但在2024年，一个重要的问题必须得到答案——<strong>这些对AI的巨额资本支出，到底能带来什么？</strong></p>



<p class="wp-block-paragraph"><strong>半导体市场的周期性是众所周知的，历史证明，英伟达的业务也不例外，</strong>在此前加密货币和疫情期间的游戏浪潮中，都在短期极大刺激了需求，造成英伟达收入剧烈波动。今天如果科技巨头们在进行疯狂采购后，也逐渐进入“消化期”，那英伟达也一样会陷入曾经的周期性。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="687" src="https://touheima.com/wp-content/uploads/2024/03/nvidia08-1024x687.png" alt="" class="wp-image-1025" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia08-1024x687.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia08-300x201.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia08-768x516.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia08.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph"><strong>很多投资者都在盯着科技巨头的财报，希望能从中发现一些AI落地的迹象。</strong></p>



<p class="wp-block-paragraph"><strong>微软的订阅式人工智能软件Copilot和云计算服务Azure，被市场认为是2024年人工智能早期商业化的晴雨表。</strong>这两项业务都有望通过与OpenAI的技术整合，而实现增长。Microsoft 365 Copilot在刚发布的头两个月，增长速度超过了前两个主要的Microsoft 365企业套件，但还缺乏更持久的数据。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="539" src="https://touheima.com/wp-content/uploads/2024/03/nvidia09-1024x539.png" alt="" class="wp-image-1024" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia09-1024x539.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia09-300x158.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia09-768x404.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia09.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">从<strong>Meta</strong>的财报来看，人工智能被用于改进广告服务，这使得Meta上个季度的利润翻了两番。但Meta也在同期进行了严格的成本削减，尚不能说这个利润增长是来自AI的应用。</p>



<p class="wp-block-paragraph"><strong>亚马逊</strong>在今年将发起“全面攻势，以便在人工智能领域迎头赶上”。在去年11月，亚马逊为其云服务用户推出了一款人工智能助手Amazon Q。但仍缺乏AI相关的具体数据。</p>



<p class="wp-block-paragraph"><strong>Uber</strong>也在财报电话会中强调AI，其CEO说“优步的平台是由人工智能驱动的，在一切条件相同时，我们的人工智能算法将能够学习更多”。但其实Uber表现不错的最近一期财报中，增长并非来自人工智能，而是对滴滴、自动驾驶公司Aurora等等约60亿美元的股权投资，这些投资的价值波动较大，会对净收入产生影响。</p>



<p class="wp-block-paragraph">很多投行也进行了调研，<strong>试图听听技术高管的意见。</strong>据Morgan Stanley针对上百位CIO的调研，最多的人群（33%的CIO）预计，他们的第一个AI大模型项目，将在2024下半年投入生产；15%的CIO预计，这些项目将在2025年或之后投入生产。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="576" src="https://touheima.com/wp-content/uploads/2024/03/nvidia10-1024x576.png" alt="" class="wp-image-1023" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia10-1024x576.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia10-300x169.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia10-768x432.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia10.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">而根据UBS的调研，好消息是100%的受访者，都处于正在研究如何应用人工智能的阶段，<strong>但坏消息是，只有6%的公司正在投入生产，而70%的受访者表示，最有可能上线的时间范围是未来6-12个月。</strong>受访者的2024年平均AI支出预期，为165万美元，这个数字其实不大，预计要到2025年才可能会翻一番。</p>



<p class="wp-block-paragraph">而对于“晴雨表”Microsoft Copilot的使用率，还比较乐观。约80%的受访者正在试用或计划试用Copilot，这可能会为2024下半年和2025年，实质性采用Copilot创造了潜力。</p>



<p class="wp-block-paragraph"><strong>总体来说，相比于股市热潮，真实的应用进展还为时过早。微软其实也在努力抑制人们的预期，称Copilot可能要到2024下半年，才可能带来销售提升。</strong></p>



<p class="wp-block-paragraph">就障碍而言，<strong>“合规性和监管障碍”“缺乏合格人才”“不清楚的ROl”</strong>都是名列前茅的问题。</p>



<p class="wp-block-paragraph">谨慎的一个重要原因是，大模型产出不准确结果的问题仍然存在，这削弱了许多商业环境中的应用价值。Salesforce的一位高管认为，这是一个足够大的问题，可能需要在AI工作的旁边，始终有一个“人类监督”来捕捉错误，并将语言模型与事实数据库链接起来，以便在需要时能够返回可验证的准确答案。</p>



<p class="wp-block-paragraph">以上是软件层面，而对于硬件，AI与移动设备的结合，正随着苹果取消十年来最广受期待的电动汽车项目转向AI，逐渐变成下一个战场。</p>



<p class="wp-block-paragraph">苹果的竞争对手三星，已经开始在手机中引入新的AI功能，新发布的Galaxy手机利用了生成式AI的一些最新进展，比如通话实时翻译、总结笔记和编辑照片等功能。苹果也宣布将在今年下半年推出的iPhone 16中，升级一些AI相关的功能，并计划在2025年推出更全面的GenAI功能。</p>



<p class="wp-block-paragraph">高通CEO安蒙认为，我们现在有能力创建一款高性能的人工智能处理器，可以用在电池供电的设备上。它们可以一直运行，可以无处不在。这是第一个要素：拥有使其成为现实的计算引擎。</p>



<p class="wp-block-paragraph">其次，随着模型训练得越来越好，模型的体积也越来越小，效率也越来越高，尤其是针对特定场景的模型，这一点正在向便携式设备发展，而且由于移动设备具有关于你正在做什么、你所在的位置等真实的环境数据，这可以使人工智能更加精确。第三，目前正在开发的很多应用，就是为了利用AI能力。所以未来我们的手机、个人电脑、汽车，都将具备AI相关的功能。</p>



<p class="wp-block-paragraph">而未来AI在移动端的运行方式，有可能是在设备与云端同时进行。在需要调用大参数量的模型时，调用云端；而在其他场景中，则可以直接使用设备上的计算能力，从而保证经济性。</p>



<p class="wp-block-paragraph">所以支持者认为，AI有可能在智能手机上创造一个新的升级周期。但这个过程同样不会很快，比如受限于手机的功耗、内存，以及当下还缺失的“杀手级应用”。</p>



<figure class="wp-block-image size-large"><img loading="lazy" decoding="async" width="1024" height="599" src="https://touheima.com/wp-content/uploads/2024/03/nvidia11-1024x599.png" alt="" class="wp-image-1022" srcset="https://touheima.com/wp-content/uploads/2024/03/nvidia11-1024x599.png 1024w, https://touheima.com/wp-content/uploads/2024/03/nvidia11-300x176.png 300w, https://touheima.com/wp-content/uploads/2024/03/nvidia11-768x449.png 768w, https://touheima.com/wp-content/uploads/2024/03/nvidia11.png 1080w" sizes="auto, (max-width: 1024px) 100vw, 1024px" /></figure>



<p class="wp-block-paragraph">在人工智能驱动的商业大潮中，英伟达的估值迈入了2万亿美元行列，黄仁勋成为了科技界的王者。他成功地将把芯片设计从游戏引入人工智能，成为了微软、谷歌和特斯拉等科技巨头的必需品。</p>



<p class="wp-block-paragraph">买到英伟达芯片如此不容易，以至于英伟达的客户们，都有点恐惧与其竞争对手打交道，虽然他们很希望市场上能有替代品。</p>



<p class="wp-block-paragraph"><strong>英伟达的股价已经不太取决于其自身的基本面，因为足够好，而是取决于AI能否产生真正的商业化。虽然宏观预测讲述了一个积极的故事</strong>（高盛预计现在人工智能起步缓慢，占美国GDP不到半个百分点的情况下，但到2032年，支出将会大幅增加，达到GDP的2.5%以上）。</p>



<p class="wp-block-paragraph"><strong>在市值超过100亿美元的316家美股公司中，只有15%给出了人工智能相关的数据披露（即对支出、收入、生产率收益的影响），但这些数字不一定能完全归因于人工智能。</strong>但在披露上向人工智能靠拢，却比以往任何时候都更有赚头，据投资机构Theory Ventures的数据分析，<strong>有AI相关披露的公司的市盈率，已达到没有AI披露的2.5倍。</strong></p>



<p class="wp-block-paragraph">过去的一年里，几乎每家科技公司都不得不提出一项生成式人工智能战略，但市场即将开始要求这项技术带来真正的收入和利润。</p>



<p class="wp-block-paragraph">AI是否像支持者所声称的那样具有革命性，还是仅仅是IT工具库中的一个有限补充，今年会变得更加清晰，这是英伟达股价的决定性因素。<strong>2024年，我们将看到谁只是在打人工智能牌，而不是拥有真正的商业模式。</strong></p>



<p class="wp-block-paragraph"><strong>摘编 | </strong>经纬创投</p>
]]></content:encoded>
					
		
		
			</item>
	</channel>
</rss>
