黑马雷达 / 第002期 / 2026年3月 / 阅读时间约13分钟
本文从推理成本的历史性拐点切入,解析三条并行的成本压缩技术路线,推演产业链传导路径,识别真正受益的早期公司,最终给出投黑马的左侧判断。读完本文,你将理解为什么成本曲线是AI Agent时代最重要的投资坐标系。
一场没有预警的成本断崖
2023年初,调用GPT-4完成一次复杂推理任务的成本,大约相当于给一名初级分析师支付几分钟的工资。到2025年底,执行同等质量推理的成本已经跌去超过95%。这不是一次技术迭代,这是一场结构性的价格崩塌——而它还没有结束。
驱动这场崩塌的力量来自两个方向,且两者正在同步加速。
硬件侧,英伟达的垄断溢价正在被侵蚀。Groq以LPU架构将推理延迟压缩至传统GPU方案的十分之一;Cerebras用晶圆级芯片将内存带宽的瓶颈直接绕开;国内外超过二十家推理芯片公司正在将产品推向量产。更关键的是,过去几年大规模部署的AI算力集群,其硬件成本已经完成初始摊薄,边际推理成本在会计意义上正在趋近于零。云厂商之间的推理服务价格战,是这一趋势最直白的市场信号。
软件侧,一个更深层的变革正在发生——AI开始优化AI本身。量化压缩技术将模型体积缩减至原来的四分之一而几乎不损失精度;推测解码让模型在一次前向传播中完成多个Token的预测;KV Cache的持续演进使得长上下文的重复推理成本不断摊薄。更重要的是,这些优化工作本身越来越多地由AI代码助手完成,优化速度远超传统工程节奏。
硬件摊薄是一条确定的算术曲线;软件优化则是一条因AI加入而陡峭化的指数曲线。两条曲线叠加的终点,是推理成本在经济意义上的趋零。
问题不再是”推理成本会不会降到足够低”——问题是:当它真正降下来,谁会被重写?
软件订阅制的终结与重生
过去三十年,软件行业最成功的商业模式是SaaS:按座位收费,卖访问权限,靠用户黏性维持复购。这个模式的底层逻辑是——软件的价值在于功能,功能需要人来操作,所以收费单元是”人头”。
推理成本趋零,正在从根基处动摇这一逻辑。
当AI可以自主操作软件、自动完成工作流,”人来操作”这个前提消失了。用户真正需要的不再是访问一个系统的权限,而是一个结果:合同审完了、报表生成了、客户跟进了、代码跑通了。为功能付费的时代,正在被为结果付费的时代所取代。
这不是一个渐进式的迭代,而是一次商业模式的范式跃迁。传统SaaS公司面临的压力不是来自竞争对手推出了更好的功能,而是来自整个付费逻辑的瓦解——你的产品仍然好用,但客户开始质疑为什么要为”使用权”而不是”完成量”付钱。
左侧机会,在于那些从一开始就按结果定价的新公司。它们不需要说服客户接受新的付费方式,因为它们从未有过旧的方式。当推理成本足够低,按结果收费的毛利率可以比传统SaaS更高——你在卖的是确定性,而确定性比功能更贵。
一切复杂流程的智能化替代
有一类工作,长期以来被认为是”人力密集型”的铁律:法律合规审查、供应链异常处理、医疗影像初筛、金融风控建模、多方谈判协调……这些流程的共同特征是:步骤繁多、依赖判断、容错率低、培训周期长。正因如此,它们成为了大型组织存在的最强理由——只有足够大的团队,才能撑起足够复杂的运转。
推理成本趋零,正在拆解这一逻辑的每一个环节。
问题的关键不在于AI能不能理解复杂流程——现在显然可以——而在于过去调用AI处理这类任务的成本,使得规模化部署在经济上不合理。一份合同审查调用十几次推理、一个风控决策需要多轮上下文迭代、一个供应链异常处理涉及跨系统的反复调取——这些任务在高推理成本时代,要么靠人力硬撑,要么只能做局部自动化。
当单次推理成本跌至可以忽略不计,上述所有场景的经济账都将重算。
这意味着两类截然不同的投资信号同时出现:
垂直流程替代者——深入某一行业的复杂流程,用Agent架构将其端到端重写。不做通用工具,只做某一个流程的极致替代。法律行业的合同生命周期管理、医疗行业的临床文档自动化、制造业的质检异常闭环——每一个都是一个足够大的赛道,且行业壁垒天然阻挡了通用平台的快速进入。
流程编排基础设施——为上述垂直替代者提供可靠的任务拆解、状态管理、错误恢复和人工介入机制。这一层不面向终端用户,但它是所有垂直应用能否真正跑通的关键。过去十八个月,这一层已经出现了若干值得持续跟踪的早期公司。
左侧窗口在于:大型企业客户的采购决策周期通常滞后于技术成熟度12到18个月。现在布局垂直流程替代的团队,恰好卡在企业客户即将从”观望”切换到”预算审批”的临界点之前。
一人公司崛起:微型企业的战斗力重写
“一人公司”这个概念并不新鲜。但过去它意味着一种妥协:一个人只能做一个人能做的事,服务规模、响应速度、专业深度都受制于单人的时间和精力上限。
推理成本趋零,将彻底重写这一边界。
一个配备了完整Agent工具链的个人,今天已经可以同时运转:自动化的客户沟通与跟进、持续生产的内容与研究输出、代码的生成与测试迭代、财务与合规的基础处理。这不是未来的想象——这是2026年已经在发生的现实,只是规模化程度尚未被市场充分定价。
真正的转变,发生在推理成本从”可接受”变成”可忽略”的那个临界点之后。届时,个人调用AI完成工作的边际成本趋近于零,意味着一个人可以在经济上支撑起一个过去需要10到50人才能运转的业务体量。
这对投资的含义,比表面看起来更深刻:
工具层——服务一人公司的工具,设计逻辑必须从”团队协作”转向”个人指挥”。过去SaaS产品围绕权限分配、角色管理、多人协同设计;面向一人公司的产品,核心是单人的杠杆倍率:一个指令,触发多少自动化动作,完成多少实质工作。
分发层——一人公司的崛起,意味着长尾市场的爆炸性扩张。过去因客单价过低而被大型软件公司忽视的个人创业者群体,正在因为生产力的跃升而具备真实的付费能力和付费意愿。这是一个正在形成的、尚未被充分服务的巨大市场。
结构性信号——当一人公司可以打出中型企业的营收规模,”企业规模”与”人员规模”之间的正相关关系将被解耦。这将重写雇佣市场、重写企业估值逻辑、也将重写”什么样的公司值得风险投资”这一基本问题的答案。
一切复杂流程的智能化替代
有一类工作,长期以来被认为是”人力密集型”的铁律:法律合规审查、供应链异常处理、医疗影像初筛、金融风控建模、多方谈判协调……这些流程的共同特征是:步骤繁多、依赖判断、容错率低、培训周期长。正因如此,它们成为了大型组织存在的最强理由——只有足够大的团队,才能撑起足够复杂的运转。
推理成本趋零,正在拆解这一逻辑的每一个环节。
问题的关键不在于AI能不能理解复杂流程——现在显然可以——而在于过去调用AI处理这类任务的成本,使得规模化部署在经济上不合理。一份合同审查调用十几次推理、一个风控决策需要多轮上下文迭代、一个供应链异常处理涉及跨系统的反复调取——这些任务在高推理成本时代,要么靠人力硬撑,要么只能做局部自动化。
当单次推理成本跌至可以忽略不计,上述所有场景的经济账都将重算。
这意味着两类截然不同的投资信号同时出现:
垂直流程替代者——深入某一行业的复杂流程,用Agent架构将其端到端重写。不做通用工具,只做某一个流程的极致替代。法律行业的合同生命周期管理、医疗行业的临床文档自动化、制造业的质检异常闭环——每一个都是一个足够大的赛道,且行业壁垒天然阻挡了通用平台的快速进入。
流程编排基础设施——为上述垂直替代者提供可靠的任务拆解、状态管理、错误恢复和人工介入机制。这一层不面向终端用户,但它是所有垂直应用能否真正跑通的关键。过去十八个月,这一层已经出现了若干值得持续跟踪的早期公司。
左侧窗口在于:大型企业客户的采购决策周期通常滞后于技术成熟度12到18个月。现在布局垂直流程替代的团队,恰好卡在企业客户即将从”观望”切换到”预算审批”的临界点之前。
一人公司崛起:微型企业的战斗力重写
“一人公司”这个概念并不新鲜。但过去它意味着一种妥协:一个人只能做一个人能做的事,服务规模、响应速度、专业深度都受制于单人的时间和精力上限。
推理成本趋零,将彻底重写这一边界。
一个配备了完整Agent工具链的个人,今天已经可以同时运转:自动化的客户沟通与跟进、持续生产的内容与研究输出、代码的生成与测试迭代、财务与合规的基础处理。这不是未来的想象——这是2026年已经在发生的现实,只是规模化程度尚未被市场充分定价。
真正的转变,发生在推理成本从”可接受”变成”可忽略”的那个临界点之后。届时,个人调用AI完成工作的边际成本趋近于零,意味着一个人可以在经济上支撑起一个过去需要10到50人才能运转的业务体量。
这对投资的含义,比表面看起来更深刻:
工具层——服务一人公司的工具,设计逻辑必须从”团队协作”转向”个人指挥”。过去SaaS产品围绕权限分配、角色管理、多人协同设计;面向一人公司的产品,核心是单人的杠杆倍率:一个指令,触发多少自动化动作,完成多少实质工作。
分发层——一人公司的崛起,意味着长尾市场的爆炸性扩张。过去因客单价过低而被大型软件公司忽视的个人创业者群体,正在因为生产力的跃升而具备真实的付费能力和付费意愿。这是一个正在形成的、尚未被充分服务的巨大市场。
结构性信号——当一人公司可以打出中型企业的营收规模,”企业规模”与”人员规模”之间的正相关关系将被解耦。这将重写雇佣市场、重写企业估值逻辑、也将重写”什么样的公司值得风险投资”这一基本问题的答案。
投黑马 · 左侧判断
赛道成熟度 ███░░░ 早期验证阶段,商业模式重构刚刚开始
团队信号 ████░░ 顶级工程人才正在向垂直流程替代方向集中
市场空间 █████░ 重写软件业底层逻辑,潜在规模无上限
左侧紧迫度 ⚡⚡⚡⚡ 企业采购窗口将在12-18个月内打开
核心判断:
推理成本趋零不是一次降价事件,而是一次文明级别的生产力重组。
真正的左侧机会不在”谁能把推理做得更便宜”,而在”谁能率先
在成本趋零的世界里,重新定义一个行业的运转方式”。
按结果定价的垂直Agent、复杂流程的端到端替代者、
以及服务一人公司的新一代工具层——
这三个方向,是投黑马当前最值得持续跟踪的左侧坐标。
三十年前,互联网把信息的边际传播成本压缩至零,诞生了谷歌、亚马逊、微信。
今天,AI正在把智识劳动的边际执行成本压缩至零。
上一次,没有人预判到它将重写多少行业的底层规则。
这一次,你可以提前站在那里。
在聚光灯照亮之前,我们已经在那里。
投黑马 · 信号解读
推理成本的断崖下跌,本质上是一次生产要素的重新定价。
当”让AI思考一次”的成本趋近于零,
人力堆砌规模的时代逻辑将被系统性瓦解——
软件订阅制、复杂流程外包、大团队壁垒,
都将面临一次无法回避的重新定价。
左侧投资者需要问的不是”AI会不会颠覆某个行业”,
而是”当颠覆发生时,谁已经在正确的位置上等待”。
── 投黑马研究团队


