到了2025 年中时,大家开始聊MaaS了。
MaaS是什么?
Model-as-a-Service(模型即服务)。以前,企业想用 AI,得像盖房子一样,自己买地(显卡)、买图纸(算法)、组施工队(开发),成本极高。
现在,云厂商把这些都打包好了,企业只要像住酒店一样,按天、按量付费;模型部署在云端,通过 API 接口,随取随用。
MaaS 把 AI 从一种「高精尖的技术」,变成了一种「即插即用的水电」;但奇怪的是,既然这么方便,为什么现在市面上听不到太多动静了?
因为大家都在闷声干活,在思考怎么把「水电」接进业务里。
来看一个吓人的数据:
前几天,字节跳动旗下火山引擎,悄悄交出了一份吓人的成绩单:日均 Token 调用量突破 50 万亿;而且,在中国大模型公有云市场的蛋糕里,火山引擎一家就切走了 49.2% 的份额。
咱们得对数字有点敬畏心;这 50 万亿 Token,是企业真金白银跑出来的。这说明什么?说明企业真正在「用」。
那么,既然大家都在用,这钱到底被谁赚走了?智远分析认为,整个市场分化成了「两大门派」。
第一派,是云大厂做的水电站,代表选手有火山引擎、阿里云、百度智能云;他们的逻辑很简单,我卖水和电(算力+模型),不管你家里用什么电器,插头得插我这。
但这三家又完全不同。
尤其火山引擎,它是今年最大的变量。很多人看不懂,为什么火山入局最晚,却能切走近一半的市场份额? 难道仅仅是因为便宜吗?
不,便宜是结果。 火山能把价格打穿,背后的核心逻辑是 「C 端练兵,B 端赚钱」。
你看它手里有谁?豆包。 作为一个日活过亿的超级 App,豆包每天海量的交互请求,就是最好的「磨刀石」。
大家可以想象一下这个画面: 每天有几亿人拿着豆包在聊、在搜、在画图;这对服务器来说,是一场全天候、高强度的极限压力测试。
它把「并发」测透了, 什么样的流量洪峰没见过?豆包扛得住,企业那点业务流量才能轻轻松松;它把「成本」榨干了,这是最关键的。
你想想,C 端的流量是有波峰波谷的(白天忙、半夜闲),而字节内部有庞大的推荐算法、搜索业务,刚好可以和 AI 任务做「混排」。
这像开餐馆,如果不接待散客(C 端),只接企业包场(B 端),那你的厨房闲置率会很高,菜价一定贵;但火山是厨房 24 小时连轴转,显卡利用率拉满了,平摊到每一次调用的成本,自然就是白菜价。
所以,谭待才敢说,MaaS 是赚钱的。 因为对于火山来说,给 B 端提供服务,本质上是豆包用剩的「能力溢出」。
说白了,B 端企业哪怕只「蹭」到了这点溢出的红利,拿到的也是屠杀级的价格。
另外两家走的路线也不一样:阿里云像百货超市,它的逻辑是生态。魔搭社区拉拢各路模型,它只求你用它的服务器跑模型。
百度像操作系统,它的逻辑是入口。李彦宏喊“应用为王”,百度强推千帆平台,更想做 AI 时代的 Windows,让你在上面长出应用来。
第二派是什么呢?是AI原生的厂家。
比如:智谱 AI、MiniMax、硅基流动等;他们没有云厂商的「基础设施包袱」,所以必须够专、够偏科”,专门解决那些云厂商搞不定的“疑难杂症”。
你看智谱AI,今年它做了大量私有化部署。
很多国企、银行,数据死都不能出机房。这时云厂商就尴尬了,但智谱擅长;它能把模型做轻,直接部署到本地服务器上。
那MiniMax呢?智远认为,是偏科天才,如果你做游戏、做情感陪伴,首选 MiniMax;它的模型有“人味儿”,它的模型语音合成极其逼真,以后,在这块细分市场说不定,能切走了不少 B 端客户。
至于DeepSeek不用说了,它是典型的理工直男。
大家对它的印象可能还停留在“通用对话”上,但它在 B 端的杀手锏其实是代码和推理。 如果你是搞量化交易、做数据分析的,DeepSeek 简直是「降本增效」的神器。
所以,智远认为,现在的 MaaS 市场分三类玩家:
第一类偏「基础设施」,讲究大而广。他们铺路,不论你是谁、你用什么模型,只要你用我的云、耗我的电就行,他们拼生态的厚度和算力的成本。
第二类偏垂直细分,讲究「锐度」;像 MiniMax、智谱、硅基流动这种 AI 原生厂商;用一把尖刀撕开 B 端的口子,做深度的场景适配。
第三类是单纯的「卖模型 KPI」; 像 DeepSeek、Kimi;讲究「纯粹」。你需要脑子,我就卖脑子,拼推理最强、价格最低。
说了这么多厂商,其实解决的都只是“有模型用”的问题。但对企业来说,真正的痛点在于:模型我买了,怎么把它变成能干活的员工呢?
在我看来,要想让 MaaS 真正落地,得在业务流里砍下“三把刀”。
第一刀,Chat to Data(让数据上马)。
这块很多人容易想岔,以为把模型买回来,直接跟它聊业务就行了。 错。Chat to Data 的前提是,你的数据得先“上桌”。
你想想,你的数据现在都在哪?散落在员工电脑桌面的 Excel 里,或者躺在业务系统深处的 CSV、CRM 里。对模型来说,这些离线文件是“隐形”的,它根本看不见。
所以,第一步动作叫「结构化上云」。
你得先把死数据,上传到 MaaS 平台的数据容器里。现在像飞书多维表格、钉钉这些工具,干的就是这个活,把死文件变成“在线表格”。
只有数据上桌了,模型才能去读表头,理解这一列叫「销售额」,那一列叫「回款率」;铺垫好这一步,才是聊。
这时,部门伙伴问它:把上个月回款低于 50% 的客户挑出来,它才能立马给你跑出一个结果;说白了,这一刀本质给模型配一个“数据插座”,有了库,才有得聊。
数据解决了,第二刀:Chat to Knowledge(让知识进脑)。
这块跟数据一样。 绝大多数企业知识,现在都锁在老旧的 OA 系统里;PDF、Word、扫描件,模型也是看不见的。 所以,不管你用什么平台,得先把操作手册、法律法规、历史合同统统上传到云端建库。
举个中石化的例子:
他们面临大量的工程标准和设计规范,查起来非常费劲。于是,他们利用百度千帆平台,把文档全部搬了上去,构建了一个“标准规范智能问答助手”。
这里最关键是平台的「解析」能力。
它把文档里的表格、公式拆解成模型能读懂的碎片。只有经历了“上传-解析-入库”这三步,知识才算真的进了企业的 AI 脑子。
这时,你再问它技术规范,它才能秒级给你答案,并且告诉你出自哪一页。
第三刀:Chat to Action(让流程上手);这是 2025 年的决胜局,这一刀解决“办事”的问题。 它的本质是 API 的原子化。
以前,你得把请假、报销、订机票这些业务动作,拆解成一个个标准的小积木。但光有积木不够,谁来搭呢? 这时,MaaS 平台它得变成一个「数字化施工队」的总指挥部。
我举个最新的例子:
前几天火山引擎发了一个叫 AgentKit 的开发框架,它直接把这个施工队的角色分好了,跟咱们真实的业务场景一模一样。
这就好比一个工程现场: 第一步,得有“包工头”(Router),这是最聪明的大模型(比如 DeepSeek-R1 或豆包-Pro)。
它不干具体的活,只负责听懂人话、分派任务;你说「帮我订一张明天去上海的机票,预算 2000 以内」,它立刻分析出时间、地点、预算,然后转头喊人。
第二步,得有“特种兵”(Tool Use)。
这是被封装好的 API。包工头一声令下,查票 Agent冲上去查航班,比价 Agent冲上去算报销额度;这里面有个关键叫 MCP 协议,你就把它理解成特种兵的万能工具箱,即插即用。
第三步,还得有“质检员”(Evaluation)。这是最容易被忽略的一点。在「点击支付」之前,必须有一个模型或者人工节点跳出来复核:
查到了这三班,符合差旅标准吗?您确认订这一班吗?”如果没有这个质检员,模型很可能给你订一张 5000 块的头等舱,老板非疯了不可。
看明白了吗?这才是 MaaS 的真相;企业买「包工头+特种兵+质检员」的建制;MaaS上的AgentKit 工具,在卖这套让听得见炮火的人,能指挥 AI 施工队的系统。
当然,智远判断,未来会有诸多AI 原生的 MaaS 平台出来,专门解决垂直细分场景的问题;比如游戏行业、3D 设计,它们的流程非常特殊,通用平台搞不定,一定会出现专门的垂直 MaaS 平台来吃掉这块市场。
所以,未来做MaaS平台的大厂,到底迷恋通用大模型,还是把精力放在「垂直」和「小」上面?
这让我想到了人的大脑。
通用大模型像大脑的原生智力(IQ)。 它的容量很大,逻辑很强,什么都能学,什么都能聊。在这个层面上,OpenAI 和 Google 还在不断卷 Scaling Law,试图把“大脑”的容量扩得无限大。
但「垂直小模型」是什么呢? 它更像我们在后天工作中修炼出来的「思维模型」。
这好比,一个智商 180 的天才,不懂经济学,也未必能马上算清楚一笔复杂的账;但给他装一个「机会成本思维模型」(垂直模型),专门用来计算换算关系、权衡利弊,那他在这个领域的判断力是顶级的。
所以,垂直和小,代表的是「业务的深耕」。
它只需要在某一个特定的切面(比如计算机会成本、审核法律合同、筛选简历),拥有最专业的“解题视角”就够了。
这也解释了,为什么2025年最流行模型蒸馏、也就是「一个个小模型即服务」。
我举一个智联招聘的例子:
他们做人岗匹配,全靠“通用大脑”去硬算,成本太高且效率低。 他们的做法是典型的「名师带高徒」。
先用「大脑」思考(Teacher,请出千亿参数的 DeepSeek-R1。先把复杂的简历和岗位需求跑一遍,通过高智商分析出人岗匹配的深层逻辑。
再把 DeepSeek 跑出来的“逻辑精华”,喂给一个百亿参数的 ERNIE Speed(文心轻量版);最后,让「模型」出来干活,就是专门懂招聘、懂匹配的“小模型”。
结果呢? 推理成本直接下降了 70%。
这说明了什么? 企业真正需要,利用爱因斯坦的智力,把你们业务里的“机会成本模型”、“库存周转模型”、“合同风控模型”一个个蒸馏出来,让它越用越聪明。
所以,未来企业业务之间的竞争,不看谁接的“通用大脑”更聪明(那是大厂的事),要看谁能在大脑之上,谁能长出更多、更深、更懂业务的「垂直思维模型」。垂直模型,是公司的「行业专家」。
总结下来就八个字,在MaaS平台,外事不决问大厂(通用模型),内事不决靠垂类;到2026年,谁能把模型做小、做专,谁才能在投入产出比上算得过账来。
除了这些主流路径,市面上也还有很多卖「一体化解决方案」的玩家,商业世界,从来没有标准答案。以上内容,纯属智远个人观察,仅供参考。

小程序
扫码打开微信小程序
APP下载
扫码下载市场部网 App







