阿里云CIO与40家企业对话数月，打捞出鲜少公开的AI落地真相

AI 个人工具每天都在创造奇迹，企业 AI 落地却像陷入泥潭。阿里云 CIO 与十大行业 40 余家头部企业 CXO 深度碰撞数月，打捞出十个鲜少被公开讨论的真实之问。这不是一份标准答案，是企业“向内看”的一面镜子。

一边科幻，一边泥潭

AI 的冰与火：工具级和企业级的两极境遇

AI 工具高热两个月了，OpenClaw 反复刷屏。一个人，一台电脑，给 AI 开放本地权限，它开始自主搜索、写代码、调文件、发邮件——有人用它几小时完成了过去一周的工作量。漫天的 AI 应用，让个人的生产力可以扩张 50 倍。“AI 时代，一个人完全有可能创办一家估值 10 亿美元的独角兽公司。”Open AI 联合创始人山姆·奥特曼说。

与个人 AI 的画风相反，企业级 AI 冷热不均，战线也更长一些。2025 年的一场小型闭门会上，一家知名化妆品公司 CIO 表示，他几乎与所有做 AI 智能营销的厂商聊了一遍，都没有结果，他甚至立场鲜明地反对数字人产品进入零售公司，认为这是伪需求。同年 9 月的另一场 CXO 闭门会，一位知名企业的 CEO 甚至当场发问：“AI 到底是不是一场骗局？”

去年大家对 AI 半信半疑，至少在企业落地层面，AI 还远没有看起来那么确定。今年，态度肯定了，但心态迷茫了。

2026 年有一些公开的企业案例：某保险公司开发的 AI 理赔系统上线后准确率仅 60%，因数据格式混乱、内容过时，需额外花 2 个月清洗数据，项目严重延期；某制造企业 AI 质检系统误判率 15%（而人工仅 3%），因产线数据无法实时接入，三套老旧系统打通需半年且预算超支，系统上线三个月后“休眠”；某连锁超市巨头引入 AI 动态补货系统，覆盖 1200 家门店，上线后，华东区门店缺货率飙升 40%，而华南区却库存积压。

管中窥豹，以上这些，只是 AI“试点炼狱”的一些样本。

观察发现，2025-2026 年 AI 大模型发展最诡异的处境是：个人用 AI 越来越像科幻，企业用 AI 越来越像泥潭。个人工具级和企业组织级的 AI 价值兑现进度条，完全不在一个配速上。

MiniMax 在最近一次财报电话会上表示，Agent 已经覆盖其 90% 员工所在的工作场景，这是其能以 400+ 名员工同 OpenAI 以及其他国际巨头竞争的底气之一。这一数据指向的是，行业内最先进的公司正成为所谓的 AI-Native 组织。而据 MIT 针对 2025 年商业人工智能现状的研究显示，全球 54% 的顶级企业将 AI 列为优先投资，但真正实现转型价值的，还不足 5%。即使到今年，这一局面并未出现明显改善。据普华永道今年 1 月发布的数据显示；仅有约 12% 的 CEO 认为，企业 AI 已经实现成本与收入两端的价值兑现。当然，企业对 AI 的投入，依旧升温，但实现价值兑现的进程，持续缓慢。

图 1_AI 冰与火对比图 _v2.png 图 1: AI 境遇对比（图片由 AI 理解生成）

在这组冰与火反差巨大的数据背后，一个群体被推到了聚光灯下——企业 CIO。

站在 AI 时代风口上，CIO 成为这场 AI 赛事最直接的承压者，他们是企业技术战略的制定者，是 AI 落地的第一责任人，也是在愿景与现实之间不断拉锯的缓冲带。

企业级 AI 的锚点：CIO 的十个集体追问

当“AI 一日，人间一年”演绎得愈发剧烈，让 CIO 犹如"钢丝上跳舞"。

理性去看 CIO 这种时代性压力，背后并非一时之症，是深在腠理、盘根错节的历史包袱，与当下 AI 迎面接壤之后，问题更加错综复杂。解铃更须系铃人，或许只有局内人，才更懂这场 AI 局的解法。

为了给企业找到 AI 落地路径，阿里云 CIO 已经探索 AI 几年了，从无数个坑点中爬出来，总结矫正再去尝试，始终不停。去年，他找到了 RIDE 的落地方法，但方法的打磨和迭代，不是孤军一人闭门造车，是和更多顶尖企业的 CXO 深度碰撞，去验证问题和答案。

这个验证过程，最关键的是真实。

袒露真相才能找到问题，定义问题才能领悟解题，于是，很多 AI 落地答案是从真正的“Bug”里走出来的。事实证明，阿里云 CIO 在与十大行业、40 家顶尖企业深度对话之后，大家表现出来的困惑背后，并非“AI 能不能”，是更为根本的 What 和 How 两个方向：

我们到底在用 AI 做什么？—— 所谓做什么

企业的 AI 为什么总是做不成？——所谓怎么做

历经 AI 发展最快的这半年多，从大量的管理者对话中，阿里云 CIO 团队试图找到问题的真实锚点，并梳理成一份 AI 时代的纪实性报告：《企业智变下的 CIO 集体之问》（以下简称《CIO 之问》）。

报告横跨十大行业的关键共性问题，并归纳为企业级 AI 的十大经典之问，一定程度上也代表了 AI 大模型时代下，CIO 的集体之问。

一问：当企业做 AI 数字人时，究竟在做什么？

二问：AI 来与否，CIO 与组织都面临一样的老问题？

三问：当下 AI 机会迷思，如何分辨大模型“能做”与“慎入”的业务？

四问：为什么，大多数企业都搞不定“企业知识库” ？

五问：怎么搞定高品质的“AI 燃料”：知识工程？

六问：Agent 的工程落地，“品味”是关键？

七问：AI 数字员工上线，和谁比、归谁管？

八问：企业如何应对“AI 替代”的群体抵触，推动组织转型？

九问：AI 时代的组织权责：IT 与业务，缘何矛盾？怎样融合？

十问：AI 推动的“10X”研发效能，真相如何？

前三问追问本源，后七问深入内里。下面，我们逐一把问题展示出来。我们相信，从企业内里找到真正的问题，离答案就不远了。

图 2_CIO 十问全景图 _v2.png 图 2: 报告归纳十大经典问题（图片由 AI 理解生成）

我们到底在用 AI 做什么？

当下有个颇为矛盾的现实：一面是，全球企业都在以前所未有的速度加大投入 AI，据 Gartner 预测，2026 年全球 AI 总支出将达到 2.5 万亿美元，同比增长 44%；另一面是，很多企业在回答“到底用 AI 在做什么”时，价值却格外模糊，也带着不自信。

这是当下企业 AI 推进中典型的反常识现象。

在阿里云 CIO 与 40 多家顶尖企业的深度交流中，这样的时刻反复出现。表面上看，这些企业的 AI 项目并不少，推行也很积极甚至激进。但当视角从具体的项目中抽离出来，回归到最根本的那个内核上时，很多 CIO 会突然停顿一下。目标、路径与预期好像彼此错位，甚至，也许连“问题”都没有发现。

世界的运行秩序，往往是由 20% 的根本性力量决定的，企业也一样。所以，报告的第一问，先从第一性原理出发，回归企业级 AI 的本质。

CIO 一问：当企业做 AI 数字人时，究竟在做什么？

过去一年，数字人几乎成了企业 AI 最火的关键词之一。从客服数字人、销售数字人，到运营数字人、招聘数字人，几乎所有行业都在尝试把 AI 放进业务流程里。

The Business Research Company 今年 3 月发布的一份数字人市场报告显示，近年来数字人市场规模呈指数级增长。预计 2026 年数字人市场规模将从 2025 年的 477.2 亿美元增长至 669.8 亿美元，到 2030 年，数字人市场规模将达到 2581.5 亿美元。

与市场的“高热”形成鲜明对比的是，不少企业在认知层面仍处于“混沌期”。

主体的混沌是阶段性的，就像龙虾潮演变成全民养虾，数字人流行演变成企业数字员工全面上阵，但当我们大量使用工具时，究竟是在做什么？这是必要的本源性拷问。

这是在《CIO 之问》的形成过程中，被意外暴露出来的，一个看似基础的问题，比如：数字人和 AI 服务、智能外挂，是不是一回事？

很多企业的第一个 AI 项目，大多是基于 AI 技术的服务或是“外挂型 AI”，比如翻译服务、营销工具等。但这些往往只停留在工具层面，并不承担完整的生产任务和业务责任，也几乎无法度量价值。企业用了，却很难说清楚它到底有没有用。

数字人则不同。它的输入 / 输出和人类员工完全一致，可以作为“人”来抽象，它执行原来人类员工在现实中执行的任务，甚至比人类做得还好。企业也可以像度量人类员工一样，度量数字人的质量和效率。其背后的逻辑在于，数字人是把原本依赖个人经验完成的知识与操作过程，线上化、数字化，进一步产品化。比如，一个电销数字人的本质，就是垂直知识 + 电销服务的 SOP。

从这个角度，《CIO 之问》也推理出要点：当下企业级 AI 所做的事情，本质上是“一场知识工作的线上化补课”，AI 也让知识工作第一次可以“被管理”。这是 AI 数字员工的根本起点。

过去几十年里，知识工作（如法务、HR、销售、设计）是“离线的”，知识和判断都在人的脑子里，企业大量的知识工作由于非结构化特征，很难被传统 IT 系统数字化，也就没办法被洞察和改进。

AI 第一次历史性地，让知识工作的过程和结果可以被在线化、被度量、被优化，也由此派生了数字人。报告流出的一组对话中，一家科技公司 CEO 认同感慨：“以前我们管流程，现在我们终于能管知识了。”

这里，阿里云 CIO 也同步延展了一个认知：与传统系统相比，数字人首先要解决的，其实是一个生产关系问题。意思是，数字人的一大核心职能，就是承接原本由人类执行的知识工作，解决真实世界因人类固有约束，而形成的生产关系问题。

因此，企业做数字人，要先定义出“有价值的重复执行的任务”，让数字员工先承担起来。通过这样的方式，IT 部门与业务部门可以围绕具体任务形成共识，而不是把 AI 当作许愿池，造成无法落地的矛盾。

在这个过程中，数字人往往是先以效率工具的形态进入企业，随着数字人承接的任务不断扩大，原本围绕人力组织起来的业务流程也会随之改变。从落地顺序来看，效率工具是入口，价值重构是结果。

早在 2025 年 9 月，阿里云内部就已落地了 28 个数字人项目，在内部工作系统中，这些数字人与普通员工一样，拥有工号和头像。关键的是，数字人的业务任务是真实的，度量是完整的。

图 3_ 外挂 AI_vs_ 数字人 _v2.png 图 3: 企业级 AI 的本质（图片由 AI 理解生成）

当然，数字人能顺利承担任务的前提，是企业内部的系统、数据和流程能够配合它的工作。如果缺乏相应的流程支撑，再先进的数字人也无法真正融入业务。

这正是《CIO 之问》第二问探讨的核心。

CIO 二问：AI 来与否，CIO 和组织都面临一样的老问题？

在大模型能力几乎每隔几个月就上一个大台阶的当下，很多人都会产生一种强烈的错觉：AI 已经这么强了，企业里的很多效率与业务问题都能快速解决。但源源不断的风险事件和数据困局，揭露的却是另一个截面：AI 能力越强，越容易暴露企业原本隐藏的问题，尤其是数据这类地基问题。

Informatica 今年 1 月发布的《2026 年首席数据官洞察》研究报告中指出，69% 的企业已将生成式 AI 嵌入到业务流程中，但 91% 的数据领导者表示，数据可靠性仍然是 AI 项目从试点走向生产的主要障碍。报告将这种现象称为“信任悖论”：虽然员工普遍信任 AI 使用的数据，但数据领导者深知数据质量和治理结构的短板。

《CIO 之问》用一个极其准确的比喻——AI 是面镜子，照出 IT 系统的历史——来描述这种现象。镜子不会让一个丑的人变美，也不会让一个美的人变丑。同样，AI 也不会创造出新的问题，它只是把企业原本就存在的问题照亮了，让企业第一次必须认真面对这些历史问题。

以数据分析为例，很多企业都在尝试构建 BI 或商分数字人，通过自然语言进行提问，AI 自动生成 SQL 查询并返回分析结果。看似简单，但它隐藏一个巨大的前提：企业原来的数据指标要完善。如果原来的 SQL，人都写不出来，那么换成 AI 之后，问题依然不会消失。

也有企业提到 AI 时代的业务指标体系怎么建？但《CIO 之问》讨论认为，指标的问题，本质上和 AI 没关系，它是上一代数字化要解决的问题。理论上，企业应该有一套清晰的核心指标体系，团队围绕这些指标迭代，就像围绕北极星指标观察业务异常。但如果企业在上一轮数字化转型中，没有解决好数据拉通、业务决策、业务数字化、数字业务化等一系列问题，到了 AI 时代，大家以为拿到了一盏“阿拉丁神灯”，开始期待 AI 能够自动解决所有问题，这是不现实的。

阿里云 CIO 一直把企业原来的系统与数据基础比作“蛋糕坯”，AI 更像是蛋糕坯上的樱桃。老板想要的是一块漂亮的樱桃蛋糕，如果没有蛋糕坯，再漂亮的樱桃也无法做成樱桃蛋糕。换句话说，如果底层数据结构混乱、指标体系不清晰，再先进的 AI，也无法生成真正有价值的结果。

如果把企业技术发展路径放在更长的时间轴上看，很容易理解背后的根因。

过去二十多年，企业技术体系大致经历了三轮演进：信息化、数字化和智能化。信息化关注的是把业务搬到系统里；数字化关注的是用数据理解业务，通过数据做解读、做决策；智能化关注的是让 AI 参与到生产中，涉及到对数据的评测。从难度上来看，智能化>数字化>信息化。

理想的演进顺序是逐步递进，但现实情况却是，在很多企业里，这三件事几乎交叠着同时发生。

《CIO 之问》在交流中观察到，“在飞行中换发动机”来形容企业状态的，大量存在。也就是说，企业一边补信息化时代的作业，比如系统整合、流程线上化；一边补数字化转型的作业，如数据治理、指标体系建设；同时还要融入 AI 快速进入智能化阶段。这难度可想而知。

图 4_ 蛋糕坯与樱桃 _v2.png 图 4: AI 是蛋糕坯上的樱桃（图片由 AI 理解生成）

于是，一个很微妙的局面出现了。AI 看起来“无所不能”，但在企业真正落地时却又“落不下去”。这种尖锐的反差，也是 CIO 在这一轮技术变革中的最大压力来源。问题的症结，也许需要重新审视 IT 系统的本质。

《CIO 之问》给出一个本源的思考：IT 里的信息系统，本质是物理世界的一个抽象，是企业业务历史社会关系的总和，CIO 终归是要戴着历史所有的镣铐，去支持新业务的。

于是，AI 时代的 CIO，到了跳出单纯技术视角的历史时刻。

CIO 的关键词“I”，从信息化的 Information，扩展到数字化的 Data，又进入智能化 Intelligence。分析机构也在重新定义 CIO，从 IT 智能负责人向战略制定者，从技术维稳者向生态协调者。

阿里云 CIO 也给出他的经典理解，从“系统交付者”变成“组织翻译官”。这个翻译有两个方向：一是“向上”，把技术的现实约束翻译给业务高层，让他们的 AI 期望值落地；二是“向下”，把业务的真实需求翻译给技术团队，让工程师知道自己做的东西真正有人用、有人评、有人负责。

AI 在不断降低技术生产的门槛，过去，CIO 的不可替代性很大程度上来自“只有我们懂技术”，但当下，CIO 真正要当作自己第一衡量标准的，是“业务结果”，而不是“技术交付”。

Asana CIO Saket Srivastava 也谈到，未来的 CIO 将不再以管理系统为荣，是以“如何编排工作在整个业务中的流转”为考核标准。也许，无论哪种角色转身，这本就是 AI 这面“镜子”照见 CIO 群体的结果。

图 13_CIO 角色演进 _v2.png 图 5: AI 的发展与 IT 的本质，决定 CIO 的角色变迁（图片由 AI 理解生成）

当企业逐渐看清这些老问题之后，新难题也随之出现：在大模型几乎无所不包的能力面前，企业到底投入在哪儿，才是对的？

这也引出了《CIO 之问》的第三个问题，这几乎是所有企业的集体之迷。

CIO 三问：如何分辨 AI 大模型“能做”与“慎入”的业务？

过去几年，大模型能力不断刷新外界想象，几乎每个行业都在讨论新的应用机会，希望找到可以被 AI 改造的环节。但现实却是，企业对 AI 的期待已经远远超出技术本身，AI 炒作与价值回报之间存在巨大的鸿沟。

根据普华永道今年 1 月发布的第 29 届全球 CEO 调查，大多数首席执行官表示，他们的公司尚未从 AI 投资中获得财务回报。更具反差的是，尽管 AI 被视为拉开企业差距的关键变量，但 CEO 们对营收增长前景的信心却跌至五年来的最低点：仅有 30% 对未来 12 个月的营收增长持乐观态度，远低于 2025 年的 38% 和 2022 年的 56%。

表面上看，大家失去的是对 AI 价值回报的信心，实际更隐蔽的症结，是企业在 AI 项目起点上的判断偏差。

但并非所有的企业都意识到这一问题。 AI 掀起的这股技术热潮下，很多公司把 AI 当作“万能钥匙”：客服用 AI、销售用 AI、数据分析用 AI、商场排班用 AI、库存管理用 AI、金融交易系统用 AI、对账系统用 AI、服装设计用 AI、一线导购用 AI……为了不错过，企业好像什么都能用 AI 重新做一遍。

这也是当下企业在 AI 落地过程中，非常典型的 一个认知误区：不先定义问题，先决定用 AI。

《CIO 之问》发现，这种误区的根源性在于，企业可能没有认清这轮 AI 革命的核心 LLM（large language model）的本质。所谓大模型，是“大语言”模型，很多企业忽视了这个“大语言”究竟擅长做什么。它必然是 一个围绕 language 构建出的系统。只要是有 language 关键字的业务范畴，大模型都非常擅长。

但现实却是，一些并非以 language 为中心的工作，也被一股脑儿地丢给 AI。

以行业常见的排班规划和库存管理为例，这类典型的规划场景，本质上是最优化调度问题，属于重度规划，它的重复性不高。并不是一个以自然语言交互为基础的应用，是一个结构化的求解，可度量、可观测。对于这类能结构化的场景，一旦引入 LLM 用自然语言去操纵它，反而会牺牲精准性。在《CIO 之问》报告呈现的一组对话中，某制造行业企业坦言，从一个小的具体场景做起来会发现，对于结构化场景，“大模型是做不过传统手段的”。

能精准解决的问题，就没必要引入模糊能力。像金融行业的交易系统、对账系统这类场景，道理也是如此。这类业务的核心是交易精准，任何细微误差都可能带来严重后果。因此，这类场景更适合采用原来传统的 OLTP，用精准的数据模型和对账校验系统来完成。

这类场景上的判断偏差，根源在于企业未能分辨大模型“能做”与“慎入”的业务究竟是什么。所以简单总结来看，《CIO 之问》从多轮问题讨论中，给出三个关键点：能做、慎入、和边界。

先看“能做”。如前文所说，这一轮 LLM AI 的本质是 language（语言交互的知识工作）。这意味着，以 language 为中心的工作，都将被大模型深刻影响。比如电销、客服、招聘、OKR、文档、翻译、合同审核，还有研发类的 C language、Java language、SQL language 等等。

再看“慎入”。与 language 为中心相反，那些不以自然语言交互为基础的应用，比如重度依赖规划、不经常重复，比如高度结构化且需要高度精准化的场景，当下的 LLM 并不擅长。并且，当下的 LLM 对物理世界的场景帮助也有限，也许未来，具身智能技术会在最后一公里的物流服务上带来效率颠覆。

在“能做”与“慎入”之间，这里，还存在一个模糊的 “边界”。比如有企业抛出很有意思的问题：“有些模糊的地带既可以用 AI 做，也可以用传统系统做，到底该用谁来做？”

对这个问题，《CIO 之问》给出这样的考虑原则：能垂直专业化，就先做垂直专业化。

一方面，这涉及到技术部门的一个长期问题：它永远是“大一统”逻辑（统一 IT 、统一信息、统一数据中台、统一智能化平台），经常会有横向的技术团队来承接这件事，但它最终无法形成专业化。

另一方面，涉及到“世界知识”与“垂域知识”的问题。本质上，人工智能，其实是由人去教它的，但如果人都搞不清楚的问题，就不能企图让 LLM 搞清楚。更进一步来说，对于物理、数学等标准化的“世界知识”，AI 能够进行训练；但对于企业业务领域的知识，AI 是很难获取的，也就对这些知识无法评测。这是个关键的可度量问题。

图 5_ 能做慎入边界图 _v2.png 图 6: 分辨 LLM AI 的能力边界（图片由 AI 理解生成）

当企业能够定义问题，分辨能与不能时，下一步真正卡住脖子的，往往不是技术，是落地过程中那些更深层、也更棘手的问题：为什么 AI 项目做了很多，却始终难以兑现价值？

为什么 AI 项目总是做不成？

很多企业的 AI 项目往往立项时声势浩大，高层重视、预算到位、试点汇报时数据亮眼，但几个月后却骤然降温，使用率下降，管理层陷入怀疑。这是很多企业在当下的普遍状态。麦肯锡在 2025 年末发布的报告解读中指出，大多数企业的 AI 项目仍停留在 PoC 或试点阶段，只有 7% 的组织实现“全组织部署整合”。

在传统的信息化项目中，系统的逻辑相对确定、清晰，大家更多是在既定规则上实现自动化。AI 项目则完全不同，它依赖大量高质量的数据，需要专门的人构建知识、定义评测标准，需要组织内部形成新的协作方式。

很多企业在复盘 AI 项目时，最初的直觉往往将问题归结于技术：是不是模型能力还不够强？算法效果不稳定？算力成本太高？AI 项目之所以停在 PoC，并不是因为技术做不出来，实际上是组织本身还没有为 AI 的工作方式做好准备。

因此，《CIO 之问》的后七问，选择将视角拉到企业系统与工程内部，从企业真实落地难题出发，逐一拆解那些在 AI 项目落地中绕不开的关键。

问题的第一站，是企业知识库。这是几乎每个企业在启动 AI 项目时，都会面对的课题。铺天盖地的教程让企业快速构建知识库成了一件看起来容易的事情，但现实却是，企业知识库往往是最早立项、也最容易陷入停滞的项目之一。

《