跳到主内容
AI
AI产品库AIProductHub.cn
智能体落地元年,Agent Infra是关键一环|对话腾讯云Dify
✦ AI 文章

智能体落地元年,Agent Infra是关键一环|对话腾讯云Dify

📅2026/1/18·👁4,921 阅读·🔗 查看原文
#AI资讯#量子位

Agent是不确定性的复杂系统

公众号 QbitAI

毋庸置疑!2025年title属于「Agent元年」。

要说Agent这把火,一直从年初烧到了年末——

先是Manus,再到最近的豆包手机……Agent已然成为全行业的关注焦点。

而回顾这一年,也是Agent从技术萌芽,走向工程化落地的关键一年。

于是乎,量子位趁热打铁攒了场局,邀请来两位行业大拿——Dify开源生态负责人郑立和腾讯云云原生产品副总经理于广游做客,聊一聊他们眼里Agent落地过程中的挑战、机遇和未来:

从年初硅谷的宏大叙事,Agent正走向充满烟火气的务实。

行业之所以认可Agent,在于它真的在做事。

Agent真正落地,需要确定性的工程方法才能驾驭一个不确定性的复杂系统。

Agent Infra解决企业的偶然复杂度问题,而非本质复杂度。

对于中小公司或个人开发者,最大的门槛是缺乏勇气。

两位嘉宾还给出了一个高度一致的判断:

在智能体落地过程中,Agent Infra是关键一环。

下面一起跟随量子位的视角,看看他们具体都说了些什么,知识密度之高,不要轻易眨眼。

回顾Agent元年,技术走向工程落地

量子位:那我们今天先从Agent这个概念聊起吧。今年也要结束了,那站在年末,二位对这一年Agent的整体发展有什么印象和总结?

于广游 :我今年对Agent的最主要看法还是,今年Agent已经从技术萌芽期,走到了真正工程性落地的阶段。我个人看到有三种比较标志性的实践:

面向企业内部的Agent:首先是像咱们Dify这类产品,通过确定性去驾驭不确定性,从而实实在在地帮助企业内部提效。

面向大众的Agent:那再比如说Manus和豆包,它俩通过新的交互形态点燃用户对Agent的想象力。

新范式Agent:而像Claude Code这样的产品,能够通过Agent RL和工具调用,拓宽Agent自身能力范围。

至于我个人印象比较深刻的应用,其实还是AI代码工具。我觉得一方面它不再只解决代码问题,它也正在成为Agent连接现实世界的通用接口。

第二个点是AI代码工具,切实改变了原先的软件工程范式,然后在我们内部,我们也做了大量的从AI Coding到AISE(AI Software Engineer)的调整,包括研发模式、组织管理、角色职责等。

郑立:其实这一年Agent发展吧,我能感受到就是大传统和小传统之间的鲜明张力。

大传统其实就比如说来自硅谷那些的宏大叙事,他们会许诺用全自动智能体取代白领,逻辑完美但实际落地的时候会有些水土不服。

那从小传统来看,会充满一些烟火气,比如我看到义乌商家使用AI自动回复客户,还有比如独立开发者会用工作流进行代码评审。

总结起来,这是蛮有趣味的一年,然后也是在走向务实。

年初的时候,一个简单的Demo就能吸引资本市场,可以类比“立法阶段”,那年末其实我们就会类似进入到“司法阶段”,开始处理具体的、琐碎的执行层面问题。

这不是线性的进步,更多像是根茎状的蔓延。

那我们也看到秩序的逐步建立,并非来自基座模型的升级,更多时候来自于那些“胶水”——如产品工程、提示词工程、RAG、Pipeline和工具使用等技术手段,虽然它们不够优雅,但确实能够有效地去维持我们数字社会的运转。

量子位:确实就像两位所说,可能年初的时候大家还是会被Demo惊艳,年末就到了更工程化的阶段。其实以我们科技媒体的视角来看,这个进程非常快。智能体为什么会这么快成为行业共识呢?

于广游 :我觉得首先还是它能够真正做到解决问题。过去生产力的发展,本质上都是在延伸人类的手和脚,但实际我们工作中,确实也存在大量无法通过精确语言或编程描述的内容,需要Agent来解决。

然后其次就是,我们在落地过程中对工程方法的探索。今年有一系列工程方法快速成型,包括Agent Infra、Agent Runtime、不同的Agent架构范式、内容工程,这些技术帮助Agent实现了真正落地。

郑立:其实我感觉也差不多,不过在我看来,共识其实是资本在寻求新的组织方式。因为在我看来,互联网时代的红利已经被吃干抹净了,App的边际效用也在递减。

但是Agent承诺的是交互成本的一种坍塌,其实能看到权力从指令式计算到异度式计算的转移。

量子位:其实刚才两位也谈到了,今年有一些关键词都是在变化的,比如可能以前讲AI Infra,现在说Agent Infra。Agent落地与AI落地之间存在哪些区别?以及是否存在工作流的变化和对Infra需求的差异。

郑立:其实我觉得这个范式转移还是很明显的,我们从传统的那种if/else的逻辑判断转向到Agent的概率性目标规划。

放在过去,机器必须执行下一行代码,现在我们开发者更像是老师这种角色,通过Prompt、RAG和原则给予模型自由处理的空间。

区别还是在于新增了很多不确定性,比如传统软件工程中,Bug就是对规则的违反,而放到Agent工程里,失败其实是对我们意图的误解或概率上的漂移。我们没办法再像修Bug一样修复它,而是需要像教育孩子一样去约束或者说服Agent。

这不仅仅是工作流的变化,还有交付物的变化,比如说以前是确定的功能,那现在我们交付的就是一种概率性的能力,你没有办法明确定义它是否正确。

于广游:对,我感觉不确定性非常关键。我们团队内部观察到的是,Agent是不确定性的复杂系统。

那首先,Agent的效果通常是由七八个不同因素构成(模型本身、架构范式、Prompt、Content、工具选择和参数等)。这些子部件彼此之间又相互影响,我们很难明确它们的关系,所以Agent是一个复杂系统。

其次,对于同一个问题,你在不同时刻输入,Agent的输出,它也是不一样的,咱们称之为不确定性。那与之相反的,就是传统的微服务系统。

所以我认为工程师的工作方式必须进行这两点思维转变:

1、从工程思维转向科学实验思维:我们不能再仅仅依赖预先规划,而是要去建立一个评测体系,把里面环环相扣的复杂系统分解为单独的子系统,然后通过控制变量的方式,在科学实验中一步步驾驭Agent。

2、从Day One思维转向Day Two思维:我觉得我们对AI开发的思维也需要转变,过去Day One就代表代码已经上线给用户提供服务,下一步怎么优化看用户的需要;现在Day One只能够代表Agent能运行,效果的持续优化,也就是Day Two才是真正的开始。

所以我觉得Agent落地,不仅仅是靠几个巧妙的范式,我们需要循序渐进通过确定性的工程方法,才能驾驭一个不确定性的复杂系统,而这将带来Infra的重塑。

智能体落地,Agent Infra是关键一环

量子位:于老师刚刚也提到了整个工具的重塑。那从Infra角度来说,能详细讲一下腾讯云为加速Agent落地提供了哪些支持吗?

于广游 :我刚刚说Agent的本质是不确定性的复杂系统,那它在上线过程中,我们首先要解决的最大问题其实是自主运行带来的破坏性风险。

所以我们团队选择从后往前解决。先解决Agent安全问题,我们在Agent Infra上,推出了Agent安全沙箱,给Agent提供了一个独立的执行环境。

然后我们再驾驭Agent的不确定性和复杂性,为此我们会提供一系列的可观测性工具以及评估工具。

再进一步,我们就要进行效果的提升,对Agent的记忆和学习能力进行优化,比如元宝就已经进入了这一阶段。在积累相关经验后,我们也会提供相应的服务。

量子位:那包括您刚刚提到的Agent Runtime、安全沙箱这类Infra产品,和我们这些Agent平台之间有什么关系呢?以及腾讯Infra当前在关注什么?

于广游 :首先我们要厘清一个概念——Agent Infra到底是什么,我们可以先把企业问题划分为本质复杂度和偶然复杂度两种,前者是必须要解决的问题,后者会随着工具和方法选择存在一定的偶然性。

所以我觉得,Infra层其实就是解决企业在问题处理过程中,遇到的偶然复杂问题,但是这个问题是没有定下来的,对于不同的场景,要面临的偶然复杂度完全不同,具体要解决什么问题也要视情况而定。

不过无论解决什么问题,这里都有一个共性问题,这也是我们团队现在做的,就是去构建偶然复杂度问题的最大公共子集,包括:安全、执行环境、工具、记忆和观测。

而这些问题或多或少都有解决方案,其中我们认为最突出的一个问题就是Agent的自主运行。

所以我们团队做的安全沙箱,并不是简单的隔离环境,而是一个多层次、全链路的Agent运行安全体系。

量子位:那郑老师这边,您在提供Agent Runtime这类底层组件时,Dify是更倾向于自研还是说使用第三方产品,以及您对Agent Infra开闭源有什么看法吗?

郑立:我们本身的话,核心模块还是选择自研,我们觉得如果这些使用第三方组件,势必会导致核心组件不可控、给用户的服务质量无法保证,而其它的我们也会选择一些合适的开闭源方案。

然后开源这件事我们是这样认为的,AI时代基础模型可以是黑箱,但Infra必须是白箱,因为开发者需要看到底层代码,想了解Agent行为逻辑。而且我们观察到,对于初创公司和创新者,他们会选择开源,因为这里有一种低成本和灵活性。

相反,那些大企业则更加倾向于选择开源的商业版本或闭源版本,因为闭源实则是给大企业提供了责任转移与兜底服务。

量子位:于老师,根据您这边接触用户的经验来看,他们在选择Agent Infra产品时,一般会比较关注哪些要素?

于广游 :我觉得,首先对核心的业务逻辑层,我看到用户还是在意它是不是开源的,因为这样他们就可以围绕自己的业务进行任意修改,也会更透明更可控。

那具体到Infra层上,用户更在意体验是否极致、能否降低开发成本。在用户使用时,用户就更在意Agent的稳定性和效率,那么在这种情况下,我觉得闭源是有非常好的优势的。

量子位:听二位这样讲下来,我感觉在Agent这个领域里,开闭源正在形成分层互补,那么在这样的结构下,像那种小白开发者或者个人开发者能够通过Agent Infra把Agent开发和落地简化到一个什么程度?

郑立:其实这样我们会逼近于AI开发的一个Excel时刻。

这种简化其实是非常激进的,它会把基础设施的认知负荷降到最低,然后你就可以把全部精力集中在Prompt和数据治理上。

于广游 :我补充一下,我们腾讯云的Infra产品就更偏向于专业开发者,他们会有非常多的复杂度问题需要治理,所以我们主要还是面向Agent原生企业和AI原生企业,去帮助他们加速Agent落地过程。

量子位:想请两位老师来帮我们总结一下,你观察到的Agent Infra技术进展或趋势。

于广游 :我还是前面提到的AI Coding,我对这个事情印象非常深刻。

首先过去一年里,我能看到代码不仅是大模型抽象能力的来源,也正在成为Agent驾驭不确定性、连接世界的工具。

就拿AI Coding来说,它带来的是开发模式的颠覆改变,能够做到让我们团队里的每一个开发者,在分钟级就能拉起一个独立的全套开发环境,所以我觉得代码肯定是会产生全面影响的。

我认为任何一个工程师或者Agent从业者,都绝不能小觑Coding的影响,它非常之重要。

郑立:就我们个人而言,过去一年我们都在做自己的事情,主要的技术进展也都集中在补齐我们的短板。我们也看到了一个比较清晰的趋势,就是技术正在从开发者向非开发者移动。

量子位:如果现在让你们拿三个词限定的话,您能再讲讲Agent Infra为什么说是智能体落地应用的关键环节吗?

郑立:我先说吧,我认为主要是以下三点:

秩序:首先它会让混乱的模型变得可控;

连接:其

…(查看原文获取完整内容)

AI 助手

页面代理

AI 浏览器助手

下方「上网助手」可读外链、搜全网、RSS、GitHub;本页操作可输入指令,或点快捷指令。

需安装扩展点击按钮安装后使用
快捷指令