跳到主内容
AI
AI产品库AIProductHub.cn
是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛
✦ AI 文章

是个公司都在用AI Agent,但大家真的用明白了吗| MEET2026圆桌论坛

📅2026/3/6·👁5,706 阅读·🔗 查看原文
#AI资讯#量子位

Agnet落地案例分享

公众号 QbitAI

“每个人每天使用最高频的三个APP中有两个是Agent时,才意味着AI Agent进入新发展阶段。”

“一个好Agent的衡量指标,包括可控性、可解释性以及持续稳定执行任务的能力。”

“多数Agent存在负毛利问题,完成任务的代价高于用户支付意愿,这对创业者来说是巨大挑战。”

……

在量子位MEET2026智能未来大会的圆桌环节,三位来自产业一线的嘉宾围绕AI Agent的革新进程展开深入讨论。他们分别是:

联汇科技CEO兼首席科学家赵天成博士

小宿科技联合创始人兼CEO杜知恒先生

蚂蚁集团平台体验技术部负责人徐达峰先生

2025年普遍被视为“Agent元年”。从客服、理赔等相对标准化的场景开始,Agent已经完成了初步落地,并验证了技术可行性与阶段性价值。

但真正的难题才刚刚显现——

如何让Agent同时跑通技术、产品与商业三条曲线,形成可持续的正向闭环,仍是摆在整个行业面前的共同挑战。

而在这场圆桌讨论中,三位嘉宾从产品形态、技术演进与商业现实等多个维度出发,分享了他们对Agent下一程的判断。

透过这些观点,我们或可窥见Agent从技术概念走向规模应用的关键路径,以及产业先行者们在探索中所面临的思考与抉择。

本次圆桌环节由量子位智库首席分析师刘萌媛主持。在不改变原意的基础上,本文对内容进行了编辑整理。希望能够给你带来更多的启发与思考。

MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下到场参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。

话题要点

目前在AI Agent及相关领域重点从事哪些工作?

各自落地效果最好的案例是什么?

真正好用的AI Agent产品应该关注哪些指标?

未来还有哪些对于AI Agent发展比较关键的卡点?

AI Agent的下一步关键演进方向是什么?进入新阶段的标志性节点是什么?

以下为圆桌对话全文:

圆桌实录

量子位:

无论是在前面各位嘉宾的演讲中,还是在整个2025年的讨论里,相信大家已经多次听到“AI Agent”这一关键词。

无论是技术迭代还是产品涌现,AI Agent确实屡屡让人眼前一亮。今天,我们将从更加理性、务实的角度来探讨:千行百业距离广泛应用AI Agent究竟还有多远?

为此,我们邀请到三位嘉宾,他们分别代表AI Agent产业链上不同领域的最前沿产品与技术,来为大家带来切实的分享。

首先,请三位嘉宾简要介绍一下自己,以及目前在AI Agent相关领域所从事的工作。

赵天成:

大家好,我是来自联汇科技的赵天成。在过去的五年里,我们团队一直在做的事情是:

第一,研发信号终端侧的多模态模型;

第二,探索如何让智能体从在虚拟世界做PPT、写写画画,走向物理世界,真正操控终端设备,也就是实现所谓的“物理智能体”。

目前我们在两个方向做了很多工作,一是致力于让多模态智能体本地化运行,不完全依赖云端强大算力。例如,让它在端侧设备(如AI PC)上,甚至在飞机等无网络环境中,也能高效处理海量多模态数据,并转化为真正实用、能帮用户解决实际问题的智能体。

更进一步,我们致力于将无人机、机器人、摄像头等具备真正执行能力的智能终端串联起来,形成协同工作的智能体网络。这是一个非常有意思的课题。目前大家熟悉的智能体,或许更多体现在处理工作流或特定查询场景中。而我们探索的是更系统的物理联动。

举个例子,一个智能摄像头探测到火灾,它可以自动通知另一个终端——比如一台配备灭火装置的机器狗。机器狗收到指令后前往现场扑灭火情,并在任务完成后返回基地,自动生成一份报告给管理员,说明“火灾已发生并被扑灭,问题已解决”。

这样一个从感知、决策、执行到反馈的完整闭环,能否通过智能体流畅地串联与调度,从而实现智能体从数字世界走向物理世界的跨越?这正是我们团队过去两年来持续深耕的核心方向。

徐达峰:

大家好,我是来自蚂蚁平台体验技术团队的徐达峰。我们目前主要聚焦在两个方向:

一是重构软件的研发方式。我们正在构建一套完整的智能研发体系——WeaveFox,其中包含WeaveFox-Coder、Vibe-Coding、Spec-Coding等模块,并打造了面向工程体系的Coding-Agent基础设施和软件工程-Agent基础设施。

我们的核心目标,不仅仅是“让模型能够写代码”,更是要将多模态生成代码、任务自动拆解、工具链智能协同等能力,真正融入到生产环境中。我们致力于让AI从辅助工具,转变为研发体系的原生能力,从而推动整个工程链路实现更高水平的自动化。

二是致力于将多智能体能力带给大众用户。

为此,我们推出了“蚂蚁百宝箱”以及“百宝箱超级智能体”。我们的愿景是将其打造成一个“通用Agent平台”——无需任何代码依赖,也不要求使用者具备技术背景,真正做到开箱即用。用户只需用自然语言描述需求,就能轻松构建并发布属于自己的智能体应用。

无论是内容创作类的需求,如生成文案、制作PPT、撰写报告、设计网页,还是通过多Agent协作完成更复杂的工作流任务,都可以通过这个平台实现。我们的目标,是将AI智能体从高门槛的“专业工具”,转变为人人都能用起来的“工具箱”。

杜知恒:

我是杜知恒,小宿科技打造的是面向Agent的一站式基础设施平台。

我们认为,其中尤为重要的一个产品是为Agent设计的搜索引擎。这里我们也呼应一下蚂蚁的观点:我们相信,优秀的Agent能够胜任人类可以完成的工作。

过去,搜索引擎和信息获取一直是人们工作、学习乃至日常生活中最主要的信息获取工具。我们提供的正是一个多语言、全球化的搜索引擎工具,专门服务于Agent。

除了搜索能力,我们还提供模型服务、AI沙盒等多样化的Agent工具集,致力于为大家打造一站式的Agent Infra平台。

各自落地效果最好的案例是什么?

量子位:

在三位做的Agent相关的产品里面,效果最好的Agent落地案例是什么?能否结合具体数据和观众分享一下,让大家对Agent落地价值有更直观的感受?

赵天成:

今年有两个点带来的ROI(投资回报率)提升还是非常明显的。

第一个是有了多模态。今年的确是VLM(视觉语言大模型)大幅度成熟的一年,之前大家用ChatGPT、GPT-4比较多,今年GPT-4o、Gemini 3这些新出来的多模态模型对于图像和视频的理解能力其实有质的飞跃。

有了这个能力之后,我们的智能体可以算是打开了新的窗户。之前Agent只能处理文本,要做图片任务还需要一段描述,再给到模型去理解执行,现在有了端到端模型之后,直接给视频、给扫描件、给一张图片甚至混合在一起都可以直接做(任务),很多以前不敢想的场景瞬间打开。

我们在多模态领域扎根很久,之前就在做很多探索,今年的确感受到建模本身的提升,多模态能力可以让我们的智能体即使在数字空间场景中,也可以做很多以前不可能做到的事情。

第二个是有了执行智能体。以前的AI即使可以理解视频、理解图像,也只能给你一个提醒“这边发生事故赶快修复”、“这边有问题赶快派人去吧”,现在有了执行智能体,无论是操控机械臂还是执行其他操作,现场就能直接解决问题。

这对于用户来说,投资回报率和价值完全不在一个量级,比如以前一个终端最多付一千块钱,有了智能执行端之后愿意付十万块钱,这是一百倍的本身价值的提升。

智能体核心逻辑在于结果即服务,提供的是一个结果,这个结果的价值定义了产品有多大的能力边界,一个是帮你看着,提醒你赶快灭火吧;第二个是直接告诉你已经帮你把火扑灭了,比人扑的更快一些,这个对客户来说价值是100倍的提升,这也是为什么我们非常笃定地相信多模态+执行是智能体在后续发展中非常重要的板块和体现。

杜知恒:

过去这一年Agent进化还是很明显的,从大家只会用Chatbot到真正开始用AI做各种各样的任务、工作,包括陪伴式的娱乐、学习。

我观察到在这几个场景中,Agent能做越来越多智能化的工作。

第一个就是刚才说的做PPT、写产品文档,包括Coding,在核心工作流中Agent开始能交付实习生水平的结果,这是过去一年中Agent领域非常明显的进步和进化。

另外可以看到,各种各样的垂类软件正在越来越多地采用AI技术,无论是客服系统、数据平台还是其他各类软件工具。我的观察是,上一代SaaS公司正在快速引入AI能力,这显著提升了它们服务客户的效率与质量。

徐达峰:

前面老师提到智能客服,还有端到端多模态+执行,我补充一个Coding Agent能力方面的个人观察。

Coding Agent已经从写一段代码进化为跑一段流程。在WeaveFox的实践中,Agent能看懂设计稿、理解上下文和组件规范,然后自动生成可上线代码。过去通常需要工程师在IDE中花半天时间调试,现在Agent几十秒就能跑完。而且这是在多个规模化项目里,我们稳定看到了3~5倍的效率提升。

这说明,只要工具链和上下文足够清晰,Agent的能力是可以被“工程化复制”的。

真正好用的AI Agent产品应该关注哪些指标?

量子位:

今天邀请到的三位嘉宾在AI Agent里面处于不同的生态位,小宿处于基础设施层,另外两位老师偏向于产品层,请各位在不同的生态位上定义真的好用、或者有价值的AI Agent产品,你们觉得现在更应该关注哪些指标?有哪些指标大家没有关注?下一步应该在哪些方面投入更多技术和精力呢?

杜知恒:

我的观点还是一样的,(如果AI)能更像人一样,交付一个从高中生到大学生到博士生能交付的结果,这就是好场景。

企业愿意为这类AI支付更高成本,背后的逻辑很明确:过去,大家把AI当作普通软件看待,关注点局限在软件订阅费的高低;而现在,大家会将其价值与实习生、全职员工的人力价值做对比。

即便目前存在堆砌Token完成任务的争议,包括我们公司在内,许多企业在高频使用AI进行代码编写(Coding)、撰写产品需求文档(PRD)、搭建各类工作流以优化效率的过程中,通过AI节省的人工成本,也远远超过了在Token上投入的费用,即使Claude Code很贵。

我觉得我们内部对Agent可用性最主要的评判标准,就是它能不能在特定场景交付一个相对完整的结果。

Agent在中国被叫智能体,但其实我觉得“代理人”这个翻译是更好的,一个Agent不能给你交付结果,你肯定不会花钱雇他,包括Coding这些场景在内,AI越来越能够真正交付结果。

现在Coding还有抽卡的情况,但即使是抽卡抽三次性价比依然很高。

赵天成:

我们从时间上来看,有两方面是整个业界要慢慢接受和改变的,因为智能体跟以前信息化系统和纯粹软件还是不太一样的。

第一个是之前很多人说做AI原生的Agent,我们发现以前软件系统有很多UI式、表单式结构,很多时候AI就是把表单的某些环节换成模型,这是比较方便的方式,但也有很多时候换汤不换药,还是原来的工作流做的事情。

其实可以把一个环节彻底用Agent代替,这时候可能会有一些更加创新型的产品并落地应用,这样才真正能把智能体的优势发挥出来,而不是受限于很条条框框的地方,只能做以前一些环节的替代。大家(才)会接受智能体可以真正替代一个流程一个环节,真正用AI的方式做这个事情。

第二个是Agent本身是可以进化的,在以往的AI应用中,包括我们的不少甲方客户在内,很多人会陷入一种认知误区:认为采购AI本质上就是采购一套算法,并且对算法的准确率、召回率有明确要求,若初始阶段无法达到既定指标,就不会验收。

但实际上,Agent的价值体现在实际应用过程中,Context(上下文信息)会不断丰富,它自身具备记忆能力,再结合用

…(查看原文获取完整内容)

AI 助手

页面代理

AI 浏览器助手

下方「上网助手」可读外链、搜全网、RSS、GitHub;本页操作可输入指令,或点快捷指令。

需安装扩展点击按钮安装后使用
快捷指令