跳到主内容
AI
AI产品库AIProductHub.cn
Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型
✦ AI 文章

Moltbot作者被Claude刁难后:MiniMax M2.1是最优秀的开源模型

📅2026/2/27·👁7,758 阅读·🔗 查看原文
#AI资讯#量子位#国外榜

“熬不住了,已经忙到极致了”

公众号 QbitAI

Clawdbot痛失本名改叫Moltbot后,热度丝毫不减。

有人解锁花式玩法——

一位开发者的Moltbot突然主动开口说话,吓得他惊叫连连,调侃很快它就会在房间里飞了。

他只是给Moltbot设置指令,让其每天趁自己入睡时借助Codex CLI自动编写工具优化工作流,结果每天醒来都能收获一点小惊喜。

Moltbot先是在某个晚上给自己设计了专属形象,隔天夜里又调用ChatGPT API开发出了语音功能。结果这位开发者早上起来,Moltbot突然就开口说话了。

视频链接:https://mp.weixin.qq.com/s/l21cG7OGbb6qwIVXPOaG8A

Moltbot的实用价值被开发者们挖掘得淋漓尽致。有网站开发兼SEO领域的从业者直呼“我恨早前没给Mac Mini安Moltbot”。

他不仅将Moltbot与Notion打通,让其严格遵循规范自动撰写博客,还能在自己休息时持续工作;同时对接Toggl,只需口头指令就能实现工时自动记录;更联动谷歌搜索控制台与谷歌分析,生成定制化数据报告并每周自动发送给客户。

另一边,大伙儿也不用再急着囤适配Moltbot的Mac mini了。前后脚一系列云服务都上线了。

阿里云火速上线专属全套云服务,并给出了详细部署教程。

腾讯云的轻量应用服务器Lighthouse也已同步上线Clawdbot应用模板,预置了Clawdbot运行所需的环境。官方也都发了一键安装教程:

除此之外,市面上Moltbot的竞品也挺火。

比如下面这个一站式AI业务搭建工具“𝗧𝘄𝗶𝗻”,号称零配置部署、安全原生、无限弹性扩容,其主打的核心能力是能兼容各类app、支持浏览器操控、可自主做出决策、具备长期记忆能力。

背后团队刚刚完成了1000万美元种子轮融资。

趁着火爆,Moltbot作者Peter Steinberger也被拉出来接受采访了。

Peter最新参加了TBPN平台的直播访谈节目,回答了网友们感兴趣的一系列问题,包括Clawdbot项目起源、开发动机、发展历程、更名过程、行业影响、应用前景、安全挑战等。

量子位在不改变原意的基础上进行了编辑整理。

采访整理

主持人:我想先从这个项目的起步聊起,你可以讲讲自己的职业背景,以及对这个项目未来的规划吗?另外我还很好奇,这是你做的第一个项目,对吧?

Peter Steinberger:算是第一次正经写代码做项目。

主持人:我们之前还看到了你GitHub主页的截图,属实被惊到了,是真真正正的一夜爆红。真的特别开心能邀请到你。

Peter Steinberger:我也超开心能来。我自己开软件公司干了13年,4年前把公司卖掉了,之后我整个人就陷入了低谷,那段日子过得浑浑噩噩,一言难尽。

主持人:不过还好,现在总算重回赛道了。

Peter Steinberger:你也知道,都说工作四年就该歇一年,我却连轴转了13年,所以那三年,我基本就是摆烂状态。直到去年四月,突然就重新找回了做事的热情。

我之前一直深耕苹果和iOS领域,慢慢也有点腻了,总想做点新东西,但又没相关经验,不想显得自己啥都不懂,就一头扎进了AI领域。

刚开始探索的体验还不错,算不上极致惊艳,但已经足够吸引人了。我当时还纳闷,这么有意思的领域,怎么没什么人讨论?现在想来,应该是我错过了那三年AI发展的低谷期,而我回归的时机刚好。

二月份Claude Code开启公测,这也是我第一次接触这类工具,当时就觉得,这东西也太惊艳了。从那之后我就兴奋到失眠,真的就是睡不着觉的那种。就像以前有过沉迷某件事的经历,现在又重新找到了这种全身心投入的感觉。

主持人:不过这次是正向的投入。

Peter Steinberger:绝对是。我还拉了好多朋友一起入坑研究,结果他们也跟我一样,凌晨四点给他们发消息,全是秒回的。我甚至还组了个线下交流局,算是我的小圈子吧。一开始叫Claude Code Anonymous,现在改名叫Agents Anonymous了,毕竟得跟着趋势走嘛。

从那之后我就把这句话写在了个人简介里:告别“退休”,玩转AI。我超爱这种状态。

主持人:你可以跟我们聊聊,做这个项目之前,你还做过哪些东西?还有做这些项目时的思路是怎样的。我猜你肯定也设想过,有些项目会比其他的更火,但任谁也想不到,这个项目能火到这种程度。

最离谱的是,我在Ins上看到,那些完全不关注科技的人,居然都跑去苹果店买Mac Mini了。再看GitHub的星标数,之前不管是啥项目,大家都爱晒数据图,但这个项目的星标图,真的就是一条笔直向上的直线。我都想找GitHub的人聊聊了,真的太疯狂了。

Peter Steinberger:说实话,我做东西的核心宗旨就是图个开心。想要学好这些新技术,最好的方式就是带着兴趣去玩、去实操,所以我做的都是自己觉得有用的东西。

我试过不同的编程语言,不同的开发思路,算是摸索着来的。我不太喜欢“vibe coding”这个说法,我总爱开玩笑,我先做迷人的工程工作,然后到凌晨3点左右,我就开始做vibe coding,最后悔得直拍大腿。

主持人:真不如早点睡觉。

Peter Steinberger:有时候就是忍不住嘛,然后就一直捣鼓各种小玩意。

其实早前我就有做个人智能体的想法了,当时也试了试,那时候GPT-4刚出来没多久,体验感根本跟不上。我当时还想,各大科技公司用不了几个月肯定会做出来,那我何必费这个劲?坐等大厂出成品就好,他们做得肯定比我好。

我没有做很多事情。有一个项目至今仍未完成,等之后打算好好打磨。我会开发很多命令行工具(CLIs),因为智能体在这方面真的很擅长,得把这个环节打通。

这其实就是核心秘诀,要打造一套体系,让智能体能以最优的方式做软件开发。

这算是一点小门道吧。我之前试过超多方向,去年十一月份我还在纳闷:我想要的智能体,到底在哪呢?五月份的时候我就做过一个小项目,耗时两个月,一开始纯属玩票,我和两个朋友闲得无聊瞎折腾,突发奇想:做点啥有意思的工具好呢?如果能用手机调用Claude Code,会不会超酷?

其实这种想法大家都有,我天天都能看到有人做类似的东西。现在我甚至觉得,想要成为一名靠谱的实战工程师,必经之路就是给自己做一个蹩脚的编排工具,过程虽然折腾,但真的超有趣。

我花了两个月做这个工具,最后不得不停手,因为做得太好用了,我和朋友天天抱着研究。但这东西太让人上头了,严重影响我的精神状态,我整个人都快陷进去了。

主持人:有人对这东西的痴迷程度简直到了极致,我见过有人下了飞机,在机场就抱着电脑捣鼓Claude Code,完全沉浸其中,非要再发一个指令才肯停。

Peter Steinberger:现在只要智能体一停摆,我就浑身不自在,你看现在我还开着两个终端,就盼着它能一直跑、一直做东西。

我去年十一月也是这种状态,每天醒来第一件事,就是打开电脑,本来想着今天不搞新东西了,歇一天,但还是忍不住想看看WhatsApp上智能体又跑出来什么新东西。去厨房倒水的功夫,都要回来看看,还忍不住敲几句提示词。

后来我索性做了个WhatsApp的集成功能,发一句调用Claude Code,就能一键获取模型的输出结果,全程一步到位。这个功能只花了我一个小时,居然一次就成了。当时我就想,哇,这也太酷了。

不过我平时写提示词,总喜欢图文结合。因为图片能传递超多上下文信息,不用敲一大段文字。这其实是个实用小技巧,能提效很多。所以我又给这个功能加了图片识别的能力。

后来我周末出去短途旅行,发现这个工具的用处远比我想象的大,而且不光能用来编程。比如找餐厅的时候,它内置了谷歌服务,能直接查信息、做推荐。

那会儿我还想着,发个语音消息试试吧,结果发现功能里没做语音支持。看着消息的已读提示,我特别好奇,想知道它会怎么处理。结果十秒后,智能体居然回复了我。我当时就懵了,它是怎么做到的?

它说,你发的是个文件链接,没有显示后缀名,我识别了文件头,判断出是音频格式。本来想调用你Mac里的 FFmpeg工具把它转成能识别的WAV格式,但它没有安装,还出现了安装错误。随后我在你的环境中找到了OpenAI密钥。于是我通过curl这个工具,把你的语音文件发送到OpenAI的语音转写接口,这才回复你的。

就是在那一刻,一切都豁然开朗了。原来只要给它们足够的权限,这些智能体居然这么聪明、这么会想办法。

然后我就有点迷上那家伙了。我做了各种奇怪的事情,比如我把它用作闹钟,还让它迁移到我伦敦的电脑上。然后用SSH登录我的MacBook,早上把音量调到最大叫醒我。现在想想,我这怕是做了个世界上最贵的闹钟。

它甚至还出过差错,因为我给它加了心跳机制。你知道的,本来只是发个提示词、拿个结果,这种模式如果给了智能体完全的访问权限,本身就存在很大的安全隐患。但我偏想再推进一步:把整个流程自动化,让它能自主运行。

结果它给出的反馈,真的让我大吃一惊。

在我看来,这个项目不只是一项技术开发,更像是一种艺术创作和探索。一方面,它本质上只是把现有的技术模块拼接起来,像粘胶水一样;但另一方面,它彻底改变了我们和技术的交互方式,所有复杂的技术细节都被隐去了,你完全不用在意。

不用纠结怎么压缩会话、该选哪个模型,顶多偶尔考虑一下token成本,毕竟现在token还不便宜。但抛开这些,你和它交流,就像和朋友聊天。

主持人:是啊,或许去年大家就都想要这种智能体的交互体验了,只是当时所有的关注点都在浏览器。我总觉得,当时的方向从一开始就错了,如果能让智能体跨所有应用、所有设备和你对话,那浏览器还……就好像,我再也不在乎浏览器了。

Peter Steinberger:其实在做这个项目之前,我做了很多准备工作,写了一大堆命令行工具。因为我之前的开发环境特别简陋,完全没有可扩展性,后来有人在这个基础上做了各种奇奇怪怪的检索工具,但真正能实现规模化的,还是命令行工具。

智能体都懂Unix系统,你的电脑上可以跑上千个小程序,它们只要知道程序的名字,调用帮助菜单,加载需要的资源,再跟着帮助菜单的指引操作,就能把事做成。

而且聪明的做法是,按照模型的思维方式去开发,而不是按人类的习惯。模型习惯用参数,你就别搞其它命名;说白了,就是做面向智能体的开发。

某种意义上,这已经是一种全新的软件开发模式了。所以我现在大部分场景都用不上浏览器,比如我给家里的音响做了个谷歌服务的集成工具,还对接了摄像头、智能家居系统。智能体掌握的命令行工具和技能越多,能力就越强,玩起来也越有意思。

其实做WhatsApp这个功能的时候,我已经实现了很多核心功能,也彻底迷上了这个项目。当时觉得这东西太惊艳了,就发了推特分享。平时我发项目动态,都会有不少回复,但这次却特别冷清,感觉大家都没看懂它的价值。

我又拿给朋友看,非技术圈的朋友,都直呼想要。那一刻我就知道,我做的东西肯定有价值,只是技术圈的人暂时没理解而已。

后来我又试了各种玩法,还做了些破圈的功能,反正自己能用就行。说到底,这个项目本来就是为我自己做的,也是开源的。我想做点有意思的事,激励更多人,不是为了赚一大笔钱,我本身已经有一大笔钱了。

主持人:你这一周过得怎样?我们之前还开玩笑,现在一大堆人挤破头想给你投钱、收购项目、挖你入职。要知道,有些热度还不到你这个项目万分之一的公司,都能拿到数十亿的估值。你现在面前的机会多到数不清,但你却好像只想按自己的节奏继续做下去,而且做得很开心。你是怎么看待这些机会的?

Peter Steinberger:要说感受的话,睡眠肯定是彻底崩了,觉得

…(查看原文获取完整内容)

AI 助手

页面代理

AI 浏览器助手

下方「上网助手」可读外链、搜全网、RSS、GitHub;本页操作可输入指令,或点快捷指令。

需安装扩展点击按钮安装后使用
快捷指令