电话: 邮箱:
博 学 而 笃 志   切 问 而 近 思 SEEK BROAD KNOWLEDGE · ASK EARNESTLY

关于银河

关于银河

银河国际(GALAXY) 澳洲放羊大叔引爆 AI 编程创新!Claude Code 急推 goal 口头,不干完不许停

发布日期:2026-05-13 19:58 来源:未知 作者:admin 浏览次数:

银河国际(GALAXY) 澳洲放羊大叔引爆 AI 编程创新!Claude Code 急推 goal 口头,不干完不许停

澳洲牧羊大叔顺手写的三行 bash,11 天内被 OpenAI、Anthropic 和 Hermes 集体收编了。

一觉悟来,Claude Code 又更新!

为了让 Claude 握续使命直到任务完成,Claude Code 最近推出的新功能:/goal 。

你惟有设定要求,Claude 不完成任务它毫不驱散!

张开剩余90%

用过 AI 编程用具的东说念主齐懂,这到底多伏击!

你给 Agent 下了一个任务,它跑了三个回合,改了两个文献,倏得停驻来问你「接下来需要我作念什么?」

不是,bug 你这还没修完呢啊!

Agent 越来越智谋,写代码越来越快,但「从新到尾把一件事干完」这件事,到 2026 年头齐莫得一家能作念到。

然后,一位来自澳大利亚的牧羊大叔 Geoffrey Huntley,用三行 bash 处置了。

while :; do cat PROMPT.md | claude-code --continuedone

他把它定名为 Ralph Loop,致意《辛普森一家》里阿谁长久搞不清景色但从不肃清的小孩 Ralph Wiggum。

逻辑极其悍戾,无穷轮回,反复把统一个 prompt 喂给 Agent。历程写在文献系统和 Git 历史里,高下文满了就开新实例,读文献接着干。

原始,不优雅,但相配灵验。

灵验到 OpenAI 看见了,Nous Research 看见了,Anthropic 也看见了。

11 天,三家顶级 AI 实验室,一辞同轨地把这三行 bash 写进了官方居品。

这一刻,统共东说念主齐显然了一件事 ——

通用东说念主工智能的临门一脚,可能不是更智谋的模子,而是「把事作念完」的模子。

换句话说,AI 编程的中枢战场正在从「生成代码」转向「闭环请托」。

11 天,三条线,统一个很是

4 月 30 日,OpenAI 的 Codex 最初上线 / goal。

Greg Brockman 在 X 上只丢了一句,「Codex 现已内置 Ralph loop++」。

一周后,Hermes Agent 跟上。又过 4 天,Claude Code 也上了。

11 天。三家。统一个号召。统一个功能。

但完结旅途,差了十万八沉。

Codex「不忘事」,Hermes「不烂尾」,Claude Code「不自欺」。

Codex:把有筹画存成一条数据库记载

OpenAI 是三家里开首脱手的,决策也最直爽。

在 Codex 里,/goal 是一个握久化的使命流对象,存在腹地的 app-server 状态层里。

关掉结尾、合上札记本、致使重启系统,有筹画齐不会丢。下次掀开 Codex,自动接上。

模子通过结构化的 update_goal 用具申报历程状态,token 预算奢华时触发「软着陆」而非硬停。

有东说念主用这个功能调和跑了 14 个小时,中间暂停 5 小时去就寝,回想 Codex 从断点续跑,把一个诞生驱动技俩作念完毕。

工程化,干净,但克制。

Hermes Agent:一个东说念骨干不完,银河国际(GALAXY)那就上一个团队

Hermes Agent 的筹画最大。

在这里,/goal 仅仅冰山一角。实在的重头戏是多智能体看板系统,Hermes 把「让 AI 把活干完」从单 Agent 问题升级成了团队互助问题。

看板的底层是腹地 SQLite,握久化存储,跨重启不丢。

你在上头创建一个任务卡片,Hermes 会凯旋把它拆成多个子任务,分派给不同的 Agent worker。每个 worker 是一个零丁的 OS 历程,有我方的身份、模子树立和使命目次。

看板和 / goal 是两套互补的系统。/goal 管的是单个 Agent 的有筹画锁定(Ralph loop),看板管的是多个 Agent 之间的任务调动。一个纵向潜入,一个横向铺开。

临了,是五层防烂尾机制。

第一层,心跳检测。每个 worker 如期向看板报到,讲明我方还辞世。

第二层,僵尸回收。worker 超时没反应?系统自动判定示寂,回收它手上的任务从新分派。macOS 上还有成心的达尔文僵尸检测逻辑。

第三层,退出约束。worker 没完成任务就退出了?系统自动把它标记为 blocked,不让它再接新活,退缩「摸鱼型 Agent」反复领任务又不作念。

第四层,幻觉约束。这是最狠的一层。AI 说「我作念完毕」不算数,系统会考证它履行产出的代码是否的确落盘了。Agent 说我方创建了一个文献但履行上莫得?收拢,回滚,重来。

第五层,重试预算。每个任务有零丁的 max_retries,最多重试 N 次,零碎就上报东说念主类。统共不会无穷轮回到死机。

Claude Code:作念事的东说念主和验收的东说念主,不可是统一个

Anthropic 是三家里临了脱手的,但决策最秘要。

实质上,Claude Code 的 / goal 是一个 session 级别的 Stop Hook。

你设定一个完成要求(比如「test / auth 目次下统共测试通过且 lint 无报错」),Claude 就运行干活。

要害联想在验收要领。每干完一轮,系统不让 Claude 我方判断「我作念完毕莫得」。

它把对话记载和你的完成要求一说念发给一个零丁的小模子(默许是 Haiku),让这个小模子来裁判。

小模子若是合计没完成,就需要复返一个具体情理(比如「test_login.py还有 2 个 failure」)。然后这个情泄露被注入 Claude 下一轮的高下文,教训它接着干。

若是小模子认为完成了,有筹画就会自动取销,任务驱散。

值得一提的是,这个裁判模子不调用任何用具,不读文献,不跑号召。它只看 Claude 在对话里产出的内容。

B体育官方网站首页入口

是以,你的完成要求必须是 Claude 在对话中能讲明的东西。

它最长援助 4000 字符,因此你不错写得很细。

致使,还不错在要求里加拘谨,比如「不修改其他测试文献」「20 轮内完成不然罢手」等等。

决赛进行时:使命流进口

把视角拉远一步。

Claude Code 背后站着 Anthropic,Codex 背后站着 OpenAI,Hermes Agent 接入了双方的模子,同期亦然 DeepSeek V4 等模子的主力分发渠说念。

三条旅途,偶合袒护了 ASI 决赛的三个生态进口。

而他们争的,亦然统同样东西 —— 使命流。

谁的 Agent 先让路发者养成「设完有筹画就走开」的民俗,谁就锁死了使命流进口。

因为民俗一朝造成,迁徙本钱是指数级的。

你不会荒诞离开一个一经跑通了看板调动、断点续传、checkpoint 回滚的 Agent 基础设施。

一个看似很小的 / goal 号召,背后卡的是整条 Agent 使命流的护城河。

参考府上:

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog银河国际(GALAXY)

https://code.claude.com/docs/en/goal

https://github.com/NousResearch/hermes-agent/releases/tag/v2026.5.7

https://github.com/anthropics/claude-code/releases/tag/v2.1.139

https://developers.openai.com/codex/changelog

发布于:山东省