<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>循环工程 on KnightLi的博客</title>
        <link>https://knightli.com/tags/%E5%BE%AA%E7%8E%AF%E5%B7%A5%E7%A8%8B/</link>
        <description>Recent content in 循环工程 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Wed, 10 Jun 2026 13:13:28 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/%E5%BE%AA%E7%8E%AF%E5%B7%A5%E7%A8%8B/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Loops 取代 Prompts：循环工程正在改变 AI Agent 的用法</title>
        <link>https://knightli.com/2026/06/10/loops-replace-prompts-agent-loop-engineering/</link>
        <pubDate>Wed, 10 Jun 2026 13:13:28 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/10/loops-replace-prompts-agent-loop-engineering/</guid>
        <description>&lt;p&gt;“Loops 取代 Prompts”，更准确地说，是 AI Agent 使用方式从“写好一个提示词”转向“设计一个反馈系统”。&lt;/p&gt;
&lt;p&gt;过去我们常把重点放在 Prompt 上：怎样描述任务、怎样限定输出、怎样让模型一次给出更好的答案。这个思路对短任务仍然有效，但面对长周期、可验证、需要多步执行的任务时，单次提示词很容易半途而废。&lt;/p&gt;
&lt;p&gt;Loop 的思路不同。它不再期待模型一次性完成最终结果，而是把模型放进一个持续运行的循环里：生成、执行、验证、反馈、再生成。人类的工作也从“敲提示词”变成“设计规则、状态和边界”。&lt;/p&gt;
&lt;h2 id=&#34;prompt-和-loop-的核心区别&#34;&gt;Prompt 和 Loop 的核心区别
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;维度&lt;/th&gt;
          &lt;th&gt;传统 Prompt（提示词）&lt;/th&gt;
          &lt;th&gt;现代 Loop（循环工程）&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;工作模式&lt;/td&gt;
          &lt;td&gt;一问一答，通常是冷启动&lt;/td&gt;
          &lt;td&gt;持续上下文，后台运行，自动迭代&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;人类角色&lt;/td&gt;
          &lt;td&gt;提示词工程师，负责把话说清楚&lt;/td&gt;
          &lt;td&gt;系统架构师或 Meta-Prompt 工程师，负责写规则&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;反馈机制&lt;/td&gt;
          &lt;td&gt;结果不好就重写 Prompt&lt;/td&gt;
          &lt;td&gt;内置测试、验证、重试和纠错闭环&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;主要优势&lt;/td&gt;
          &lt;td&gt;上手简单，短期任务效率高&lt;/td&gt;
          &lt;td&gt;更适合复杂长线任务，能减少半途而废&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;主要风险&lt;/td&gt;
          &lt;td&gt;结果不稳定，需要人工反复追问&lt;/td&gt;
          &lt;td&gt;成本、状态和失控风险都更高&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Prompt 更像一次请求，Loop 更像一套系统。前者适合问答、摘要、改写、简单代码片段；后者更适合代码修复、自动化运维、库存检查、数据处理、持续监控等任务。&lt;/p&gt;
&lt;h2 id=&#34;一个典型-loop-怎样运转&#34;&gt;一个典型 Loop 怎样运转
&lt;/h2&gt;&lt;p&gt;现代 Agent 的 Loop 通常可以拆成四步。&lt;/p&gt;
&lt;p&gt;第一步是指令输入。用户用自然语言给 Agent 一个大目标，例如“检查仓库库存并在低于阈值时自动补货”，或者“修复这个仓库里导致测试失败的问题”。&lt;/p&gt;
&lt;p&gt;第二步是生成与执行。Agent 根据当前目标拆出第一步行动，可能是读取文件、调用 API、运行命令、修改代码，或者生成一段计划。&lt;/p&gt;
&lt;p&gt;第三步是验证与反馈。系统自动检查执行结果，例如运行测试、检查编译错误、读取日志、比对库存状态、确认接口返回值是否符合预期。&lt;/p&gt;
&lt;p&gt;第四步是决策循环。如果验证通过，Agent 推进下一步；如果失败，系统提取错误信息，调整上下文或 Prompt，让 Agent 自我纠错后再次执行。&lt;/p&gt;
&lt;p&gt;这个过程可以简化成：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;目标输入 -&amp;gt; 生成行动 -&amp;gt; 执行任务 -&amp;gt; 验证结果 -&amp;gt; 决策下一步
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                   ^                         |
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;                   |----------- 反馈 --------|
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;Loop 的价值在于，它把“看结果、找错误、再试一次”这件事自动化了。人不必每轮都手动复制报错、改提示词、重新发起请求，而是让系统持续推动任务向可验证的目标靠近。&lt;/p&gt;
&lt;h2 id=&#34;为什么-agent-更需要-loop&#34;&gt;为什么 Agent 更需要 Loop
&lt;/h2&gt;&lt;p&gt;AI Agent 和普通聊天最大的区别，是它不只生成文本，还会调用工具、读取状态、执行动作。只要进入工具调用和真实环境，单次 Prompt 就很难覆盖所有分支。&lt;/p&gt;
&lt;p&gt;比如修复一个项目的测试失败，模型第一次可能只看到一个报错。它修改后，还需要重新运行测试；测试通过后，还要确认有没有格式化问题；格式化通过后，可能还要检查边界用例。这个过程天然就是循环。&lt;/p&gt;
&lt;p&gt;再比如库存自动补货，Agent 不能只根据一句话输出“建议补货”。它需要读取库存、判断阈值、查询供应商、生成订单、等待确认，并在失败时回滚或告警。这里真正重要的是流程和约束，而不是某一句提示词写得多漂亮。&lt;/p&gt;
&lt;h2 id=&#34;落地前要注意的三个问题&#34;&gt;落地前要注意的三个问题
&lt;/h2&gt;&lt;p&gt;Loop 模式很强，但它也把复杂度从提示词本身转移到了系统设计。&lt;/p&gt;
&lt;p&gt;第一是 Token 成本。每次循环都需要消耗输入、上下文和输出 Token。短间隔、长周期、多工具的循环会让成本快速上升。生产环境通常需要预算上限、迭代次数限制、缓存策略和任务拆分。&lt;/p&gt;
&lt;p&gt;第二是状态复杂度。调试一个多轮状态机，比调试一次 Prompt 难得多。你需要知道 Agent 当前处在哪个阶段，读到了什么信息，为什么选择这个动作，以及失败后应该回到哪一步。&lt;/p&gt;
&lt;p&gt;第三是失控风险。如果没有明确的停止条件、拒绝机制和权限边界，Agent 可能陷入死循环，不断生成无用代码、重复调用工具，甚至在错误方向上越走越远。&lt;/p&gt;
&lt;h2 id=&#34;一个基础-loop-需要哪些规则&#34;&gt;一个基础 Loop 需要哪些规则
&lt;/h2&gt;&lt;p&gt;要让 Loop 可靠运行，至少要给系统几类规则。&lt;/p&gt;
&lt;p&gt;目标规则：定义什么叫任务完成，最好能被测试、状态检查或人工确认验证。&lt;/p&gt;
&lt;p&gt;行动规则：限制 Agent 能调用哪些工具、能修改哪些文件、能访问哪些数据。&lt;/p&gt;
&lt;p&gt;反馈规则：规定失败时如何提取错误信息，如何缩短上下文，如何决定重试或换策略。&lt;/p&gt;
&lt;p&gt;停止规则：设置最大迭代次数、最大成本、最大运行时间，以及必须停止并交给人工的条件。&lt;/p&gt;
&lt;p&gt;审计规则：记录每轮输入、动作、结果和决策，方便回放和排查。&lt;/p&gt;
&lt;p&gt;这些规则比“请你认真完成任务”更重要。Loop 工程的核心不是让模型更听话，而是让系统能约束模型、观察结果，并在错误出现时有明确的处理路径。&lt;/p&gt;
&lt;h2 id=&#34;从-prompt-工程到-loop-工程&#34;&gt;从 Prompt 工程到 Loop 工程
&lt;/h2&gt;&lt;p&gt;Prompt 工程不会消失，它会变成 Loop 系统中的一个组件。你仍然需要写清楚目标、约束和输出格式，但真正决定长期任务成败的，是验证、状态、重试和停止条件。&lt;/p&gt;
&lt;p&gt;可以这样理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Prompt 负责告诉模型“这一轮该怎么想”；&lt;/li&gt;
&lt;li&gt;Tool 负责让模型“能做什么”；&lt;/li&gt;
&lt;li&gt;State 负责记录“现在进展到哪里”；&lt;/li&gt;
&lt;li&gt;Test 负责判断“结果是否可靠”；&lt;/li&gt;
&lt;li&gt;Stop Hook 负责决定“什么时候必须停下”。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;当这些部分组合起来，AI Agent 才从一次性回答变成可持续运行的自动化系统。&lt;/p&gt;
&lt;h2 id=&#34;结论&#34;&gt;结论
&lt;/h2&gt;&lt;p&gt;“Loops 取代 Prompts”并不是说提示词不重要，而是说 AI Agent 的重点正在从单次表达能力，转向持续反馈能力。&lt;/p&gt;
&lt;p&gt;短任务仍然适合 Prompt。复杂任务、长线任务、需要验证的任务，则更适合 Loop。真正的变化在于，人类不再只是写一句完美提示词，而是设计一套能运行、能验证、能停止、能恢复的反馈闭环。&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
