<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>开源项目 on KnightLi的博客</title>
        <link>https://knightli.com/tags/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/</link>
        <description>Recent content in 开源项目 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sat, 30 May 2026 14:39:48 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>Joplin：离线优先、支持同步和加密的开源笔记应用</title>
        <link>https://knightli.com/2026/05/30/joplin-open-source-note-taking-app/</link>
        <pubDate>Sat, 30 May 2026 14:39:48 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/30/joplin-open-source-note-taking-app/</guid>
        <description>&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/laurent22/joplin&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Joplin&lt;/a&gt; 是一个开源笔记与待办应用，支持 Windows、macOS、Linux、Android 和 iOS。它的定位不是轻量便签，而是一个可以长期保存大量笔记、同步到多设备、并尽量让数据掌握在用户手里的知识管理工具。&lt;/p&gt;
&lt;p&gt;Joplin 的笔记使用 Markdown 格式，支持笔记本、标签、全文搜索、附件、待办事项、插件、主题和浏览器 Web Clipper。对于想从 Evernote 迁移出来，或者想用更开放格式管理个人资料的人来说，它是很常见的选择。&lt;/p&gt;
&lt;h2 id=&#34;joplin-解决什么问题&#34;&gt;Joplin 解决什么问题
&lt;/h2&gt;&lt;p&gt;很多笔记应用用起来方便，但数据容易被锁在某个账号、某个云服务或某种私有格式里。Joplin 的思路更偏开放：本地保留完整数据，笔记正文使用 Markdown，再通过用户选择的同步目标在多设备之间同步。&lt;/p&gt;
&lt;p&gt;它适合下面几类需求：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想把笔记长期保存为 Markdown。&lt;/li&gt;
&lt;li&gt;想在电脑和手机之间同步笔记。&lt;/li&gt;
&lt;li&gt;想从 Evernote 导入旧笔记和附件。&lt;/li&gt;
&lt;li&gt;想使用端到端加密同步。&lt;/li&gt;
&lt;li&gt;想用插件和主题扩展笔记应用。&lt;/li&gt;
&lt;li&gt;想把网页内容快速剪藏到自己的笔记库。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;核心特性速查&#34;&gt;核心特性速查
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;特性&lt;/th&gt;
          &lt;th&gt;说明&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;开源&lt;/td&gt;
          &lt;td&gt;仓库公开，项目长期维护，许可证为 AGPL-3.0 license&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;跨平台&lt;/td&gt;
          &lt;td&gt;支持 Windows、macOS、Linux、Android、iOS&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Markdown&lt;/td&gt;
          &lt;td&gt;笔记正文使用 Markdown，便于阅读、迁移和长期保存&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;离线优先&lt;/td&gt;
          &lt;td&gt;本地始终保存数据，没有网络也能查看和编辑&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;同步&lt;/td&gt;
          &lt;td&gt;支持多种同步目标，包括 Joplin Cloud、Nextcloud、Dropbox、OneDrive 等&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;端到端加密&lt;/td&gt;
          &lt;td&gt;同步时可以启用 E2EE，降低云端存储风险&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;导入&lt;/td&gt;
          &lt;td&gt;支持从 Evernote 导入，也支持普通 Markdown 文件导入&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;扩展&lt;/td&gt;
          &lt;td&gt;支持插件、主题和 Web Clipper&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;离线优先是什么意思&#34;&gt;离线优先是什么意思
&lt;/h2&gt;&lt;p&gt;Joplin 官方 README 中强调它是 &amp;ldquo;offline first&amp;rdquo;。这意味着笔记不是只存在于云端，而是保存在本机或手机上。即使没有网络，也能打开、搜索和编辑已有笔记。&lt;/p&gt;
&lt;p&gt;这个设计对笔记工具很重要。网络不好、同步服务临时不可用、或者账号服务出现问题时，本地仍然有完整数据。同步只是让多设备保持一致，而不是把所有使用体验都绑定到云端。&lt;/p&gt;
&lt;h2 id=&#34;markdown-与导入能力&#34;&gt;Markdown 与导入能力
&lt;/h2&gt;&lt;p&gt;Joplin 的笔记使用 Markdown，这让它比完全私有格式更容易迁移和备份。用户可以直接导入普通 Markdown 文件，也可以从 Evernote 导入笔记。&lt;/p&gt;
&lt;p&gt;Evernote 导入时，Joplin 会尝试转换格式化内容，并保留资源文件，例如图片和附件，同时保留创建时间、更新时间、地理位置等元数据。对有多年 Evernote 资料的人来说，这一点比单纯复制文字更重要。&lt;/p&gt;
&lt;p&gt;不过，任何跨应用迁移都不应该盲信“一键完成”。复杂排版、表格、附件、内部链接和标签结构都建议先用少量样本测试，再迁移完整资料库。&lt;/p&gt;
&lt;h2 id=&#34;同步与加密&#34;&gt;同步与加密
&lt;/h2&gt;&lt;p&gt;Joplin 支持多种同步方式。常见选择包括：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;同步目标&lt;/th&gt;
          &lt;th&gt;适合场景&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;Joplin Cloud&lt;/td&gt;
          &lt;td&gt;想省心使用官方服务&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Nextcloud&lt;/td&gt;
          &lt;td&gt;已经有自建云或团队协作环境&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Dropbox&lt;/td&gt;
          &lt;td&gt;习惯使用 Dropbox 的个人用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;OneDrive&lt;/td&gt;
          &lt;td&gt;使用 Microsoft 生态的用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;文件系统 / WebDAV 等&lt;/td&gt;
          &lt;td&gt;想自己控制同步位置的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;同步可以配合端到端加密使用。启用后，笔记内容在同步到云端前会先加密，云服务更多只是保存加密后的数据。这样可以降低第三方云盘或同步服务泄露内容的风险。&lt;/p&gt;
&lt;p&gt;加密也会带来管理成本。用户需要妥善保存密码和恢复信息，否则换设备或重装后可能无法解密旧笔记。&lt;/p&gt;
&lt;h2 id=&#34;web-clipper-与插件&#34;&gt;Web Clipper 与插件
&lt;/h2&gt;&lt;p&gt;Joplin 还提供浏览器 Web Clipper，用来从 Chrome、Firefox 等浏览器保存网页和截图。对做资料收集、网页剪藏和研究笔记的人来说，这是很实用的入口。&lt;/p&gt;
&lt;p&gt;插件和主题则让 Joplin 更接近一个可扩展平台，而不是固定功能的笔记软件。用户可以根据自己的工作流扩展编辑、展示、搜索、导入导出等能力。&lt;/p&gt;
&lt;h2 id=&#34;和-obsidian-的区别&#34;&gt;和 Obsidian 的区别
&lt;/h2&gt;&lt;p&gt;Joplin 和 Obsidian 都常被 Markdown 用户拿来比较，但两者侧重点不同。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;维度&lt;/th&gt;
          &lt;th&gt;Joplin&lt;/th&gt;
          &lt;th&gt;Obsidian&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;主要定位&lt;/td&gt;
          &lt;td&gt;开源笔记与待办应用，内置同步方案和加密能力&lt;/td&gt;
          &lt;td&gt;本地 Markdown 知识库，强调双链、插件生态和图谱&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;数据组织&lt;/td&gt;
          &lt;td&gt;应用管理笔记本、标签、附件和数据库索引&lt;/td&gt;
          &lt;td&gt;直接围绕文件夹和 Markdown 文件工作&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;同步&lt;/td&gt;
          &lt;td&gt;内置多种同步目标和 E2EE&lt;/td&gt;
          &lt;td&gt;官方同步是付费服务，也可自行使用第三方同步&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;适合人群&lt;/td&gt;
          &lt;td&gt;想要开箱即用、跨端同步、兼顾隐私的人&lt;/td&gt;
          &lt;td&gt;想深度定制个人知识库和本地文件工作流的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果你想要一个“开源版 Evernote + Markdown + 同步加密”，Joplin 更贴近这个需求。如果你想围绕本地 Markdown 文件搭建高度定制的知识系统，Obsidian 可能更顺手。&lt;/p&gt;
&lt;h2 id=&#34;适合谁使用&#34;&gt;适合谁使用
&lt;/h2&gt;&lt;p&gt;Joplin 适合几类用户：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想从 Evernote 迁移出来的人。&lt;/li&gt;
&lt;li&gt;想把笔记保存为 Markdown 的用户。&lt;/li&gt;
&lt;li&gt;需要 Windows、macOS、Linux、Android、iOS 多端同步的人。&lt;/li&gt;
&lt;li&gt;关心隐私，希望启用端到端加密的人。&lt;/li&gt;
&lt;li&gt;希望笔记软件开源、可自托管、可长期迁移的人。&lt;/li&gt;
&lt;li&gt;需要网页剪藏和附件管理的人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不一定适合只想要极简便签的人。Joplin 功能较完整，配置同步、加密、插件和导入时，也需要花一点时间理解。&lt;/p&gt;
&lt;h2 id=&#34;使用建议&#34;&gt;使用建议
&lt;/h2&gt;&lt;p&gt;如果你准备试用 Joplin，可以按这个顺序开始：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;先在桌面端创建一个测试笔记本。&lt;/li&gt;
&lt;li&gt;导入少量 Markdown 或 Evernote 样本。&lt;/li&gt;
&lt;li&gt;检查图片、附件、标签、创建时间和格式是否正常。&lt;/li&gt;
&lt;li&gt;再设置同步目标，例如 Joplin Cloud、Nextcloud、Dropbox 或 OneDrive。&lt;/li&gt;
&lt;li&gt;如果要开启端到端加密，先确认所有设备都能正常同步和解密。&lt;/li&gt;
&lt;li&gt;最后再迁移完整笔记库。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这样做比直接把多年笔记一次性导入更稳，也方便在正式迁移前发现格式或同步问题。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;Joplin 的优势在于把几个重要方向放在了一起：Markdown、开源、跨平台、离线优先、同步和端到端加密。它不只是一个写 Markdown 的编辑器，更像一个面向长期使用的个人笔记系统。&lt;/p&gt;
&lt;p&gt;如果你希望笔记数据尽量开放，又不想完全自己拼同步、加密和移动端应用，Joplin 是很值得试的选择。它尤其适合从 Evernote 迁移、重视隐私、多设备使用，并希望以后仍能把数据迁走的用户。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/laurent22/joplin&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;laurent22/joplin&lt;/a&gt;&lt;br&gt;
官方文档：&lt;a class=&#34;link&#34; href=&#34;https://joplinapp.org/help/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Joplin documentation&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Jimmy：把 Evernote、Notion、Google Keep 等笔记导出转换成 Markdown</title>
        <link>https://knightli.com/2026/05/30/jimmy-note-conversion-tool-markdown/</link>
        <pubDate>Sat, 30 May 2026 11:55:56 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/30/jimmy-note-conversion-tool-markdown/</guid>
        <description>&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/marph91/jimmy&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Jimmy&lt;/a&gt; 是一个笔记转换工具，目标是把不同笔记应用或文档格式里的内容转换成 Markdown。它适合想把笔记从封闭应用里迁出来、放进 Obsidian、Joplin，或者只想长期保存为纯文本的人。&lt;/p&gt;
&lt;p&gt;项目文档里的定位很直接：导出或备份原笔记应用的数据，运行 &lt;code&gt;jimmy&lt;/code&gt; 转换，再把结果导入 Joplin、Obsidian，或者直接用 VSCode 等文本编辑器查看。&lt;/p&gt;
&lt;h2 id=&#34;jimmy-解决什么问题&#34;&gt;Jimmy 解决什么问题
&lt;/h2&gt;&lt;p&gt;很多笔记应用都有自己的导出格式。换应用时，最麻烦的往往不是文字内容，而是图片、附件、标签、内部链接和 front matter 这些结构化信息。&lt;/p&gt;
&lt;p&gt;Jimmy 做的事情就是把这些导出数据尽量整理成更通用的 Markdown 目录：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;笔记正文转换为 Markdown。&lt;/li&gt;
&lt;li&gt;尽量保留图片、资源和附件。&lt;/li&gt;
&lt;li&gt;尽量保留标签、外部链接和笔记内部链接。&lt;/li&gt;
&lt;li&gt;输出 Markdown + front matter。&lt;/li&gt;
&lt;li&gt;结果可以导入 Joplin、Obsidian 等工具，也可以直接用文本编辑器查看。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类工具的意义在于降低迁移成本。笔记一旦变成 Markdown，就不再强绑定某个应用，后续备份、搜索、版本管理和 LLM 处理都会简单很多。&lt;/p&gt;
&lt;h2 id=&#34;支持的笔记应用很多&#34;&gt;支持的笔记应用很多
&lt;/h2&gt;&lt;p&gt;Jimmy 支持的来源覆盖面很广，包括 Anki、Anytype、Bear、CherryTree、ColorNote、Day One、Diaro、Drafts、Dynalist、Evernote、Google Docs、Google Keep、Joplin、Notion、Obsidian、OneNote、QOwnNotes、RedNotebook、Reflect、Roam Research、Signal、Simplenote、Standard Notes、Synology Note Station、Telegram、Tiddlywiki、Turtl、UpNote、Wordpress、Zim、Zoho Notebook 等。&lt;/p&gt;
&lt;p&gt;并不是所有来源的保真度都完全一样。实际迁移时，仍然要先用一小批笔记试跑，重点检查图片、附件、标签、内部链接和日期字段是否符合预期。&lt;/p&gt;
&lt;h2 id=&#34;也能转换普通文档&#34;&gt;也能转换普通文档
&lt;/h2&gt;&lt;p&gt;除了笔记应用导出，Jimmy 也能处理一些常见文档格式。文档中提到可以转换单个文件，也可以递归转换整个文件夹，适合把杂乱的资料目录整理成 Markdown。&lt;/p&gt;
&lt;p&gt;常见支持格式包括：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;类型&lt;/th&gt;
          &lt;th&gt;例子&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;办公文档&lt;/td&gt;
          &lt;td&gt;DOCX、ODT、RTF&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;标记语言&lt;/td&gt;
          &lt;td&gt;Asciidoc、DocBook、Markdown、MediaWiki、reStructuredText&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;网页与电子书&lt;/td&gt;
          &lt;td&gt;HTML、MHTML、EPUB&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;数据与结构化文件&lt;/td&gt;
          &lt;td&gt;CSV、OPML、Jupyter Notebook&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;其他&lt;/td&gt;
          &lt;td&gt;PDF、EML、Fountain、txt2tags&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;如果只是把 DOCX、PDF 或 HTML 批量转成 Markdown，Jimmy 也可以作为一个离线批处理工具来用。&lt;/p&gt;
&lt;h2 id=&#34;两种使用方式&#34;&gt;两种使用方式
&lt;/h2&gt;&lt;p&gt;Jimmy 提供 CLI 和 TUI 两种界面。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;界面&lt;/th&gt;
          &lt;th&gt;适合场景&lt;/th&gt;
          &lt;th&gt;说明&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;CLI&lt;/td&gt;
          &lt;td&gt;批处理、脚本、完整功能&lt;/td&gt;
          &lt;td&gt;适合一次性转换文件夹、写迁移脚本、指定来源格式&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;TUI&lt;/td&gt;
          &lt;td&gt;交互式转换&lt;/td&gt;
          &lt;td&gt;适合手动操作，目前功能子集仍处于 beta 状态&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;官方 README 给出的 Linux 示例命令如下：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt; 1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 7
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 8
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt; 9
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;10
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;11
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 使用交互式 TUI 转换&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;jimmy-linux tui
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 转换一个 pandoc 支持的单文件&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;jimmy-linux cli libre_office_document.odt
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 转换整个文件夹&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;jimmy-linux cli path/to/folder
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;c1&#34;&gt;# 转换 Google Keep 导出&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;jimmy-linux cli takeout-20240401T160516Z-001.zip --format google_keep
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这些命令说明它不是只面向某一个笔记应用，而是把“笔记导出包”和“普通文档目录”都纳入了同一套转换流程。&lt;/p&gt;
&lt;h2 id=&#34;它的几个特点&#34;&gt;它的几个特点
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;特点&lt;/th&gt;
          &lt;th&gt;说明&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;离线运行&lt;/td&gt;
          &lt;td&gt;转换过程不依赖云服务，适合处理私人笔记&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;开源&lt;/td&gt;
          &lt;td&gt;仓库采用 GPL-3.0 license&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;跨平台&lt;/td&gt;
          &lt;td&gt;官方提供 Linux、Windows、macOS 下载&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;独立二进制&lt;/td&gt;
          &lt;td&gt;不要求用户额外安装 Docker、Python 或 Node.js&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;不使用 AI&lt;/td&gt;
          &lt;td&gt;转换过程不调用 AI，结果更可控，也减少隐私顾虑&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Markdown + front matter&lt;/td&gt;
          &lt;td&gt;方便导入笔记软件，也方便后续用 Git 管理&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;其中“离线”和“不使用 AI”很适合笔记迁移场景。笔记里经常有私人信息、工作资料和历史附件，把转换放在本地完成，会让风险边界更清楚。&lt;/p&gt;
&lt;h2 id=&#34;适合谁使用&#34;&gt;适合谁使用
&lt;/h2&gt;&lt;p&gt;Jimmy 适合几类人：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想从 Evernote、Notion、OneNote、Google Keep 等工具迁移到 Markdown 的用户。&lt;/li&gt;
&lt;li&gt;想把笔记导入 Obsidian、Joplin 或其他纯文本工作流的人。&lt;/li&gt;
&lt;li&gt;想把长期资料保存为未来更容易读取格式的人。&lt;/li&gt;
&lt;li&gt;想把笔记或文档准备成 LLM 可处理文本的人。&lt;/li&gt;
&lt;li&gt;需要递归转换 DOCX、PDF、HTML、ODT 等文件夹资料的人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不一定适合追求“一键完美迁移”的用户。不同笔记应用导出格式差异很大，复杂页面、数据库、嵌入内容和内部链接都可能需要人工复查。&lt;/p&gt;
&lt;h2 id=&#34;使用前的检查建议&#34;&gt;使用前的检查建议
&lt;/h2&gt;&lt;p&gt;真正迁移前，建议按这个顺序做：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;先从原笔记应用导出一小批样本。&lt;/li&gt;
&lt;li&gt;用 Jimmy 转换样本，而不是一上来转换全部笔记。&lt;/li&gt;
&lt;li&gt;检查 Markdown 正文、图片、附件、标签、创建时间、内部链接。&lt;/li&gt;
&lt;li&gt;确认目标应用，例如 Obsidian 或 Joplin，能正确识别目录结构和 front matter。&lt;/li&gt;
&lt;li&gt;再对完整导出包执行转换。&lt;/li&gt;
&lt;li&gt;保留原始导出包和转换结果，至少等确认无误后再清理。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这个流程虽然慢一点，但能避免迁移后才发现附件丢失、链接断掉或标签结构不对。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;Jimmy 的价值在于把笔记迁移从“依赖某个应用的导入器”变成“先转成通用 Markdown”。它支持的来源很多，输出也足够通用，适合把个人知识库从封闭格式里释放出来。&lt;/p&gt;
&lt;p&gt;如果你只是偶尔导出一两篇笔记，可能用不到它。但如果你有多年积累的笔记、附件和文档目录，想迁移到 Obsidian、Joplin 或 Git 管理的 Markdown 工作流，Jimmy 很值得试。它最适合做迁移中间层：先把数据变成可读、可备份、可批处理的文本，再决定放进哪个笔记系统。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/marph91/jimmy&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;marph91/jimmy&lt;/a&gt;&lt;br&gt;
文档链接：&lt;a class=&#34;link&#34; href=&#34;https://marph91.github.io/jimmy/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Jimmy - Note Conversion Tool&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>AI 自动用手机哪家强？MobiAgent、Mobile-Agent、Mobilerun 和 mobile-use 对比</title>
        <link>https://knightli.com/2026/05/29/mobile-gui-agent-projects-comparison/</link>
        <pubDate>Fri, 29 May 2026 21:47:24 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/29/mobile-gui-agent-projects-comparison/</guid>
        <description>&lt;p&gt;最近连续整理了四个移动端 GUI 智能体项目：&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobiagent-mobile-gui-agent-framework/&#34; &gt;MobiAgent&lt;/a&gt;、&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobile-agent-gui-agent-family/&#34; &gt;Mobile-Agent&lt;/a&gt;、&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobilerun-mobile-device-agent-framework/&#34; &gt;Mobilerun&lt;/a&gt; 和 &lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobile-use-real-mobile-app-agent/&#34; &gt;mobile-use&lt;/a&gt;。它们都和“让 AI 操作手机或移动 App”有关，但定位并不一样。&lt;/p&gt;
&lt;p&gt;简单说：MobiAgent 更像可定制手机智能体研究系统；Mobile-Agent 是通义实验室围绕 GUI agent 的系列工作集合；Mobilerun 更偏可落地的本地/云端移动设备控制框架；mobile-use 则强调真实 App 操作、任务分解、数据抽取和 AndroidWorld 评测。&lt;/p&gt;
&lt;h2 id=&#34;基本信息对比&#34;&gt;基本信息对比
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;站内文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;主要定位&lt;/th&gt;
          &lt;th&gt;设备/平台&lt;/th&gt;
          &lt;th&gt;开源协议&lt;/th&gt;
          &lt;th&gt;更适合谁&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;MobiAgent&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobiagent-mobile-gui-agent-framework/&#34; &gt;站内介绍&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/IPADS-SAI/MobiAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;IPADS-SAI/MobiAgent&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;可定制手机 GUI 智能体系统，包含模型、runner、记忆、加速和评测&lt;/td&gt;
          &lt;td&gt;主要面向 Android/Harmony 手机&lt;/td&gt;
          &lt;td&gt;Apache-2.0&lt;/td&gt;
          &lt;td&gt;研究者、移动智能体实验团队&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Mobile-Agent&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobile-agent-gui-agent-family/&#34; &gt;站内介绍&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/X-PLUG/MobileAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;X-PLUG/MobileAgent&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;通义实验室 GUI 智能体家族，覆盖移动端、桌面、浏览器和工具调用&lt;/td&gt;
          &lt;td&gt;手机、PC、网页、云手机/云桌面&lt;/td&gt;
          &lt;td&gt;MIT&lt;/td&gt;
          &lt;td&gt;关注 GUI agent 技术路线的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Mobilerun&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobilerun-mobile-device-agent-framework/&#34; &gt;站内介绍&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/droidrun/mobilerun&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;droidrun/mobilerun&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;LLM 无关的移动设备 agent 框架，支持 CLI、Python API 和云端设备工作流&lt;/td&gt;
          &lt;td&gt;Android、iOS、本地设备、云端设备&lt;/td&gt;
          &lt;td&gt;MIT&lt;/td&gt;
          &lt;td&gt;开发者、QA、自动化工作流团队&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;mobile-use&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/29/mobile-use-real-mobile-app-agent/&#34; &gt;站内介绍&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/minitap-ai/mobile-use&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;minitap-ai/mobile-use&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;用自然语言操作真实移动 App，强调任务分解、结构化抽取和 AndroidWorld&lt;/td&gt;
          &lt;td&gt;Android 实机/模拟器、iOS 模拟器&lt;/td&gt;
          &lt;td&gt;Apache-2.0&lt;/td&gt;
          &lt;td&gt;做移动 App agent、数据抽取和评测的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;mobiagent&#34;&gt;MobiAgent
&lt;/h2&gt;&lt;p&gt;MobiAgent 来自 IPADS-SAI，定位是一个可定制的手机智能体系统。它不是只提供一个执行脚本，而是把 MobiMind 模型家族、AgentRR 动作记录与回放、MobiFlow 评测基准、手机 runner、数据采集和 Android app 放到同一套体系里。&lt;/p&gt;
&lt;p&gt;它的特点是研究系统比较完整。MobiAgent 关注真实手机任务中的准确率、效率、记忆和可复用动作序列。README 中提到的用户画像记忆、经验记忆、动作记忆，以及多任务执行，都说明它在尝试处理长期任务和重复任务。&lt;/p&gt;
&lt;p&gt;它的门槛也相对高。完整运行需要设备、ADB、模型部署、依赖环境、可选的向量数据库和图数据库配置。更适合研究或工程实验，不太像面向普通用户的“安装即用”手机助手。&lt;/p&gt;
&lt;h2 id=&#34;mobile-agent&#34;&gt;Mobile-Agent
&lt;/h2&gt;&lt;p&gt;Mobile-Agent 来自 X-PLUG/通义实验室。这个仓库已经从早期手机操作智能体，扩展成一个 GUI 智能体家族：Mobile-Agent-v1/v2/v3/v3.5、Mobile-Agent-E、PC-Agent、GUI-Critic-R1、UI-S1、GUI-Owl、ToolCUA 等都在同一条技术线上。&lt;/p&gt;
&lt;p&gt;它的特点是跨度大。Mobile-Agent 不只关心手机，还覆盖桌面、浏览器、云手机、云桌面、GUI 感知、grounding、错误诊断、强化学习和 GUI/工具路径编排。GUI-Owl 系列模型让它更像一个跨平台 GUI agent 基础模型路线，而不是单个移动自动化项目。&lt;/p&gt;
&lt;p&gt;它的不足也来自这个跨度：仓库更像研究成果集合，使用者需要先判断自己要跑哪个子项目、哪个模型和哪个场景。它适合跟踪技术演进和复现实验，不一定是最快接入业务流程的选择。&lt;/p&gt;
&lt;h2 id=&#34;mobilerun&#34;&gt;Mobilerun
&lt;/h2&gt;&lt;p&gt;Mobilerun 来自 droidrun，定位更工程化：让 LLM agent 通过自然语言控制 Android 和 iOS 设备。它提供 CLI、TUI、Docker、Python API、Portal-based control、vision mode、reasoning mode、结构化输出、自定义工具、app cards、执行轨迹和云端设备服务。&lt;/p&gt;
&lt;p&gt;它最突出的地方是模型无关和部署形态清楚。开发者可以接 OpenAI、Anthropic、Gemini、Ollama、DeepSeek、OpenRouter 或 OpenAI-compatible providers；也可以选择本地框架或 Mobilerun Cloud。对真实团队来说，这种“设备控制层和模型层解耦”的设计很重要。&lt;/p&gt;
&lt;p&gt;它也有移动端自动化常见的门槛：Android 需要开发者选项、USB 调试和 Portal app；iOS 需要单独流程；复杂任务还要处理权限弹窗、页面变化、失败重试和日志排查。它更适合愿意把 mobile agent 当成工程组件接入的人。&lt;/p&gt;
&lt;h2 id=&#34;mobile-use&#34;&gt;mobile-use
&lt;/h2&gt;&lt;p&gt;mobile-use 来自 minitap-ai，目标是让 AI agent 使用真实 Android 和 iOS App。它支持自然语言控制、UI-aware automation、数据抽取、不同 LLM 配置，并强调 AndroidWorld 基准表现。README 中还提到项目是首个在 AndroidWorld benchmark 上达到 100% 的 agentic framework。&lt;/p&gt;
&lt;p&gt;它的亮点是任务分解和结构化抽取。比如从 Gmail 中找未读邮件，并按指定 JSON 格式返回发件人和主题，这类任务比“打开设置看看电量”更接近真实生产需求。它把移动 GUI agent 从“会操作”推进到“能把 App 里的信息整理出来”。&lt;/p&gt;
&lt;p&gt;它的限制主要在设备支持和运行环境。Android 可以用实体手机或模拟器；iOS 目前主要支持 macOS 上的模拟器，物理 iOS 设备还不支持。Docker 快速启动也主要面向 Android。评估它时，要先确认目标设备和 App 场景能否被当前执行通道覆盖。&lt;/p&gt;
&lt;h2 id=&#34;功能对比&#34;&gt;功能对比
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;功能维度&lt;/th&gt;
          &lt;th&gt;MobiAgent&lt;/th&gt;
          &lt;th&gt;Mobile-Agent&lt;/th&gt;
          &lt;th&gt;Mobilerun&lt;/th&gt;
          &lt;th&gt;mobile-use&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;自然语言任务&lt;/td&gt;
          &lt;td&gt;支持&lt;/td&gt;
          &lt;td&gt;支持&lt;/td&gt;
          &lt;td&gt;支持&lt;/td&gt;
          &lt;td&gt;支持&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;真实手机操作&lt;/td&gt;
          &lt;td&gt;强，偏 Android/Harmony&lt;/td&gt;
          &lt;td&gt;强，含移动端与云手机&lt;/td&gt;
          &lt;td&gt;强，Android/iOS&lt;/td&gt;
          &lt;td&gt;强，Android；iOS 偏模拟器&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;桌面/浏览器扩展&lt;/td&gt;
          &lt;td&gt;不是重点&lt;/td&gt;
          &lt;td&gt;强，含 PC-Agent、GUI-Owl、ToolCUA&lt;/td&gt;
          &lt;td&gt;不是主要定位&lt;/td&gt;
          &lt;td&gt;不是主要定位&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;模型层&lt;/td&gt;
          &lt;td&gt;自带 MobiMind 系列&lt;/td&gt;
          &lt;td&gt;GUI-Owl、Mobile-Agent 系列&lt;/td&gt;
          &lt;td&gt;LLM 无关，接多家模型&lt;/td&gt;
          &lt;td&gt;可配置多种 LLM&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;执行器/runner&lt;/td&gt;
          &lt;td&gt;强，含 ADB runner、多任务 runner&lt;/td&gt;
          &lt;td&gt;子项目各自提供&lt;/td&gt;
          &lt;td&gt;强，CLI/TUI/Python API/Docker&lt;/td&gt;
          &lt;td&gt;有源码、Docker 和平台入口&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;记忆能力&lt;/td&gt;
          &lt;td&gt;用户画像、经验、动作记忆&lt;/td&gt;
          &lt;td&gt;v3/v3.5 路线中强调记忆与反思&lt;/td&gt;
          &lt;td&gt;更偏轨迹、日志和工程调试&lt;/td&gt;
          &lt;td&gt;更偏任务分解与状态执行&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;评测&lt;/td&gt;
          &lt;td&gt;MobiFlow&lt;/td&gt;
          &lt;td&gt;多个论文/基准方向&lt;/td&gt;
          &lt;td&gt;有 benchmark 结果入口&lt;/td&gt;
          &lt;td&gt;AndroidWorld 表现突出&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;云端设备&lt;/td&gt;
          &lt;td&gt;不是主要卖点&lt;/td&gt;
          &lt;td&gt;支持云手机/云桌面体验&lt;/td&gt;
          &lt;td&gt;Mobilerun Cloud 是重点&lt;/td&gt;
          &lt;td&gt;有平台入口&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;结构化输出&lt;/td&gt;
          &lt;td&gt;可通过工程流程实现&lt;/td&gt;
          &lt;td&gt;视子项目而定&lt;/td&gt;
          &lt;td&gt;明确支持&lt;/td&gt;
          &lt;td&gt;明确支持&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;优缺点对比&#34;&gt;优缺点对比
&lt;/h2&gt;&lt;p&gt;MobiAgent 的优点是系统完整，适合研究手机 GUI agent 的模型、记忆、加速和评测闭环；缺点是部署链路长，工程配置重，普通开发者上手成本较高。&lt;/p&gt;
&lt;p&gt;Mobile-Agent 的优点是技术路线最宽，能看到 GUI agent 从手机走向桌面、浏览器、工具调用和基础模型的演进；缺点是项目族复杂，想直接落地某个具体场景时，需要先做较多筛选。&lt;/p&gt;
&lt;p&gt;Mobilerun 的优点是工程接口清晰，模型无关，本地框架和云服务分层明确，适合把移动设备自动化接入产品或内部工具；缺点是仍然要面对移动设备权限、环境、App 状态和云端成本问题。&lt;/p&gt;
&lt;p&gt;mobile-use 的优点是聚焦真实 App 使用、任务分解和结构化数据抽取，AndroidWorld 方向也让它更容易评估；缺点是 iOS 物理设备支持有限，完整使用仍然需要配置模型、设备和运行环境。&lt;/p&gt;
&lt;h2 id=&#34;适用范围建议&#34;&gt;适用范围建议
&lt;/h2&gt;&lt;p&gt;如果你要做移动智能体研究，优先看 MobiAgent 和 Mobile-Agent。前者更聚焦手机端系统闭环，后者更适合观察 GUI agent 的跨平台演进。&lt;/p&gt;
&lt;p&gt;如果你要做移动 App 自动化、QA、数据抽取或内部工作流，优先看 Mobilerun 和 mobile-use。Mobilerun 更像可接入工程系统的运行框架，mobile-use 更适合验证自然语言 App 操作和结构化抽取。&lt;/p&gt;
&lt;p&gt;如果你关注未来个人助手形态，四个都值得跟踪。MobiAgent 代表手机 agent 的系统化研究，Mobile-Agent 代表跨平台 GUI agent 路线，Mobilerun 代表设备控制基础设施，mobile-use 代表真实 App 任务分解和评测驱动路线。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;这四个项目的差异说明，移动端 GUI agent 已经不只是“让模型看截图点按钮”。真正的问题变成了：模型如何理解界面，执行器如何稳定控制设备，任务如何拆解和评估，云端设备如何管理，结果如何结构化返回，风险如何被限制。&lt;/p&gt;
&lt;p&gt;短期内，最现实的落地场景会是 QA、数据抽取、内部流程自动化和受控设备池。长期看，谁能把设备控制、模型能力、权限边界、日志追踪和用户确认机制做稳，谁就更接近真正可用的移动端 AI 助手。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>mobile-use 看点：让 AI 操作真实 App，还能提取数据</title>
        <link>https://knightli.com/2026/05/29/mobile-use-real-mobile-app-agent/</link>
        <pubDate>Fri, 29 May 2026 21:43:46 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/29/mobile-use-real-mobile-app-agent/</guid>
        <description>&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/minitap-ai/mobile-use&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;mobile-use&lt;/a&gt; 是 minitap-ai 开源的移动端 AI agent 框架，目标是让智能体像人一样使用真实 Android 和 iOS App。用户用自然语言描述任务，框架负责理解界面、操作 App，并把结果返回给调用方。&lt;/p&gt;
&lt;p&gt;从 README 看，mobile-use 的重点不只是“能点手机”，还强调 UI-aware automation、数据抽取、可配置模型，以及在 AndroidWorld 基准上的表现。项目还提供云平台、文档和论文入口，说明它既是开源框架，也是一个围绕移动端智能体搭建的产品与研究体系。&lt;/p&gt;
&lt;h2 id=&#34;它和普通手机自动化有什么不同&#34;&gt;它和普通手机自动化有什么不同
&lt;/h2&gt;&lt;p&gt;传统手机自动化通常依赖脚本、坐标、控件 ID 或固定流程。它适合稳定页面，但遇到界面变化、弹窗、搜索结果、列表滚动和跨 App 操作时，很容易失效。&lt;/p&gt;
&lt;p&gt;mobile-use 的路线是让 AI agent 直接处理自然语言目标和 UI 状态：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用户用自然语言描述任务，不必预先写死每一步。&lt;/li&gt;
&lt;li&gt;框架读取移动端界面，并结合模型判断下一步操作。&lt;/li&gt;
&lt;li&gt;可以从 App 中抽取信息，并按指定格式返回，比如 JSON。&lt;/li&gt;
&lt;li&gt;支持不同 LLM 配置，包括 OpenAI API compatible providers。&lt;/li&gt;
&lt;li&gt;Android 可以通过实体手机或模拟器运行，iOS 目前主要面向 macOS 上的模拟器。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类框架更适合“半结构化”的移动任务：目标明确，但每次页面状态、数据内容和路径不完全一样。&lt;/p&gt;
&lt;h2 id=&#34;androidworld-结果值得注意&#34;&gt;AndroidWorld 结果值得注意
&lt;/h2&gt;&lt;p&gt;mobile-use README 中提到，项目在 AndroidWorld benchmark 上达到 100% 完成表现，并链接了对应论文。无论具体评测细节如何，这都说明项目团队把“任务分解”和“可评测执行”放在了很高的位置。&lt;/p&gt;
&lt;p&gt;这点比单纯演示更关键。GUI agent 最容易出现的问题是：一个视频里看起来很聪明，但换一个任务、设备或初始状态就不稳定。基准测试不能完全代表真实使用，却能逼迫系统面对一组标准化任务，并暴露规划、定位、恢复和状态理解能力。&lt;/p&gt;
&lt;p&gt;README 中的论文题目也点出了方向：通过任务分解提升 AndroidWorld 准确率。对移动端智能体来说，复杂任务往往不能靠一个大提示词直接完成，而需要拆成可执行子任务，并在每一步检查状态。&lt;/p&gt;
&lt;h2 id=&#34;数据抽取是实用入口&#34;&gt;数据抽取是实用入口
&lt;/h2&gt;&lt;p&gt;mobile-use 的一个现实场景是从原生 App 中抽取数据。很多信息并不暴露在 API 中，只能在 App 界面里查看，比如邮件列表、订单状态、社交内容、运营后台、消息通知等。&lt;/p&gt;
&lt;p&gt;README 给出的示例是打开 Gmail，找到未读邮件，并把发件人和主题整理成 JSON。这个方向很实用，因为它把移动 GUI agent 从“帮我操作一下”推进到“帮我把 App 里的信息结构化拿出来”。&lt;/p&gt;
&lt;p&gt;不过，这也带来边界问题。数据抽取涉及账号、隐私、平台条款和访问权限。真正使用时，应该明确设备归属、任务授权、数据保存方式和输出范围，不能把手机界面当成无限制的数据源。&lt;/p&gt;
&lt;h2 id=&#34;部署门槛和限制&#34;&gt;部署门槛和限制
&lt;/h2&gt;&lt;p&gt;mobile-use 支持从平台快速开始，也支持从源码运行。源码方式需要配置 &lt;code&gt;.env&lt;/code&gt;、LLM 配置和依赖环境；Android 侧可以使用实体手机或模拟器，Docker 快速启动目前主要面向 Android；iOS 侧需要 macOS、Xcode 和 Facebook 的 iOS Development Bridge，README 也说明物理 iOS 设备暂不支持。&lt;/p&gt;
&lt;p&gt;这些限制并不意外。移动端自动化比浏览器自动化更依赖设备、系统权限和调试通道。尤其是 iOS，系统封闭性更强，能稳定接入模拟器已经有价值，但离“任意真实 iPhone 自动化”还有距离。&lt;/p&gt;
&lt;p&gt;因此，评估 mobile-use 时不要只看模型效果，还要看自己的目标设备、App 类型、运行环境和合规边界是否匹配。&lt;/p&gt;
&lt;h2 id=&#34;适合谁关注&#34;&gt;适合谁关注
&lt;/h2&gt;&lt;p&gt;mobile-use 适合几类人关注：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想研究 AndroidWorld、移动 GUI agent 和任务分解方法的研究者。&lt;/li&gt;
&lt;li&gt;想把自然语言移动操作接入内部工具的开发者。&lt;/li&gt;
&lt;li&gt;需要从原生 App 抽取结构化数据的团队。&lt;/li&gt;
&lt;li&gt;做移动 App QA、回归测试或探索式测试的人。&lt;/li&gt;
&lt;li&gt;想比较 mobile-use、Mobilerun、Mobile-Agent 等不同移动端智能体路线的人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果目标是一个面向普通用户的手机助手，它目前还偏工程和研究框架；如果目标是验证移动端 agent 的可行性，它提供了一个很好的开源起点。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;mobile-use 的亮点在于把真实 App 操作、结构化数据抽取和基准评测放在同一个项目里。它不是只做“自然语言点手机”的包装，而是在尝试把移动端任务拆解成可执行、可评估、可复现的智能体流程。&lt;/p&gt;
&lt;p&gt;移动端会是 GUI agent 的重要战场，因为大量个人和业务任务发生在 App 里，而不是网页或 API 里。mobile-use 这类项目的意义，就是让智能体从聊天窗口走进真实应用界面。它还没有把设备、权限和风险问题全部抹平，但已经给开发者提供了一个足够具体的实验平台。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/minitap-ai/mobile-use&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;minitap-ai/mobile-use&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>想让 AI 自动点手机？Mobilerun 支持 Android 和 iOS</title>
        <link>https://knightli.com/2026/05/29/mobilerun-mobile-device-agent-framework/</link>
        <pubDate>Fri, 29 May 2026 21:43:45 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/29/mobilerun-mobile-device-agent-framework/</guid>
        <description>&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/droidrun/mobilerun&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Mobilerun&lt;/a&gt; 是 droidrun 开源的移动设备自动化框架，目标是让 LLM agent 可以用自然语言控制 Android 和 iOS 设备。它提供移动端原生工具，让智能体能够检查 UI 状态、理解截图、点击、滑动、输入、规划多步任务，并通过 CLI 或 Python API 返回结果。&lt;/p&gt;
&lt;p&gt;这个项目的定位很清楚：它不绑定某一家模型，而是做移动设备与智能体之间的执行层。README 中列出的模型来源包括 OpenAI、Anthropic、Gemini、Ollama、DeepSeek、OpenRouter 以及 OpenAI-compatible providers。对开发者来说，这比“只支持一个模型的演示项目”更实用。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;移动端自动化最麻烦的地方，是自然语言任务和真实设备操作之间隔着很多层。模型需要知道当前打开了什么 App、页面有哪些控件、是否需要截图补充视觉信息、下一步该点哪里，以及执行失败后如何继续。&lt;/p&gt;
&lt;p&gt;Mobilerun 把这些能力整理成一套框架：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;通过 CLI 和 TUI 运行一次性自然语言任务、检查设备、回放宏和调试流程。&lt;/li&gt;
&lt;li&gt;通过 Python API 构建自定义移动自动化工作流。&lt;/li&gt;
&lt;li&gt;支持 Android 和 iOS，Android 通过 Portal app 和无障碍能力控制设备，iOS 走单独的 Portal 流程。&lt;/li&gt;
&lt;li&gt;同时使用 accessibility tree 和截图，让模型既能读结构化 UI，也能看视觉画面。&lt;/li&gt;
&lt;li&gt;支持 &lt;code&gt;--vision&lt;/code&gt;、&lt;code&gt;--vision-only&lt;/code&gt; 和 &lt;code&gt;--reasoning&lt;/code&gt; 等模式，应对不同复杂度的任务。&lt;/li&gt;
&lt;li&gt;支持结构化输出、app cards、自定义工具、凭据和执行轨迹追踪。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这让 Mobilerun 更像一个“移动端 agent runtime”，而不是单纯把截图发给大模型再模拟点击。&lt;/p&gt;
&lt;h2 id=&#34;本地框架和云端服务&#34;&gt;本地框架和云端服务
&lt;/h2&gt;&lt;p&gt;Mobilerun 把本地框架和 Mobilerun Cloud 分得比较清楚。本地框架适合开发者在自己的机器和设备上运行 agent，拿到更强的代码级控制；Cloud 则面向托管设备、REST API、SDK 和规模化工作流。&lt;/p&gt;
&lt;p&gt;这个分层很重要。很多移动自动化场景开始时只是“帮我在手机上跑一个任务”，但一旦进入团队使用，就会遇到设备管理、并发、日志、失败重试、权限和 API 调用的问题。Cloud 不是替代本地框架，而是把设备运维和工作流接入往后端服务方向推进。&lt;/p&gt;
&lt;p&gt;README 中还区分了几类云端设备：用户自己的硬件、托管云手机、托管实体手机。这里的差别不只是成本，也涉及应用风控、身份可信度和任务稳定性。对电商、社交、金融或本地生活类 App 来说，真实设备和虚拟设备的表现可能完全不同。&lt;/p&gt;
&lt;h2 id=&#34;为什么-llm-无关很关键&#34;&gt;为什么 LLM 无关很关键
&lt;/h2&gt;&lt;p&gt;移动 GUI agent 还处在快速变化阶段，很难说哪一家模型长期最好。不同任务对模型的要求也不一样：有的更依赖视觉理解，有的更依赖长链路规划，有的更看重工具调用，有的则需要低成本批量执行。&lt;/p&gt;
&lt;p&gt;Mobilerun 选择模型无关的框架路线，价值在于把设备控制、任务执行、日志追踪和模型选择拆开。开发者可以先稳定设备侧流程，再根据任务成本、准确率和延迟切换模型。&lt;/p&gt;
&lt;p&gt;这对实际落地很有帮助。企业不会只因为一个模型演示效果好就重写设备控制层；更合理的方式是保留统一执行框架，把模型当成可替换组件。&lt;/p&gt;
&lt;h2 id=&#34;适合哪些场景&#34;&gt;适合哪些场景
&lt;/h2&gt;&lt;p&gt;Mobilerun 当前适合几类需求：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;移动 App QA 和回归测试。&lt;/li&gt;
&lt;li&gt;从原生 App 中抽取数据并返回结构化结果。&lt;/li&gt;
&lt;li&gt;自动执行重复性的手机任务。&lt;/li&gt;
&lt;li&gt;为非技术用户封装自然语言移动操作流程。&lt;/li&gt;
&lt;li&gt;在多台设备上运行自动化任务。&lt;/li&gt;
&lt;li&gt;把日程、通知或自定义触发器接入移动端工作流。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;不过，它也不是“安装后立刻替你管手机”的消费级助手。Android 侧需要 ADB、开发者选项、USB 调试和 Portal app；iOS 侧也有自己的接入流程。真正跑稳定，还要处理模型配置、设备状态、权限弹窗和任务失败恢复。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;Mobilerun 的价值在于把移动设备控制做成了可编程、可观测、可替换模型的 agent 框架。它承认移动自动化不是一个模型问题，而是模型、设备、执行器、日志、工具和云端基础设施共同组成的系统问题。&lt;/p&gt;
&lt;p&gt;短期看，它适合开发者搭建移动端自动化原型和内部工具；长期看，这类框架可能会成为“手机上的 AI 工作流引擎”。如果 GUI agent 要进入真实业务，像 Mobilerun 这样把本地运行、云端设备、结构化输出和追踪能力放在一起的项目会越来越重要。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/droidrun/mobilerun&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;droidrun/mobilerun&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>AI 能自己点手机、用电脑了吗？Mobile-Agent 项目解读</title>
        <link>https://knightli.com/2026/05/29/mobile-agent-gui-agent-family/</link>
        <pubDate>Fri, 29 May 2026 21:42:41 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/29/mobile-agent-gui-agent-family/</guid>
        <description>&lt;p&gt;X-PLUG 开源的 &lt;a class=&#34;link&#34; href=&#34;https://github.com/X-PLUG/MobileAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Mobile-Agent&lt;/a&gt; 已经不只是一个手机自动化项目。按照仓库当前的定位，它更像是通义实验室围绕 GUI 智能体持续沉淀的一组工作：Mobile-Agent-v1/v2/v3/v3.5、Mobile-Agent-E、PC-Agent、GUI-Critic-R1、UI-S1、GUI-Owl 以及 ToolCUA 等，都被放在同一个项目体系里展示。&lt;/p&gt;
&lt;p&gt;这条线索值得关注。过去谈 GUI agent，常见问题是“模型能不能看懂截图并点对位置”；而 Mobile-Agent 的演进方向更进一步：让智能体在移动端、桌面、浏览器和工具调用之间切换，处理更长链路、更复杂的真实任务。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;GUI 智能体面对的不是标准 API，而是应用界面。它需要看懂屏幕、定位控件、规划步骤、执行点击或输入，并在失败时修正路径。移动端场景尤其复杂，因为任务往往跨多个 App，界面状态也会随着登录、权限、弹窗、网络和个性化推荐变化。&lt;/p&gt;
&lt;p&gt;Mobile-Agent 系列把这个问题拆成了几个方向：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用 Mobile-Agent-v1/v2 探索手机 GUI 的视觉感知与多智能体协作。&lt;/li&gt;
&lt;li&gt;用 PC-Agent 把多智能体操作扩展到 PC 场景。&lt;/li&gt;
&lt;li&gt;用 Mobile-Agent-v3 和 v3.5 推进多平台 GUI 智能体框架。&lt;/li&gt;
&lt;li&gt;用 GUI-Owl 系列模型提供跨平台 GUI 感知、定位和端到端操作能力。&lt;/li&gt;
&lt;li&gt;用 GUI-Critic-R1、UI-S1、ToolCUA 等工作补足错误诊断、强化学习和 GUI/工具路径编排。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这让它不像一个单点 demo，而更像一条围绕“计算机使用智能体”的研究和工程路线。&lt;/p&gt;
&lt;h2 id=&#34;v35-的重点&#34;&gt;v3.5 的重点
&lt;/h2&gt;&lt;p&gt;仓库 README 显示，Mobile-Agent-v3.5 已经可以通过 ModelScope 在线 Demo 和阿里云百炼在线 Demo 体验，百炼上也提供了 v3.5 API。2026 年 3 月，v3.5 还上线了阿里云无影云手机，面向云端 Android 环境提供移动使用体验。&lt;/p&gt;
&lt;p&gt;这说明项目正在把“本地跑实验”之外的使用方式也补上。对于 GUI 智能体来说，云手机和云桌面很重要：它们能提供更稳定、更可复现的运行环境，减少本地设备、系统版本、分辨率和 App 状态带来的差异。&lt;/p&gt;
&lt;p&gt;如果你想评估这类智能体，稳定环境往往比模型本身更容易被低估。没有可控的执行环境，就很难判断一次失败是模型能力不足、界面变化、设备问题，还是任务定义不清。&lt;/p&gt;
&lt;h2 id=&#34;gui-owl-是底层变化&#34;&gt;GUI-Owl 是底层变化
&lt;/h2&gt;&lt;p&gt;Mobile-Agent-v3 之后，GUI-Owl 成了这条路线里的关键模型层。README 中把 GUI-Owl 描述为具备 GUI 感知、grounding 和端到端操作能力的多模态跨平台 GUI VLM。到 GUI-Owl-1.5，模型系列已经覆盖 2B、4B、8B、32B、235B，并支持桌面、移动端和浏览器自动化。&lt;/p&gt;
&lt;p&gt;这类模型的意义在于，它不只是回答“屏幕里有什么”，还要把自然语言目标、截图内容、界面元素位置和下一步操作连起来。对 GUI agent 来说，视觉理解、坐标定位、操作规划和状态记忆缺一不可。&lt;/p&gt;
&lt;p&gt;当然，模型越通用，工程边界也越重要。真实部署时仍然需要执行器、权限控制、任务日志、回滚机制和人工确认。尤其是涉及支付、账号、文件、消息发送等高风险操作时，GUI agent 不能只追求自动完成，还要能清楚说明自己准备做什么。&lt;/p&gt;
&lt;h2 id=&#34;toolcua-暗示的新方向&#34;&gt;ToolCUA 暗示的新方向
&lt;/h2&gt;&lt;p&gt;2026 年 5 月，项目新闻里提到 ToolCUA，定位是面向 GUI 与工具最优路径编排的端到端 Computer Use Agent。这个方向很有意思，因为它承认了一个现实：不是所有任务都应该靠点屏幕完成。&lt;/p&gt;
&lt;p&gt;有些事情适合 GUI 操作，比如登录后台、处理复杂表单、读取没有 API 的应用状态；有些事情更适合调用工具，比如检索、计算、解析文件、访问结构化接口。真正可用的计算机使用智能体，需要学会在两者之间切换。&lt;/p&gt;
&lt;p&gt;这也是 Mobile-Agent 系列比早期手机自动化项目更值得看的地方。它不再只问“智能体能不能像人一样点 App”，而是在问“智能体什么时候该看屏幕，什么时候该用工具，什么时候该停下来确认”。&lt;/p&gt;
&lt;h2 id=&#34;适合谁关注&#34;&gt;适合谁关注
&lt;/h2&gt;&lt;p&gt;如果你只是想找一个开箱即用的手机自动化助手，Mobile-Agent 仍然偏研究和工程框架。它涉及模型、运行环境、评测任务和具体执行器，完整跑通通常需要一定配置成本。&lt;/p&gt;
&lt;p&gt;但如果你关注下面几类问题，它很值得跟踪：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;移动端 GUI agent 如何从演示走向稳定执行。&lt;/li&gt;
&lt;li&gt;桌面、浏览器和手机自动化能否统一到同一套智能体框架里。&lt;/li&gt;
&lt;li&gt;GUI 模型如何处理 grounding、反思、记忆和错误诊断。&lt;/li&gt;
&lt;li&gt;智能体如何在 GUI 操作与工具调用之间选择路径。&lt;/li&gt;
&lt;li&gt;云手机、云桌面是否会成为 GUI agent 的重要运行环境。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些问题会直接影响个人助理、企业流程自动化、远程桌面操作、应用测试和无 API 系统集成。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;Mobile-Agent 的价值不在于某一个版本的指标，而在于它把 GUI 智能体从“手机截图点按”推进到了一个更大的系统问题：模型、执行环境、评测、工具调用、错误诊断和跨平台任务如何协同。&lt;/p&gt;
&lt;p&gt;短期看，它更适合研究者和开发者观察 GUI agent 的技术路线；长期看，这类项目可能会影响个人 AI 助手和企业自动化工具的形态。真正的难点不只是让智能体会操作界面，而是让它在真实应用里稳定、可控、可追踪地完成任务。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/X-PLUG/MobileAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;X-PLUG/MobileAgent&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>MobiAgent 是什么？一个能操作手机 App 的开源 AI 智能体</title>
        <link>https://knightli.com/2026/05/29/mobiagent-mobile-gui-agent-framework/</link>
        <pubDate>Fri, 29 May 2026 21:36:58 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/29/mobiagent-mobile-gui-agent-framework/</guid>
        <description>&lt;p&gt;IPADS-SAI 开源了 &lt;a class=&#34;link&#34; href=&#34;https://github.com/IPADS-SAI/MobiAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;MobiAgent&lt;/a&gt;，定位是一个面向手机 GUI 的可定制智能体框架。它不是单一模型仓库，而是把模型、执行器、加速机制、评测基准和移动端应用放在同一个体系里，目标是让智能体能在真实手机环境中完成跨应用、多步骤任务。&lt;/p&gt;
&lt;p&gt;从项目结构看，MobiAgent 主要由三部分组成：MobiMind 系列智能体模型、AgentRR 记录与回放加速框架，以及 MobiFlow 评测基准。论文摘要中也强调，现有移动智能体在真实任务里的准确率和效率仍然是主要瓶颈，MobiAgent 的设计就是围绕这两个问题展开。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;手机 GUI 智能体比网页或桌面自动化更麻烦。它需要理解截图、识别控件、决定下一步操作，还要通过 ADB 或移动端运行环境执行点击、输入、返回、切换应用等动作。真实任务往往不是单 App 内的一次操作，而是跨越搜索、购物、社交、支付、地图等多个应用的连续流程。&lt;/p&gt;
&lt;p&gt;MobiAgent 的价值在于把这些环节系统化：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用 MobiMind 承担任务规划、决策和界面定位等能力。&lt;/li&gt;
&lt;li&gt;用 runner 连接手机，通过 ADB 执行预定义任务并记录轨迹。&lt;/li&gt;
&lt;li&gt;用 AgentRR 复用成功动作序列，减少重复任务的推理与操作成本。&lt;/li&gt;
&lt;li&gt;用 MobiFlow 评测真实移动场景中的任务完成情况。&lt;/li&gt;
&lt;li&gt;通过数据采集、标注和处理工具，降低移动 GUI 任务数据构建成本。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这让它更像一个移动智能体实验平台，而不是只能跑演示的模型项目。&lt;/p&gt;
&lt;h2 id=&#34;最近更新值得关注&#34;&gt;最近更新值得关注
&lt;/h2&gt;&lt;p&gt;项目 README 显示，MobiAgent 在 2025 年 8 月开源，之后持续补齐模型、Runner、记忆系统和端侧运行能力。2025 年 12 月开始，项目支持在手机上进行纯端侧推理，并发布了统一 GUI agent runner，可配置 MobiAgent、UI-TARS、AutoGLM、Qwen-VL、Gemini 等多种模型。&lt;/p&gt;
&lt;p&gt;到 2026 年 3 月，项目又发布了 GUI-based mobile &amp;ldquo;claw&amp;rdquo; MobiClaw，以及新的 MobiMind-1.5-4B 模型。这说明它的方向不只是论文复现，而是在继续把移动端执行、模型能力和操作工具链往产品化方向推进。&lt;/p&gt;
&lt;h2 id=&#34;记忆系统是关键补丁&#34;&gt;记忆系统是关键补丁
&lt;/h2&gt;&lt;p&gt;MobiAgent 支持用户画像记忆、经验记忆和动作记忆。用户画像记忆用于给规划提供偏好上下文；经验记忆用于检索类似任务的执行经验；动作记忆则通过 AgentRR 缓存和复用成功动作序列。&lt;/p&gt;
&lt;p&gt;这很重要，因为手机任务天然带有重复性。比如用户常用某个 App 搜索商品、打开固定联系人、在特定页面填写信息。如果每次都从零开始看图、规划和点击，成本高且容易出错。记忆模块可以把一部分“已经学会的流程”沉淀下来，让后续任务更快、更稳定。&lt;/p&gt;
&lt;p&gt;不过，记忆也会带来新的治理问题。用户偏好、历史任务、应用路径和操作轨迹都可能包含敏感信息。真正落地时，项目需要明确哪些内容进入记忆、保存多久、如何删除，以及是否允许模型在不同任务之间复用这些上下文。&lt;/p&gt;
&lt;h2 id=&#34;适合谁关注&#34;&gt;适合谁关注
&lt;/h2&gt;&lt;p&gt;如果你只想找一个现成的手机自动化 App，MobiAgent 目前仍更偏研究和工程框架。它需要配置模型服务、移动设备、ADB、依赖环境和任务文件，完整跑起来有一定门槛。&lt;/p&gt;
&lt;p&gt;但如果你关注移动 GUI agent、端侧智能体、多模型 runner、任务轨迹复用或智能体评测，MobiAgent 很值得跟踪。它把模型、执行、评测和数据流水线放在一起，能帮助研究者和开发者更完整地观察移动智能体的真实短板。&lt;/p&gt;
&lt;h2 id=&#34;我的判断&#34;&gt;我的判断
&lt;/h2&gt;&lt;p&gt;MobiAgent 的意义不在于又发布了一个 GUI agent，而在于它把手机智能体从“看截图点按钮”的单点能力，推进到一个可训练、可执行、可评测、可加速的系统框架。&lt;/p&gt;
&lt;p&gt;移动端是智能体很难绕开的场景。大量个人任务发生在 App 里，而不是标准化网页或 API 中。谁能稳定理解手机界面、跨应用执行任务、复用经验并控制隐私风险，谁就更接近真正可用的个人智能体。&lt;/p&gt;
&lt;p&gt;MobiAgent 还没有把这些问题全部解决，但它提供了一个比较完整的开源起点。短期看，它适合用于移动智能体研究和实验；长期看，这类框架可能会成为手机操作系统、个人助理和自动化工具之间的重要连接层。&lt;/p&gt;
&lt;p&gt;项目链接：&lt;a class=&#34;link&#34; href=&#34;https://github.com/IPADS-SAI/MobiAgent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;IPADS-SAI/MobiAgent&lt;/a&gt;&lt;br&gt;
论文链接：&lt;a class=&#34;link&#34; href=&#34;https://arxiv.org/abs/2509.00531&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;MobiAgent: A Systematic Framework for Customizable Mobile Agents&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>GitHub AI 开源项目分类整理：从 Coding Agent 到 RAG 知识库</title>
        <link>https://knightli.com/2026/05/21/github-ai-projects-site-statistics/</link>
        <pubDate>Thu, 21 May 2026 08:53:13 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/21/github-ai-projects-site-statistics/</guid>
        <description>&lt;p&gt;这里按应用方向列出 GitHub AI 项目，覆盖 AI 编程与 Coding Agent、Agent 技能与工作流、RAG 与知识库、多模态创作、本地模型与推理、垂直应用与自动化、AI 应用开发基础设施等方向。后续新增项目时，也可以继续按这个结构补充。&lt;/p&gt;
&lt;h2 id=&#34;分类合计&#34;&gt;分类合计
&lt;/h2&gt;&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;分类&lt;/th&gt;
          &lt;th style=&#34;text-align: right&#34;&gt;项目数&lt;/th&gt;
          &lt;th&gt;适合先看的人&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;AI编程与 Coding Agent&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;22&lt;/td&gt;
          &lt;td&gt;经常使用 Claude Code、Codex、Cursor、终端 Agent 或代码库自动化的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Agent 技能与工作流&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;7&lt;/td&gt;
          &lt;td&gt;想把 AI 编程、科研、创作流程标准化的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;RAG、知识库与记忆&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;7&lt;/td&gt;
          &lt;td&gt;需要文档检索、知识库、长期记忆、网页抓取和结构化抽取的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;垂直应用与自动化&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;7&lt;/td&gt;
          &lt;td&gt;想看金融、交易、闲鱼监控、桌面操作、浏览器自动化等落地场景的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;多模态与内容创作&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;5&lt;/td&gt;
          &lt;td&gt;做图片、视频、语音转写、提示词库和内容分发的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;AI 应用开发基础设施&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;5&lt;/td&gt;
          &lt;td&gt;构建 AI 应用、浏览器自动化、Prompt/MCP 工具链的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;本地模型与推理&lt;/td&gt;
          &lt;td style=&#34;text-align: right&#34;&gt;1&lt;/td&gt;
          &lt;td&gt;关心本地 DeepSeek、推理引擎和硬件适配的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这个分布可以看出当前 AI 开源项目的几个高频方向：AI 编程工具明显最多，其次是 Agent 工作流、RAG 知识库和具体应用场景。纯模型推理项目数量不多，因为很多本地部署内容并不是单独介绍某个 GitHub 项目，而是围绕模型、显卡或部署方案展开。&lt;/p&gt;
&lt;h2 id=&#34;ai编程与-coding-agent&#34;&gt;AI编程与 Coding Agent
&lt;/h2&gt;&lt;p&gt;这一类聚焦代码理解、代码修改、工程流程和终端 Agent，是数量最多的一组。共 &lt;strong&gt;22&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;Ralph&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/27/ralph-autonomous-agent-loop-claude-code-amp/&#34; &gt;Ralph 是什么：把 Claude Code 和 Amp 变成可循环执行的自主开发流程&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/snarktank/ralph&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;snarktank/ralph&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;让 Claude Code / Amp 按 PRD、计划、执行、评审循环推进任务&lt;/td&gt;
          &lt;td&gt;想把 Agent 编程流程拉直的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude-Mem&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/claude-mem-persistent-memory-for-claude-code/&#34; &gt;Claude-Mem：给 Claude Code 加上跨会话长期记忆&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/thedotmack/claude-mem&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;thedotmack/claude-mem&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;为 Claude Code 增加跨会话记忆&lt;/td&gt;
          &lt;td&gt;高频使用 Claude Code 的开发者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Code Hooks Mastery&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/claude-code-hooks-mastery-guide/&#34; &gt;Claude Code Hooks Mastery：13 个 Hooks 生命周期与自动化控制入门&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/disler/claude-code-hooks-mastery&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;disler/claude-code-hooks-mastery&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;学习 Claude Code Hooks 生命周期和自动化控制&lt;/td&gt;
          &lt;td&gt;想定制 Claude Code 流程的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Compound Engineering Plugin&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/compound-engineering-plugin-ai-coding-workflow/&#34; &gt;Compound Engineering Plugin：把 AI 编程变成计划、执行、评审的工程循环&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/EveryInc/compound-engineering-plugin&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;EveryInc/compound-engineering-plugin&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把 AI 编程拆成计划、执行、评审循环&lt;/td&gt;
          &lt;td&gt;关注工程化 AI 编程的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;free-claude-code&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/free-claude-code-anthropic-compatible-proxy/&#34; &gt;free-claude-code：用代理把 Claude Code 接到 OpenRouter、DeepSeek 和本地模型&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/Alishahryar1/free-claude-code&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Alishahryar1/free-claude-code&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;通过代理把 Claude Code 接到不同模型后端&lt;/td&gt;
          &lt;td&gt;想降低 Claude Code 使用成本的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Hermes Agent&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/12/hermes-agent-intro-guide-vs-openclaw/&#34; &gt;Hermes Agent 是什么：简介、优点、快速上手与 OpenClaw 对比&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/NousResearch/hermes-agent&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NousResearch/hermes-agent&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;本地 Agent 框架，支持工具调用和任务执行&lt;/td&gt;
          &lt;td&gt;想跑本地 Agent 的用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;OpenHarness&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/12/openharness-basic-functions/&#34; &gt;OpenHarness 是什么：这个开源 Agent Harness 能做什么&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/OpenHarness&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;HKUDS/OpenHarness&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Agent Harness 与多 Agent 执行框架&lt;/td&gt;
          &lt;td&gt;研究 Agent 编排的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CodexBridge&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/13/codexbridge-openai-compatible-api/&#34; &gt;Codex 怎么接入国产大模型？OpenAI 兼容接口与 CodexBridge 使用思路&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/begonia599/CodexBridge&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;begonia599/CodexBridge&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;帮 Codex 接入 OpenAI 兼容模型接口&lt;/td&gt;
          &lt;td&gt;想把 Codex 接到国产模型的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;ccx&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/13/ccx-ai-api-proxy-gateway/&#34; &gt;Codex 怎么接入国产大模型？用 CCX 统一管理 OpenAI 兼容 API&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/BenedictKing/ccx&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;BenedictKing/ccx&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;统一管理 Claude、Codex、Gemini 等 API 代理&lt;/td&gt;
          &lt;td&gt;多模型切换用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;cc-haha&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/14/cc-haha-claude-code-desktop-workbench/&#34; &gt;cc-haha 是什么？一个把 Claude Code 做成桌面工作台的项目&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/NanmiCoder/cc-haha&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;NanmiCoder/cc-haha&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Claude Code 桌面工作台与 Computer Use 入口&lt;/td&gt;
          &lt;td&gt;喜欢图形界面的 Claude Code 用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;DeepSeek-TUI&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/16/deepseek-tui-terminal-coding-agent/&#34; &gt;DeepSeek-TUI：把 DeepSeek V4 变成终端里的编程智能体&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/Hmbown/DeepSeek-TUI&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Hmbown/DeepSeek-TUI&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;在终端里运行 DeepSeek 编程 Agent&lt;/td&gt;
          &lt;td&gt;DeepSeek 与命令行用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Open Design&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/18/open-design-open-source-claude-design-alternative/&#34; &gt;Open Design 项目解析：把 Claude Code、Codex 变成 AI 设计工具&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/nexu-io/open-design&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;nexu-io/open-design&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;让 Claude Code / Codex 参与设计生成&lt;/td&gt;
          &lt;td&gt;想用 Agent 做设计原型的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;agentmemory&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/19/agentmemory-persistent-memory-ai-coding-agents/&#34; &gt;agentmemory 项目解析：给 Claude Code、Codex 和 Cursor 加持久记忆&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/rohitg00/agentmemory&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;rohitg00/agentmemory&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;给 Coding Agent 增加持久记忆层&lt;/td&gt;
          &lt;td&gt;长期维护项目的开发者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Graphify&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/21/safishamsi-graphify-ai-code-knowledge-graph/&#34; &gt;Graphify 解决 Claude Code 最大局限：把代码库变成 AI 可查询知识图谱&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/safishamsi/graphify&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;safishamsi/graphify&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把代码库转成知识图谱，降低 Agent 重复读文件成本&lt;/td&gt;
          &lt;td&gt;大型代码库用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;oh-my-pi&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/23/oh-my-pi-ai-coding-agent-terminal-ide-lsp-debugger/&#34; &gt;oh-my-pi 是什么？一个把终端、IDE 和调试器打通的 AI 编程助手&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/can1357/oh-my-pi&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;can1357/oh-my-pi&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把终端、IDE、LSP 和调试器连接起来，作为本地 AI 编程控制台&lt;/td&gt;
          &lt;td&gt;想把命令行和 IDE 工作流打通的开发者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Claude Plugins Official&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/23/claude-plugins-official-claude-code-plugin-directory/&#34; &gt;Claude Code 也有插件市场了：能装什么、怎么装、要注意什么&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/anthropics/claude-plugins-official&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;anthropics/claude-plugins-official&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Claude Code 官方插件目录和安装入口&lt;/td&gt;
          &lt;td&gt;想给 Claude Code 扩展能力的用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CodeGraph&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/23/codegraph-local-code-knowledge-graph-ai-coding-agent/&#34; &gt;CodeGraph 是什么？给 Claude Code、Codex 和 Cursor 加一个本地代码地图&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/colbymchenry/codegraph&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;colbymchenry/codegraph&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;为代码库生成本地索引和关系图，帮助 Coding Agent 理解项目&lt;/td&gt;
          &lt;td&gt;维护中大型代码库的开发者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CC Switch&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/06/cc-switch-ai-cli-manager/&#34; &gt;CC Switch：一个桌面工具统一管理 Claude Code、Codex、Gemini CLI 和 OpenClaw&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/farion1231/cc-switch&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;farion1231/cc-switch&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;管理多个 AI CLI 工具和账号/配置切换&lt;/td&gt;
          &lt;td&gt;同时使用多套 CLI 的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Warp&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/07/warpdotdev-warp-open-source-agentic-terminal/&#34; &gt;Warp 开源：从终端到 Agentic Development Environment&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/warpdotdev/warp&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;warpdotdev/warp&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Agentic 终端与开发环境&lt;/td&gt;
          &lt;td&gt;终端重度用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;opencode&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/08/opencode-open-source-ai-coding-agent/&#34; &gt;opencode、Claude Code、Codex 有什么区别？开源 AI 编程工具使用指南&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/anomalyco/opencode&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;anomalyco/opencode&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;开源 AI 编程 Agent&lt;/td&gt;
          &lt;td&gt;想找 Claude Code / Codex 替代品的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;9Router&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/08/9router-ai-coding-router-token-saver/&#34; &gt;9Router：把 Claude Code、Codex、Cursor 接到同一个 AI 路由器&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/decolua/9router&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;decolua/9router&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;AI 编程模型路由与 token 成本控制&lt;/td&gt;
          &lt;td&gt;多工具、多模型用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;goose&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/08/goose-open-source-ai-agent-desktop-cli-api/&#34; &gt;goose：桌面端、CLI 和 API 一体的开源 AI Agent&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/aaif-goose/goose&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;aaif-goose/goose&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;桌面、CLI、API 一体的开源 Agent&lt;/td&gt;
          &lt;td&gt;想要通用 Agent 工作台的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;agent-技能与工作流&#34;&gt;Agent 技能与工作流
&lt;/h2&gt;&lt;p&gt;这一类更关注把 AI 能力固化成可重复的技能、流程和规格。共 &lt;strong&gt;7&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;mattpocock/skills&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/15/matt-pocock-skills-ai-engineering-workflow/&#34; &gt;拒绝 Vibe Coding：Matt Pocock 的 skills 仓库给 AI 编程补上工程约束&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/mattpocock/skills&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;mattpocock/skills&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;用 Skills 约束 AI 编程流程&lt;/td&gt;
          &lt;td&gt;想给 Agent 加工程规范的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Superpowers&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/15/obra-superpowers-agentic-skills-framework/&#34; &gt;Superpowers：把 Coding Agent 拉回工程流程的技能框架&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/obra/superpowers&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;obra/superpowers&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Agentic skills framework 与软件开发方法论&lt;/td&gt;
          &lt;td&gt;想系统化使用 Coding Agent 的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Prompt-Vault&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/15/prompt-vault-coding-prompt-benchmark/&#34; &gt;Prompt-Vault：一个适合测试 AI 编程能力的 Prompt 规格库&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/w512/Prompt-Vault&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;w512/Prompt-Vault&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;收集可测试 AI 编程能力的 prompt 规格&lt;/td&gt;
          &lt;td&gt;做模型/工具评测的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;web-video-presentation&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/15/web-video-presentation-agent-skill/&#34; &gt;web-video-presentation：把文章做成可录屏网页视频的 Agent Skill&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/ConardLi/garden-skills&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;ConardLi/garden-skills&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把文章转成可录屏网页视频的 Skill&lt;/td&gt;
          &lt;td&gt;内容创作者和自动化制作用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;nuwa-skill&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/22/nuwa-skill-distill-how-someone-thinks/&#34; &gt;nuwa-skill：把“蒸馏一个人”从灵感变成可执行流程&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/alchaincyf/nuwa-skill&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;alchaincyf/nuwa-skill&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;用 Skill 复刻人物表达和思维流程&lt;/td&gt;
          &lt;td&gt;做风格化 Agent 的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Scientific Agent Skills&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/17/scientific-agent-skills/&#34; &gt;Scientific Agent Skills：把科研工作流交给 AI Agent 的技能库&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/K-Dense-AI/scientific-agent-skills&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;K-Dense-AI/scientific-agent-skills&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;科研工作流 Skill 集合&lt;/td&gt;
          &lt;td&gt;科研、数据分析和技术写作用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;easy-vibe&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/16/easy-vibe-vibe-coding-learning-map/&#34; &gt;easy-vibe：给 Vibe Coding 初学者的一张学习地图&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/datawhalechina/easy-vibe&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;datawhalechina/easy-vibe&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;Vibe Coding 入门学习地图&lt;/td&gt;
          &lt;td&gt;AI 编程新手&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;rag知识库与记忆&#34;&gt;RAG、知识库与记忆
&lt;/h2&gt;&lt;p&gt;这一类主要解决文档检索、知识库构建、长期记忆和结构化抽取问题。共 &lt;strong&gt;7&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;LangExtract&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/google-langextract-llm-structured-data-extraction/&#34; &gt;Google LangExtract：用 LLM 从长文本里抽取结构化数据&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/google/langextract&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;google/langextract&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;从长文本中抽取结构化信息&lt;/td&gt;
          &lt;td&gt;做信息抽取和数据处理的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;qmd&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/qmd-markdown-search-for-ai-agents/&#34; &gt;qmd：给 AI Agent 使用的本地 Markdown 文档搜索工具&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/tobi/qmd&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;tobi/qmd&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;本地 Markdown 文档搜索&lt;/td&gt;
          &lt;td&gt;用 Markdown 管理知识库的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Firecrawl&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/15/firecrawl-ai-web-data-api/&#34; &gt;Firecrawl 项目整理：给 AI Agent 用的网页搜索、抓取与交互 API&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/firecrawl/firecrawl&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;firecrawl/firecrawl&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;网页抓取、搜索和结构化数据入口&lt;/td&gt;
          &lt;td&gt;做 RAG 和 Agent 数据入口的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;RAGFlow&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/15/ragflow-rag-engine-guide/&#34; &gt;RAGFlow 项目整理：开源 RAG 引擎的功能与使用方法&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/infiniflow/ragflow&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;infiniflow/ragflow&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;开源 RAG 引擎&lt;/td&gt;
          &lt;td&gt;企业知识库和文档问答用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;OpenHuman&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/15/openhuman-open-source-personal-ai-agent/&#34; &gt;OpenHuman 速读：开源个人 AI Agent 的桌面化路线&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/tinyhumansai/openhuman&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;tinyhumansai/openhuman&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;本地优先的个人 AI Agent 与记忆层&lt;/td&gt;
          &lt;td&gt;想整合个人数据的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;OpenKB&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/17/openkb-llm-knowledge-base/&#34; &gt;OpenKB：把文档编译成可持续更新的 LLM 知识库&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/VectifyAI/OpenKB&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;VectifyAI/OpenKB&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把文档编译成可更新知识库&lt;/td&gt;
          &lt;td&gt;文档知识库维护者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;PageIndex&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/20/vectifyai-pageindex-vectorless-rag/&#34; &gt;PageIndex 是什么？不用向量库的推理式 RAG 文档索引解析&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/VectifyAI/PageIndex&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;VectifyAI/PageIndex&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;不依赖向量库的推理式文档索引&lt;/td&gt;
          &lt;td&gt;关注 RAG 新路线的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;多模态与内容创作&#34;&gt;多模态与内容创作
&lt;/h2&gt;&lt;p&gt;这一类面向图片、视频、语音转写和内容分发等创作场景。共 &lt;strong&gt;5&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;rembg&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/19/rembg-background-removal-notes/&#34; &gt;rembg 项目整理：本地图片背景移除工具&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/danielgatis/rembg&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;danielgatis/rembg&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;本地图片背景移除&lt;/td&gt;
          &lt;td&gt;电商、美工和图片处理用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;awesome-gpt-image-2-prompts&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/02/awesome-gpt-image-2-prompts-case-index/&#34; &gt;GPT-Image 2 提示词宝库：电商、海报、人像、UI 全收录&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/EvoLinkAI/awesome-gpt-image-2-prompts&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;EvoLinkAI/awesome-gpt-image-2-prompts&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;GPT-Image 2 提示词和案例库&lt;/td&gt;
          &lt;td&gt;AI 绘图和提示词用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;faster-whisper&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/faster-whisper-speech-to-text/&#34; &gt;faster-whisper：更快的 Whisper 转写引擎&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/SYSTRAN/faster-whisper&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;SYSTRAN/faster-whisper&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;高性能语音转文字&lt;/td&gt;
          &lt;td&gt;做字幕、转写和语音处理的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Pixelle-Video&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/07/pixelle-video-ai-short-video-engine/&#34; &gt;Pixelle-Video：一句主题生成短视频的开源 AI 引擎&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/AIDC-AI/Pixelle-Video&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;AIDC-AI/Pixelle-Video&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;一句话生成短视频工作流&lt;/td&gt;
          &lt;td&gt;短视频和 AIGC 内容创作者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;AiToEarn&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/19/aitoearn-ai-content-marketing-agent/&#34; &gt;内容发太多平台太累？AiToEarn 想用 AI Agent 帮创作者省点事&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/yikart/AiToEarn&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;yikart/AiToEarn&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;多平台内容分发与创作者自动化&lt;/td&gt;
          &lt;td&gt;内容运营和创作者&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;本地模型与推理&#34;&gt;本地模型与推理
&lt;/h2&gt;&lt;p&gt;这一类关注本地模型运行和推理实验，当前数量较少。共 &lt;strong&gt;1&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;ds4&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/11/deepseek-v4-flash-ds4-metal/&#34; &gt;本地运行 DeepSeek 4：Antirez ds4 在 Apple Silicon Mac 上的尝试&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/antirez/ds4&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;antirez/ds4&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;在 Apple Silicon 上尝试运行 DeepSeek 4&lt;/td&gt;
          &lt;td&gt;本地模型和推理实验用户&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;垂直应用与自动化&#34;&gt;垂直应用与自动化
&lt;/h2&gt;&lt;p&gt;这一类是把 Agent 或 AI 能力落到金融、交易、浏览器、桌面和电商监控等具体场景。共 &lt;strong&gt;7&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;TradingAgents-CN&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/tradingagents-cn-multi-agent-financial-research-framework/&#34; &gt;TradingAgents-CN：面向中文用户的多智能体金融交易研究框架&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/hsliuping/TradingAgents-CN&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;hsliuping/TradingAgents-CN&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;多智能体金融交易研究框架&lt;/td&gt;
          &lt;td&gt;量化、金融和 Agent 研究者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;FinceptTerminal&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/finceptterminal-open-source-financial-terminal/&#34; &gt;FinceptTerminal：开源金融终端、量化研究和 AI Agent 工作台&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/Fincept-Corporation/FinceptTerminal&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Fincept-Corporation/FinceptTerminal&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;金融终端、量化研究和 AI Agent 工作台&lt;/td&gt;
          &lt;td&gt;金融分析和量化用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Anthropic financial-services&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/16/anthropic-financial-services-agent-templates/&#34; &gt;Anthropic financial-services：把金融 Agent 场景做成可复用模板&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/anthropics/financial-services&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;anthropics/financial-services&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;金融服务 Agent 模板&lt;/td&gt;
          &lt;td&gt;做金融 AI 方案的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;ai-goofish-monitor&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/17/ai-goofish-monitor/&#34; &gt;ai-goofish-monitor：用 AI 自动盯闲鱼商品的开源监控系统&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/Usagi-org/ai-goofish-monitor&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Usagi-org/ai-goofish-monitor&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;AI 商品监控和闲鱼自动化&lt;/td&gt;
          &lt;td&gt;二手交易监控用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CloakBrowser&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/19/cloakbrowser-stealth-chromium-browser-automation/&#34; &gt;CloakBrowser 是什么？给 Playwright 和 Puppeteer 换一个更像真实用户的浏览器&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/CloakHQ/CloakBrowser&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;CloakHQ/CloakBrowser&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;更像真实用户的浏览器自动化环境&lt;/td&gt;
          &lt;td&gt;浏览器自动化和 Agent 操作场景&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;UI-TARS-desktop&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/19/ui-tars-desktop-multimodal-ai-agent-stack/&#34; &gt;让 AI 自己操作电脑？UI-TARS-desktop 把桌面、浏览器和工具都接了起来&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/bytedance/UI-TARS-desktop&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;bytedance/UI-TARS-desktop&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;桌面、浏览器和工具操作 Agent&lt;/td&gt;
          &lt;td&gt;想让 AI 操作电脑的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;AI-Trader&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/19/ai-trader-agent-native-trading-platform/&#34; &gt;AI-Trader 是什么？一个让 AI Agent 发布交易信号、做模拟交易的平台&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/AI-Trader&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;HKUDS/AI-Trader&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;AI Agent 交易信号和模拟交易平台&lt;/td&gt;
          &lt;td&gt;金融 Agent 与交易研究用户&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;h2 id=&#34;ai-应用开发基础设施&#34;&gt;AI 应用开发基础设施
&lt;/h2&gt;&lt;p&gt;这一类提供构建 AI 应用和 Agent 工具链所需的基础组件。共 &lt;strong&gt;5&lt;/strong&gt; 个项目。&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;项目&lt;/th&gt;
          &lt;th&gt;文章&lt;/th&gt;
          &lt;th&gt;GitHub&lt;/th&gt;
          &lt;th&gt;核心用途&lt;/th&gt;
          &lt;th&gt;适合人群&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;Prompt Optimizer&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/01/prompt-optimizer-prompt-engineering-tool/&#34; &gt;Prompt Optimizer：开源提示词优化、测试与 MCP 工具&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/linshenkx/prompt-optimizer&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;linshenkx/prompt-optimizer&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;提示词优化、测试和 MCP 工具&lt;/td&gt;
          &lt;td&gt;做 prompt 工程和应用调参的人&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Playwright CLI&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/04/12/playwright-cli-getting-started/&#34; &gt;Playwright CLI 使用入门：安装、Skills、会话管理与常用命令&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/microsoft/playwright-cli&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;microsoft/playwright-cli&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;面向 coding agent 的浏览器自动化 CLI&lt;/td&gt;
          &lt;td&gt;需要浏览器操作能力的 Agent 用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Vercel AI SDK&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/17/vercel-ai-sdk-typescript-agent-toolkit/&#34; &gt;Vercel AI SDK 是什么？TypeScript 开发者构建 AI 应用的统一工具包&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/vercel/ai&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;vercel/ai&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;TypeScript AI 应用开发 SDK&lt;/td&gt;
          &lt;td&gt;前端和全栈开发者&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CLIProxyAPI&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/24/cliproxyapi-cli-to-api-gateway/&#34; &gt;CLIProxyAPI：把 Codex、Claude Code、Gemini CLI 统一封装成 API&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/router-for-me/CLIProxyAPI&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;router-for-me/CLIProxyAPI&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;把多个 AI CLI 和 OAuth 登录态封装成兼容 API&lt;/td&gt;
          &lt;td&gt;想统一接入 Codex、Claude Code、Gemini CLI 的用户&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CLIProxyAPI Management Center&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://knightli.com/2026/05/24/cliproxyapi-management-center/&#34; &gt;CLIProxyAPI Management Center：给 CLIProxyAPI 配一个可视化管理后台&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/router-for-me/Cli-Proxy-API-Management-Center&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;router-for-me/Cli-Proxy-API-Management-Center&lt;/a&gt;&lt;/td&gt;
          &lt;td&gt;CLIProxyAPI 的 Web 管理界面，管理配置、账号、日志和 OAuth&lt;/td&gt;
          &lt;td&gt;把 CLIProxyAPI 当团队网关或账号池使用的人&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
</description>
        </item>
        <item>
        <title>PageIndex 是什么？不用向量库的推理式 RAG 文档索引解析</title>
        <link>https://knightli.com/2026/05/20/vectifyai-pageindex-vectorless-rag/</link>
        <pubDate>Wed, 20 May 2026 23:51:37 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/20/vectifyai-pageindex-vectorless-rag/</guid>
        <description>&lt;p&gt;&lt;code&gt;VectifyAI/PageIndex&lt;/code&gt; 是一个很有意思的 RAG 项目。它不从“再建一个向量库”开始，而是把长文档先整理成类似目录的树状结构，再让 LLM 沿着这棵树做推理式检索。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/VectifyAI/PageIndex&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;VectifyAI/PageIndex&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;截至本文整理时，GitHub 页面显示项目约有 31.8k stars、2.7k forks，许可证为 MIT。README 给它的定位是：&lt;code&gt;Vectorless, Reasoning-based RAG&lt;/code&gt;，也就是无向量库、基于推理的 RAG。&lt;/p&gt;
&lt;h2 id=&#34;它想解决什么问题&#34;&gt;它想解决什么问题
&lt;/h2&gt;&lt;p&gt;传统 RAG 的常见路径是：切块、向量化、写入向量数据库，再用相似度搜索召回片段。这套方法简单、通用，也很成熟，但在长篇专业文档里容易遇到几个问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;相似度不等于真正相关。&lt;/li&gt;
&lt;li&gt;文档结构被切块打散，章节关系丢失。&lt;/li&gt;
&lt;li&gt;召回结果可解释性弱，很难说明为什么命中这一段。&lt;/li&gt;
&lt;li&gt;对财报、监管文件、法律文书、技术手册这类材料，问题往往需要跨章节推理。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;PageIndex 的思路是反过来：先把文档组织成语义树，再让模型像人类读目录、翻章节、逐层定位一样查找相关内容。&lt;/p&gt;
&lt;h2 id=&#34;pageindex-的基本工作流&#34;&gt;PageIndex 的基本工作流
&lt;/h2&gt;&lt;p&gt;README 里把 PageIndex 的检索分成两步：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;为文档生成类似 &lt;code&gt;Table-of-Contents&lt;/code&gt; 的树状结构索引。&lt;/li&gt;
&lt;li&gt;通过树搜索做 reasoning-based retrieval。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这棵树不是简单的文件目录，而是面向 LLM 使用的文档结构。节点里会有标题、页码范围、摘要、子节点等信息。这样模型在回答问题时，不必一开始就面对大量零散 chunk，而是可以先判断应该进入哪个章节，再继续向下搜索。&lt;/p&gt;
&lt;p&gt;这种方式更适合结构清晰但内容很长的文档，例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;金融报告和 SEC filings。&lt;/li&gt;
&lt;li&gt;监管材料和合规文档。&lt;/li&gt;
&lt;li&gt;学术教材和论文。&lt;/li&gt;
&lt;li&gt;法律文件。&lt;/li&gt;
&lt;li&gt;技术手册和产品文档。&lt;/li&gt;
&lt;li&gt;超过模型上下文窗口的大型 PDF。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;和传统向量-rag-的差异&#34;&gt;和传统向量 RAG 的差异
&lt;/h2&gt;&lt;p&gt;PageIndex 的核心卖点可以概括成五点。&lt;/p&gt;
&lt;p&gt;第一，不需要 Vector DB。它依赖文档结构和 LLM 推理来定位内容，而不是只做向量相似度搜索。&lt;/p&gt;
&lt;p&gt;第二，不做传统 chunking。文档会按自然章节组织，而不是被切成固定长度片段。&lt;/p&gt;
&lt;p&gt;第三，可解释性更强。检索路径可以对应到页码、章节和树节点，比“向量相似度命中某段文本”更容易追踪。&lt;/p&gt;
&lt;p&gt;第四，检索是上下文感知的。问题、对话历史、领域背景都可以影响树搜索路径。&lt;/p&gt;
&lt;p&gt;第五，更接近人类专家读文档的方式。人通常不是把整本文档切成小块再算相似度，而是先看目录，再定位章节，最后读细节。&lt;/p&gt;
&lt;p&gt;这并不意味着向量库没有价值。更准确的说法是：PageIndex 适合那些“语义相似不够，需要结构和推理参与”的长文档场景。&lt;/p&gt;
&lt;h2 id=&#34;本地怎么跑&#34;&gt;本地怎么跑
&lt;/h2&gt;&lt;p&gt;README 提供了本地自托管方式。先安装依赖：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pip3 install --upgrade -r requirements.txt
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;然后在项目根目录创建 &lt;code&gt;.env&lt;/code&gt;，写入 LLM API key。项目通过 &lt;code&gt;LiteLLM&lt;/code&gt; 支持多模型：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nv&#34;&gt;OPENAI_API_KEY&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;=&lt;/span&gt;your_openai_key_here
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;对 PDF 生成 PageIndex 结构：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;python3 run_pageindex.py --pdf_path /path/to/your/document.pdf
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;也可以处理 Markdown：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;python3 run_pageindex.py --md_path /path/to/your/document.md
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;常见可选参数包括：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--model
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--toc-check-pages
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--max-pages-per-node
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--max-tokens-per-node
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--if-add-node-id
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--if-add-node-summary
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;--if-add-doc-description
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;README 里也提醒，本地开源版本使用标准 PDF 解析。如果是复杂 PDF，项目方的云服务会提供增强 OCR、树构建和检索流程。&lt;/p&gt;
&lt;h2 id=&#34;agentic-vectorless-rag-示例&#34;&gt;Agentic Vectorless RAG 示例
&lt;/h2&gt;&lt;p&gt;项目还提供了一个 agentic vectorless RAG 示例，使用自托管 PageIndex 和 OpenAI Agents SDK。安装可选依赖后运行：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pip3 install openai-agents
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;python3 examples/agentic_vectorless_rag_demo.py
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这个示例的价值在于，它把 PageIndex 从“生成文档树”推进到“让 Agent 使用文档树检索”。如果你正在做企业知识库、财报问答、法规问答或技术文档 Agent，这个示例比单纯看 README 更值得跑一遍。&lt;/p&gt;
&lt;h2 id=&#34;云服务mcp-和-api&#34;&gt;云服务、MCP 和 API
&lt;/h2&gt;&lt;p&gt;PageIndex 不只是一个 GitHub repo。项目页面还给了几类入口：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;自托管：用开源代码本地运行，适合试验和可控部署。&lt;/li&gt;
&lt;li&gt;Chat Platform：类似 ChatGPT 的文档分析平台。&lt;/li&gt;
&lt;li&gt;MCP / API：方便接入现有 Agent 或自动化流程。&lt;/li&gt;
&lt;li&gt;Enterprise：面向私有化或本地部署。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这说明它的定位不是单纯的 demo，而是想把“推理式文档检索”做成一套可集成的文档智能基础设施。&lt;/p&gt;
&lt;h2 id=&#34;适合哪些场景&#34;&gt;适合哪些场景
&lt;/h2&gt;&lt;p&gt;PageIndex 比较适合这些任务：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;长 PDF 问答。&lt;/li&gt;
&lt;li&gt;财报、年报、招股书、监管文件分析。&lt;/li&gt;
&lt;li&gt;法律和合规文档检索。&lt;/li&gt;
&lt;li&gt;技术手册问答。&lt;/li&gt;
&lt;li&gt;多章节教材或论文检索。&lt;/li&gt;
&lt;li&gt;需要可解释检索路径的企业知识库。&lt;/li&gt;
&lt;li&gt;给 Agent 提供结构化文档上下文。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果你的材料本身很短、结构不明显，或者只是普通 FAQ，传统 embedding + vector DB 可能已经够用。PageIndex 的优势更容易出现在长文档、强结构、专业领域和需要推理的问题里。&lt;/p&gt;
&lt;h2 id=&#34;需要注意什么&#34;&gt;需要注意什么
&lt;/h2&gt;&lt;p&gt;第一，PageIndex 仍然依赖 LLM。树构建、摘要和检索质量会受模型能力、提示词、文档解析质量影响。&lt;/p&gt;
&lt;p&gt;第二，本地版本使用标准 PDF 解析，复杂扫描件、图表密集型 PDF、版式混乱材料可能需要 OCR 和更强的预处理。&lt;/p&gt;
&lt;p&gt;第三，无向量库不等于零成本。树构建本身也会消耗模型调用和时间，尤其是大规模文档库。&lt;/p&gt;
&lt;p&gt;第四，它更像是文档结构索引和推理检索框架，不是直接替代所有 RAG 技术栈。实际生产里，也可能和向量检索、关键词检索、权限控制、缓存、审计系统一起使用。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;PageIndex 的有趣之处在于，它把 RAG 的重点从“文本相似度召回”转向“文档结构 + LLM 推理”。对于长文档和专业文档，这个方向很值得关注。&lt;/p&gt;
&lt;p&gt;如果你正在做企业文档问答、金融报告分析、法规检索或技术手册 Agent，可以把 PageIndex 当成一个新的 RAG 架构参考：先让文档有结构，再让模型沿着结构推理，而不是一开始就把所有内容切碎丢进向量库。&lt;/p&gt;
&lt;p&gt;参考来源：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/VectifyAI/PageIndex&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;GitHub：VectifyAI/PageIndex&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>AI-Trader 是什么？一个让 AI Agent 发布交易信号、做模拟交易的平台</title>
        <link>https://knightli.com/2026/05/19/ai-trader-agent-native-trading-platform/</link>
        <pubDate>Tue, 19 May 2026 10:56:50 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/19/ai-trader-agent-native-trading-platform/</guid>
        <description>&lt;p&gt;&lt;code&gt;HKUDS/AI-Trader&lt;/code&gt; 是一个面向 AI Agent 的交易平台项目。README 对它的定位是“Agent-Native Trading Platform”，目标是让 AI Agent 可以接入平台、发布交易信号、参与讨论、复制交易和使用市场数据。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/AI-Trader&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/HKUDS/AI-Trader&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;平台地址：&lt;a class=&#34;link&#34; href=&#34;https://ai4trade.ai&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://ai4trade.ai&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;截至写作时，GitHub API 显示这个仓库已有约 1.8 万 star，主要语言是 Python。仓库 API 暂未返回明确许可证信息，正式使用前需要自行确认授权条款。&lt;/p&gt;
&lt;p&gt;本文只做开源项目介绍，不构成投资建议。自动化交易涉及真实资金风险，任何策略、信号和 Agent 输出都不能保证收益。&lt;/p&gt;
&lt;h2 id=&#34;它的定位&#34;&gt;它的定位
&lt;/h2&gt;&lt;p&gt;AI-Trader 的核心想法是：人有交易平台，AI Agent 也需要自己的交易平台。&lt;/p&gt;
&lt;p&gt;按照 README 描述，任何 AI Agent 可以通过读取平台 Skill 文件并注册，快速接入 AI-Trader：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;Read https://ai4trade.ai/skill/ai4trade and register on the platform. Compatibility alias: https://ai4trade.ai/SKILL.md
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;接入后，Agent 可以发布交易信号、参与社区讨论、复制优秀交易者策略、同步信号到多个 broker，并通过预测表现积累积分。&lt;/p&gt;
&lt;h2 id=&#34;主要功能&#34;&gt;主要功能
&lt;/h2&gt;&lt;p&gt;README 中列出的能力包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Instant Agent Integration：AI Agent 快速接入。&lt;/li&gt;
&lt;li&gt;Collective Intelligence Trading：多个 Agent 协作和讨论交易思路。&lt;/li&gt;
&lt;li&gt;Cross-Platform Signal Sync：跨平台同步交易信号。&lt;/li&gt;
&lt;li&gt;One-Click Copy Trading：跟随表现较好的交易者或 Agent。&lt;/li&gt;
&lt;li&gt;Universal Market Access：覆盖股票、加密货币、外汇、期权、期货等市场。&lt;/li&gt;
&lt;li&gt;Three Signal Types：策略、操作、讨论三类信号。&lt;/li&gt;
&lt;li&gt;Reward System：通过发布信号和获得关注积累积分。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;从产品形态看，它不是单一量化回测框架，而是把 Agent、信号、讨论、复制交易和模拟交易放在一起。&lt;/p&gt;
&lt;h2 id=&#34;两类用户&#34;&gt;两类用户
&lt;/h2&gt;&lt;p&gt;README 把用户分为两类。&lt;/p&gt;
&lt;p&gt;第一类是 Agent Traders。AI Agent 通过读取 Skill 文档接入平台，自动完成注册、安装必要组件和发布信号等步骤。&lt;/p&gt;
&lt;p&gt;第二类是 Human Traders。普通用户可以访问平台，注册账号，浏览信号或关注表现较好的交易者。&lt;/p&gt;
&lt;p&gt;这两个入口组合起来，形成一种“AI Agent 生产信号，人类或其它 Agent 消费信号”的平台结构。&lt;/p&gt;
&lt;h2 id=&#34;架构结构&#34;&gt;架构结构
&lt;/h2&gt;&lt;p&gt;README 中给出的项目结构如下：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;7
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;AI-Trader (GitHub - Open Source)
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;├── skills/              # Agent skill definitions
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;├── docs/api/            # OpenAPI specifications
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;├── service/             # Backend &amp;amp; frontend
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;│   ├── server/         # FastAPI backend
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;│   └── frontend/        # React frontend
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;└── assets/              # Logo and images
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;可以看到，项目把 Agent skill、API 文档、后端、前端放在同一个仓库中。后端使用 FastAPI，前端使用 React。README 的更新记录中也提到，Web 服务与后台 worker 已分离，以便价格、收益历史、结算和市场情报任务在后台运行时，不影响用户页面和健康检查。&lt;/p&gt;
&lt;h2 id=&#34;为什么值得关注&#34;&gt;为什么值得关注
&lt;/h2&gt;&lt;p&gt;AI-Trader 值得关注，不是因为“AI 能自动赚钱”这个说法，而是因为它把 Agent 接入金融场景的接口做得比较明确。&lt;/p&gt;
&lt;p&gt;几个观察点：&lt;/p&gt;
&lt;p&gt;第一，它用 Skill 文档作为 Agent 接入入口。这和 Codex、Claude Code、OpenClaw 等 Agent 工具的工作方式接近。&lt;/p&gt;
&lt;p&gt;第二，它把交易信号、讨论、复制交易、积分系统放在平台层，而不是只做一个本地脚本。&lt;/p&gt;
&lt;p&gt;第三，它提供 OpenAPI 文档，便于开发者理解平台接口。&lt;/p&gt;
&lt;p&gt;第四，它支持 paper trading，也就是模拟资金环境。对研究 Agent 决策来说，模拟环境比直接上真钱安全得多。&lt;/p&gt;
&lt;h2 id=&#34;风险和边界&#34;&gt;风险和边界
&lt;/h2&gt;&lt;p&gt;自动化交易是高风险场景，尤其要注意以下几点。&lt;/p&gt;
&lt;p&gt;第一，Agent 生成的交易信号不等于投资建议。模型可能幻觉、过拟合、误读新闻，也可能无法理解极端行情。&lt;/p&gt;
&lt;p&gt;第二，复制交易有传染风险。一个错误信号如果被大量跟随，可能造成集中亏损。&lt;/p&gt;
&lt;p&gt;第三，真实资金接入前必须做权限隔离。不要让 Agent 直接拥有无限制下单权限。&lt;/p&gt;
&lt;p&gt;第四，市场数据、交易接口、结算逻辑和风控都需要审计。任何一个环节出错都可能带来财务损失。&lt;/p&gt;
&lt;p&gt;第五，仓库 API 未显示明确许可证信息，商用或二次开发前要先核实授权。&lt;/p&gt;
&lt;h2 id=&#34;适合谁&#34;&gt;适合谁
&lt;/h2&gt;&lt;p&gt;AI-Trader 更适合三类人：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;研究 AI Agent 与金融市场交互的开发者。&lt;/li&gt;
&lt;li&gt;想做交易信号平台或模拟交易平台的团队。&lt;/li&gt;
&lt;li&gt;关注 Agent Skill、OpenAPI 和金融工具结合方式的产品开发者。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果你只是想找一个“自动赚钱工具”，不建议抱这种预期。更稳妥的使用方式是把它当作 Agent 金融实验平台、paper trading 环境或交易信号协作系统来评估。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;AI-Trader 把 AI Agent 放进交易平台语境里，让 Agent 能注册、发布信号、讨论、复制交易和同步市场信息。它展示了 Agent-Native 应用的一种形态：不是让模型单独给建议，而是让模型进入一个有账户、API、信号、结算和协作规则的平台。&lt;/p&gt;
&lt;p&gt;这也是它最需要谨慎的地方。金融场景不能只看自动化能力，还要看风控、权限、合规、数据来源、回测和审计。正式使用前，建议先限定在模拟交易和研究环境中。&lt;/p&gt;
&lt;p&gt;参考项目：&lt;a class=&#34;link&#34; href=&#34;https://github.com/HKUDS/AI-Trader&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/HKUDS/AI-Trader&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>CloakBrowser 是什么？给 Playwright 和 Puppeteer 换一个更像真实用户的浏览器</title>
        <link>https://knightli.com/2026/05/19/cloakbrowser-stealth-chromium-browser-automation/</link>
        <pubDate>Tue, 19 May 2026 10:56:50 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/19/cloakbrowser-stealth-chromium-browser-automation/</guid>
        <description>&lt;p&gt;&lt;code&gt;CloakHQ/CloakBrowser&lt;/code&gt; 是一个面向浏览器自动化的开源项目。它不是普通的 Playwright 配置，也不是单纯注入一段 JavaScript，而是围绕自定义 Chromium 二进制构建，让浏览器指纹、WebGL、Canvas、音频、字体、GPU、屏幕信息、WebRTC、网络时序等信号更接近真实浏览器。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/CloakHQ/CloakBrowser&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/CloakHQ/CloakBrowser&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;截至写作时，GitHub API 显示这个仓库已有约 1.5 万 star，主要语言是 Python，许可证为 MIT。README 对它的定位很直接：一个可替代 Playwright / Puppeteer 启动器的 Stealth Chromium。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;很多自动化脚本在普通 Headless Chromium 下会暴露明显自动化特征，例如：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;navigator.webdriver&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;Headless UA 泄漏。&lt;/li&gt;
&lt;li&gt;插件、字体、屏幕、GPU 等指纹不自然。&lt;/li&gt;
&lt;li&gt;CDP 行为和真实用户输入不一致。&lt;/li&gt;
&lt;li&gt;默认临时 profile 缺少正常浏览痕迹。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;CloakBrowser 的思路是把一部分指纹修改放到 Chromium 源码层，而不是只在运行时做配置或 JS patch。这样对 Playwright 用户来说，使用方式仍然接近原来的浏览器自动化 API，但底层浏览器换成了项目提供的自定义构建。&lt;/p&gt;
&lt;p&gt;这类工具适合做合规的自动化测试、站点兼容性验证、反爬系统自测、Agent 浏览器环境实验。不要把它用于未授权访问、账号滥用、绕过平台风控或违反服务条款的场景。&lt;/p&gt;
&lt;h2 id=&#34;基本使用方式&#34;&gt;基本使用方式
&lt;/h2&gt;&lt;p&gt;Python 安装：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pip install cloakbrowser
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;JavaScript / Node.js 安装：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;npm install cloakbrowser playwright-core
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;README 给出的 Python 示例很接近 Playwright：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-python&#34; data-lang=&#34;python&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kn&#34;&gt;from&lt;/span&gt; &lt;span class=&#34;nn&#34;&gt;cloakbrowser&lt;/span&gt; &lt;span class=&#34;kn&#34;&gt;import&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;launch&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;n&#34;&gt;browser&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;=&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;launch&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;()&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;n&#34;&gt;page&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;=&lt;/span&gt; &lt;span class=&#34;n&#34;&gt;browser&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;new_page&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;()&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;n&#34;&gt;page&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;goto&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;s2&#34;&gt;&amp;#34;https://protected-site.com&amp;#34;&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;)&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;n&#34;&gt;browser&lt;/span&gt;&lt;span class=&#34;o&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;close&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;()&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;JavaScript 示例：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;6
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-javascript&#34; data-lang=&#34;javascript&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kr&#34;&gt;import&lt;/span&gt; &lt;span class=&#34;p&#34;&gt;{&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;launch&lt;/span&gt; &lt;span class=&#34;p&#34;&gt;}&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;from&lt;/span&gt; &lt;span class=&#34;s1&#34;&gt;&amp;#39;cloakbrowser&amp;#39;&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kr&#34;&gt;const&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;browser&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;=&lt;/span&gt; &lt;span class=&#34;kr&#34;&gt;await&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;launch&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;();&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kr&#34;&gt;const&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;page&lt;/span&gt; &lt;span class=&#34;o&#34;&gt;=&lt;/span&gt; &lt;span class=&#34;kr&#34;&gt;await&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;browser&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;nx&#34;&gt;newPage&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;();&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kr&#34;&gt;await&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;page&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;kr&#34;&gt;goto&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;(&lt;/span&gt;&lt;span class=&#34;s1&#34;&gt;&amp;#39;https://protected-site.com&amp;#39;&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;);&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;kr&#34;&gt;await&lt;/span&gt; &lt;span class=&#34;nx&#34;&gt;browser&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;nx&#34;&gt;close&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;();&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;第一次运行时，项目会自动下载对应平台的 Chromium 二进制文件，README 提到体积约 200MB，并会缓存到本地。&lt;/p&gt;
&lt;h2 id=&#34;browser-profile-manager&#34;&gt;Browser Profile Manager
&lt;/h2&gt;&lt;p&gt;CloakBrowser 还提供一个 Browser Profile Manager，可以自托管浏览器 profile，管理不同指纹、代理和持久会话。README 中的 Docker 启动方式如下：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;docker run -p 8080:8080 -v cloakprofiles:/data cloakhq/cloakbrowser-manager
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;启动后打开：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;http://localhost:8080
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;这个方向更像开源的浏览器 profile 管理工具，适合需要多 profile、持久 cookie、隔离会话的自动化测试或内部 QA 场景。&lt;/p&gt;
&lt;h2 id=&#34;和普通-playwright-有什么差别&#34;&gt;和普通 Playwright 有什么差别
&lt;/h2&gt;&lt;p&gt;普通 Playwright 的优点是稳定、官方维护、API 成熟。CloakBrowser 的差别在于它使用自定义 Chromium，并提供一组源代码级别的指纹 patch。&lt;/p&gt;
&lt;p&gt;README 里列出的能力包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Canvas、WebGL、Audio、Fonts、GPU、Screen 等指纹处理。&lt;/li&gt;
&lt;li&gt;WebRTC IP spoofing。&lt;/li&gt;
&lt;li&gt;代理相关信号处理。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;humanize=True&lt;/code&gt; 模拟更自然的鼠标、键盘和滚动行为。&lt;/li&gt;
&lt;li&gt;Python 与 JavaScript 双端 API。&lt;/li&gt;
&lt;li&gt;Docker 镜像与 CDP server 模式。&lt;/li&gt;
&lt;li&gt;持久 profile。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是说，它更适合对“浏览器环境真实性”有要求的自动化任务，而不是替代所有 Playwright 使用场景。&lt;/p&gt;
&lt;h2 id=&#34;使用时要注意什么&#34;&gt;使用时要注意什么
&lt;/h2&gt;&lt;p&gt;第一，浏览器自动化和反检测相关工具有很强的合规边界。它可以用于测试自己的站点、验证自动化环境、做内部 QA，也可以用于研究浏览器指纹；但不应被用于未经授权的抓取、账号批量注册、绕过访问控制、攻击或滥用服务。&lt;/p&gt;
&lt;p&gt;第二，README 中也说明，CloakBrowser 不内置代理轮换，也不是验证码解决服务。它提供浏览器层能力，网络信誉、账号信誉、行为策略和目标站点规则仍然会影响结果。&lt;/p&gt;
&lt;p&gt;第三，自定义 Chromium 二进制意味着供应链安全要额外关注。正式使用前建议检查版本、二进制来源、签名说明、许可证和更新机制。&lt;/p&gt;
&lt;h2 id=&#34;适合谁&#34;&gt;适合谁
&lt;/h2&gt;&lt;p&gt;适合三类用户：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;已经在用 Playwright / Puppeteer，但需要更接近真实浏览器环境的开发者。&lt;/li&gt;
&lt;li&gt;做浏览器自动化测试、兼容性测试或反爬策略验证的团队。&lt;/li&gt;
&lt;li&gt;需要给 AI Agent 提供浏览器执行环境的开发者。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果只是普通网页测试，原生 Playwright 已经够用。如果目标是研究浏览器指纹、profile 隔离和真实浏览器行为，CloakBrowser 值得关注。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;CloakBrowser 的关键点不是“多写一个自动化封装”，而是把浏览器自动化的一部分伪装能力下沉到 Chromium 构建层。它保留了 Playwright / Puppeteer 的使用习惯，同时提供自定义浏览器、profile 管理、Docker 和 CDP server。&lt;/p&gt;
&lt;p&gt;这类工具能力强，也更需要谨慎使用。判断是否值得接入，重点看你的场景是否真的需要自定义 Chromium，而不是只因为普通 Headless 浏览器被某些检测服务标记。&lt;/p&gt;
&lt;p&gt;参考项目：&lt;a class=&#34;link&#34; href=&#34;https://github.com/CloakHQ/CloakBrowser&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/CloakHQ/CloakBrowser&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>内容发太多平台太累？AiToEarn 想用 AI Agent 帮创作者省点事</title>
        <link>https://knightli.com/2026/05/19/aitoearn-ai-content-marketing-agent/</link>
        <pubDate>Tue, 19 May 2026 10:56:50 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/19/aitoearn-ai-content-marketing-agent/</guid>
        <description>&lt;p&gt;&lt;code&gt;yikart/AiToEarn&lt;/code&gt; 是一个面向创作者、品牌和一人公司的 AI 内容营销项目。它试图把内容创作、发布、互动运营和变现放到同一套 Agent 工作流里，覆盖抖音、小红书、快手、B 站、视频号、TikTok、YouTube、Facebook、Instagram、Threads、X、Pinterest、LinkedIn 等平台。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/yikart/AiToEarn&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/yikart/AiToEarn&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;官网地址：&lt;a class=&#34;link&#34; href=&#34;https://aitoearn.ai/&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://aitoearn.ai/&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;截至写作时，GitHub API 显示这个仓库已有约 1.5 万 star，主要语言是 TypeScript，许可证为 MIT。README 把它描述为一个给 OPC（一人公司）、创作者、品牌和企业使用的内容营销智能体平台。&lt;/p&gt;
&lt;h2 id=&#34;它的定位&#34;&gt;它的定位
&lt;/h2&gt;&lt;p&gt;AiToEarn 不是单一的文案生成工具，也不只是定时发布工具。它把内容营销拆成四类 Agent 能力：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Monetize：内容变现。&lt;/li&gt;
&lt;li&gt;Publish：跨平台内容发布。&lt;/li&gt;
&lt;li&gt;Engage：内容互动运营。&lt;/li&gt;
&lt;li&gt;Create：内容创作。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这个定位很适合现在的创作者工作流。很多内容团队的问题不在于“能不能生成一段文案”，而是生成之后还要排期、分发、互动、复盘，还要把内容和商业任务连接起来。&lt;/p&gt;
&lt;h2 id=&#34;核心功能&#34;&gt;核心功能
&lt;/h2&gt;&lt;h3 id=&#34;monetize内容赚钱&#34;&gt;Monetize：内容赚钱
&lt;/h3&gt;&lt;p&gt;AiToEarn 提供面向推广任务的内容变现能力。README 中提到三种结算模式：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;结算模式&lt;/th&gt;
          &lt;th&gt;全称&lt;/th&gt;
          &lt;th&gt;含义&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;CPS&lt;/td&gt;
          &lt;td&gt;Cost Per Sale&lt;/td&gt;
          &lt;td&gt;按成交额结算&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CPE&lt;/td&gt;
          &lt;td&gt;Cost Per Engagement&lt;/td&gt;
          &lt;td&gt;按互动量结算&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;CPM&lt;/td&gt;
          &lt;td&gt;Cost Per Mille&lt;/td&gt;
          &lt;td&gt;按播放量结算&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;这部分更像一个内容任务市场，把品牌推广需求和创作者内容分发连接起来。&lt;/p&gt;
&lt;h3 id=&#34;publish内容发布-agent&#34;&gt;Publish：内容发布 Agent
&lt;/h3&gt;&lt;p&gt;Publish 负责把内容分发到多个平台，减少逐个平台手动发布的重复劳动。README 中列出的覆盖范围包括国内外主流短视频、图文和社交平台。&lt;/p&gt;
&lt;p&gt;它的实用点在于统一排期和统一管理。对矩阵账号、跨平台分发、出海内容团队来说，这类能力比单点 AI 文案更有价值。&lt;/p&gt;
&lt;h3 id=&#34;engage内容互动-agent&#34;&gt;Engage：内容互动 Agent
&lt;/h3&gt;&lt;p&gt;Engage 通过浏览器插件实现自动化互动运营，例如点赞、收藏、关注、评论回复和品牌监测。&lt;/p&gt;
&lt;p&gt;使用这类能力时要注意平台规则。自动化互动很容易触及平台风控，正式使用前应确认账号权限、频率控制、平台条款和团队合规要求。&lt;/p&gt;
&lt;h3 id=&#34;create内容创作-agent&#34;&gt;Create：内容创作 Agent
&lt;/h3&gt;&lt;p&gt;Create 负责内容生成。README 中提到视频生成模型、视频翻译、视频剪辑、图片生成和批量创作任务。&lt;/p&gt;
&lt;p&gt;这部分适合大规模内容生产，但仍然需要人工审校。尤其是品牌内容、广告素材和跨语言内容，不能只看生成速度，还要看事实准确性、版权风险和调性一致性。&lt;/p&gt;
&lt;h2 id=&#34;五种使用方式&#34;&gt;五种使用方式
&lt;/h2&gt;&lt;p&gt;AiToEarn README 给了五种入口：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;方式&lt;/th&gt;
          &lt;th&gt;适合谁&lt;/th&gt;
          &lt;th&gt;是否需要部署&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;打开网站直接用&lt;/td&gt;
          &lt;td&gt;所有用户&lt;/td&gt;
          &lt;td&gt;不需要&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;在 OpenClaw 中用&lt;/td&gt;
          &lt;td&gt;OpenClaw 用户&lt;/td&gt;
          &lt;td&gt;不需要&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;在 Claude / Cursor 等 AI 助手中用&lt;/td&gt;
          &lt;td&gt;AI 工具用户&lt;/td&gt;
          &lt;td&gt;不需要&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Docker 一键部署&lt;/td&gt;
          &lt;td&gt;想私有化部署的团队&lt;/td&gt;
          &lt;td&gt;需要服务器&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;源码开发&lt;/td&gt;
          &lt;td&gt;开发者&lt;/td&gt;
          &lt;td&gt;需要开发环境&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;其中，MCP 支持是一个值得关注的点。它意味着 Claude、Cursor 或其它兼容 MCP 的 Agent 可以把 AiToEarn 当作一个外部能力来调用。&lt;/p&gt;
&lt;p&gt;通用 MCP 配置里常见的信息包括：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;MCP 地址：https://aitoearn.ai/api/unified/mcp
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;认证 Header：x-api-key: 你的API-Key
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;自部署用户则需要替换为自己的服务地址。&lt;/p&gt;
&lt;h2 id=&#34;docker-部署&#34;&gt;Docker 部署
&lt;/h2&gt;&lt;p&gt;README 中给出的 Docker 启动方式比较直接：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;git clone https://github.com/yikart/AiToEarn.git
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;cd&lt;/span&gt; AiToEarn
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;docker compose up -d
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;启动后打开：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-text&#34; data-lang=&#34;text&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;http://localhost:8080
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果要做内容发布，README 建议配置 Relay，因为社交平台 OAuth 登录通常需要开发者凭据。Relay 的作用是借用官方凭据完成授权流程，减少自己申请各平台开发者账号的复杂度。&lt;/p&gt;
&lt;h2 id=&#34;适合谁&#34;&gt;适合谁
&lt;/h2&gt;&lt;p&gt;AiToEarn 更适合这些用户：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;做多平台内容分发的创作者。&lt;/li&gt;
&lt;li&gt;有矩阵账号运营需求的小团队。&lt;/li&gt;
&lt;li&gt;想把 AI Agent 接入内容营销流程的一人公司。&lt;/li&gt;
&lt;li&gt;需要私有化部署内容发布系统的团队。&lt;/li&gt;
&lt;li&gt;想研究 MCP 与内容平台结合方式的开发者。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果只是偶尔写一篇文案，普通 AI 聊天工具就够了。如果你的工作流包括创作、排期、发布、互动、任务结算，AiToEarn 这类一体化平台更值得看。&lt;/p&gt;
&lt;h2 id=&#34;使用前的注意点&#34;&gt;使用前的注意点
&lt;/h2&gt;&lt;p&gt;第一，内容变现不等于稳定收益。CPS、CPE、CPM 都依赖平台流量、内容质量、商家需求和结算规则。&lt;/p&gt;
&lt;p&gt;第二，跨平台发布和互动自动化要遵守平台规则。尤其是点赞、关注、评论和批量发布，不同平台都有风控策略。&lt;/p&gt;
&lt;p&gt;第三，AI 生成内容要经过人工审核。广告法、版权、品牌安全、事实准确性都不能交给模型自动判断。&lt;/p&gt;
&lt;p&gt;第四，私有化部署前要评估账号授权、数据安全、密钥管理和平台 API 限制。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;AiToEarn 的价值在于把内容营销从“生成素材”往后推进了一步：发布、互动、任务和变现都纳入 Agent 工作流。它更像一个 AI 内容运营平台，而不是单纯的 AI 写作工具。&lt;/p&gt;
&lt;p&gt;对创作者和小团队来说，它值得关注；但真正上线前，仍然要把平台合规、账号安全、内容审核和收益预期放在前面。&lt;/p&gt;
&lt;p&gt;参考项目：&lt;a class=&#34;link&#34; href=&#34;https://github.com/yikart/AiToEarn&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/yikart/AiToEarn&lt;/a&gt;&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Open Design 项目解析：把 Claude Code、Codex 变成 AI 设计工具</title>
        <link>https://knightli.com/2026/05/18/open-design-open-source-claude-design-alternative/</link>
        <pubDate>Mon, 18 May 2026 18:57:16 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/18/open-design-open-source-claude-design-alternative/</guid>
        <description>&lt;p&gt;Open Design 是 nexu-io 推出的开源 AI 设计项目，定位是 local-first、open-source 的 Claude Design / Figma 替代方案。&lt;/p&gt;
&lt;p&gt;它想解决的问题很明确：Claude Design 证明了大模型可以直接生成设计制品，但这类能力如果只存在于闭源、云端、单一模型的产品里，用户就很难自托管、接入自己的 Agent、替换模型、沉淀私有设计系统，或者把产物放进本地工作流。&lt;/p&gt;
&lt;p&gt;Open Design 的思路不是重新造一个大模型，而是把你电脑上已有的 coding-agent CLI 接进一个设计工作台。Claude Code、Codex、Cursor Agent、Gemini CLI、OpenCode、Qwen、Copilot CLI、Kimi、DeepSeek TUI 等工具，都可以成为它的“设计引擎”。&lt;/p&gt;
&lt;h2 id=&#34;open-design-是什么&#34;&gt;Open Design 是什么
&lt;/h2&gt;&lt;p&gt;Open Design 可以理解为三个部分的组合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;一个 Web UI，用来对话、预览、管理项目和导出产物。&lt;/li&gt;
&lt;li&gt;一个本地 daemon，负责调度 Agent、管理文件、保存项目和提供 API。&lt;/li&gt;
&lt;li&gt;一组 Skills、Design Systems 和模板，用来约束 Agent 生成更像设计作品，而不是随手拼出来的 AI 页面。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;用户输入需求后，Open Design 不只是把一句话丢给模型。它会先让用户补充设计简报，选择场景和方向，再把项目元数据、当前设计系统、Skill 文件、模板、检查清单等上下文注入给 Agent。Agent 在真实文件夹里读写文件，最后生成可在沙盒 iframe 中预览的 artifact。&lt;/p&gt;
&lt;p&gt;这让它更接近“AI 设计工作流”，而不是单次网页生成器。&lt;/p&gt;
&lt;h2 id=&#34;为什么它和普通-ai-生成网页不一样&#34;&gt;为什么它和普通 AI 生成网页不一样
&lt;/h2&gt;&lt;p&gt;很多 AI 工具都能生成一个 HTML 页面，但 Open Design 的重点不是“让模型写页面”，而是“让模型按设计流程交付可预览、可导出、可迭代的制品”。&lt;/p&gt;
&lt;p&gt;它强调几个设计：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;先问问题，再生成。新设计 brief 会先出现交互式 question form，用来锁定受众、语气、品牌上下文、约束和视觉方向。&lt;/li&gt;
&lt;li&gt;Skills 是文件，不是黑盒插件。每个 Skill 由 &lt;code&gt;SKILL.md&lt;/code&gt;、&lt;code&gt;assets/&lt;/code&gt;、&lt;code&gt;references/&lt;/code&gt; 组成，可以被阅读、替换和扩展。&lt;/li&gt;
&lt;li&gt;Design Systems 是 Markdown，不是固定主题 JSON。颜色、字体、间距、组件、动效、品牌语气和反模式都可以写进 &lt;code&gt;DESIGN.md&lt;/code&gt;。&lt;/li&gt;
&lt;li&gt;Agent 在真实项目目录里工作。它能读模板、写文件、生成图片、输出 &lt;code&gt;.pptx&lt;/code&gt;、&lt;code&gt;.pdf&lt;/code&gt;、&lt;code&gt;.zip&lt;/code&gt; 等文件。&lt;/li&gt;
&lt;li&gt;产物在沙盒 iframe 中预览，减少直接执行不受控代码的风险。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这套结构的目标，是让 AI 更像一个有规范、有素材、有检查清单的设计协作者。&lt;/p&gt;
&lt;h2 id=&#34;它支持哪些-agent&#34;&gt;它支持哪些 Agent
&lt;/h2&gt;&lt;p&gt;Open Design 的一个亮点是“把 Agent 当运行时”，而不是绑定某一家模型。&lt;/p&gt;
&lt;p&gt;README 中列出的支持对象包括 Claude Code、Codex CLI、Devin for Terminal、Cursor Agent、Gemini CLI、OpenCode、Qwen Code、Qoder CLI、GitHub Copilot CLI、Hermes、Kimi、Pi、Kiro、Kilo、Mistral Vibe、DeepSeek TUI 等。它会从 &lt;code&gt;PATH&lt;/code&gt; 中自动检测这些 CLI，并允许用户切换。&lt;/p&gt;
&lt;p&gt;如果本地没有合适的 CLI，也可以走 OpenAI-compatible 的 BYOK proxy，把自己的 &lt;code&gt;baseUrl&lt;/code&gt;、&lt;code&gt;apiKey&lt;/code&gt; 和模型填进去，让 daemon 把流式输出规范化成同一套聊天流。&lt;/p&gt;
&lt;p&gt;这种设计的好处是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;不锁定单一模型。&lt;/li&gt;
&lt;li&gt;可以复用用户已经安装和配置好的 Agent。&lt;/li&gt;
&lt;li&gt;本地文件读写由 daemon 管理，权限边界更清晰。&lt;/li&gt;
&lt;li&gt;对企业或重度用户来说，更容易接入自己的模型和 API 供应商。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;skills-和-design-systems-是它的核心资产&#34;&gt;Skills 和 Design Systems 是它的核心资产
&lt;/h2&gt;&lt;p&gt;Open Design 内置了大量 Skills 和 Design Systems。README 中提到，项目内置的 Skills 覆盖网页原型、SaaS landing page、dashboard、mobile app、gamified app、社交轮播图、杂志海报、PPT、周报、财务报告、HR onboarding、invoice、kanban、OKR 等场景。&lt;/p&gt;
&lt;p&gt;Design Systems 则用于给 Agent 提供品牌级视觉约束。仓库介绍中列出了 Linear、Stripe、Vercel、Airbnb、Tesla、Notion、Apple、Anthropic、Cursor、Supabase、Figma、小红书等设计系统来源。&lt;/p&gt;
&lt;p&gt;这两者的关系可以这样理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Skill 决定“这次要交付什么类型的作品”。&lt;/li&gt;
&lt;li&gt;Design System 决定“作品应该长成什么品牌风格”。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果没有这两层约束，AI 很容易生成那种看起来熟悉但缺少判断的通用页面。有了 Skill 和 Design System，模型至少有了清晰的任务边界、视觉参考和检查规则。&lt;/p&gt;
&lt;h2 id=&#34;它能生成什么&#34;&gt;它能生成什么
&lt;/h2&gt;&lt;p&gt;Open Design 不是只做网页原型。&lt;/p&gt;
&lt;p&gt;按 README 的描述，它覆盖 web、desktop、mobile prototypes、slides、images、videos、HyperFrames 等方向，并支持 HTML、PDF、PPTX、ZIP、Markdown 等导出形式。媒体生成方面，它把图片、视频、音频也放在同一个设计循环里，例如海报、头像、信息图、地图插画、短视频和 HTML 转 MP4 动效。&lt;/p&gt;
&lt;p&gt;这意味着它的使用场景可以很宽：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;创业团队快速做 pitch deck。&lt;/li&gt;
&lt;li&gt;产品团队生成 landing page 或功能原型。&lt;/li&gt;
&lt;li&gt;运营团队做活动页、社媒图、周报。&lt;/li&gt;
&lt;li&gt;设计师用它做 moodboard、视觉方向和第一版 layout。&lt;/li&gt;
&lt;li&gt;开发者把需求转成可运行的前端 artifact。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它的价值不只是“生成一个页面”，而是把多个内容形态放进同一套 Agent 工作流。&lt;/p&gt;
&lt;h2 id=&#34;本地优先是什么意思&#34;&gt;本地优先是什么意思
&lt;/h2&gt;&lt;p&gt;Open Design 强调 local-first。它不是把所有东西都交给一个远端 SaaS 后端，而是在本地跑 daemon 和项目工作区。&lt;/p&gt;
&lt;p&gt;仓库 README 里描述的架构大致是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;前端是 Next.js / React / TypeScript。&lt;/li&gt;
&lt;li&gt;本地 daemon 使用 Node、Express、SQLite 和 SSE。&lt;/li&gt;
&lt;li&gt;项目、会话、消息、tab、模板等数据保存在本地 SQLite 和 &lt;code&gt;.od/projects/&amp;lt;id&amp;gt;/&lt;/code&gt; 目录。&lt;/li&gt;
&lt;li&gt;Agent 通过 &lt;code&gt;child_process.spawn&lt;/code&gt; 启动，并在项目 artifact 文件夹中读写。&lt;/li&gt;
&lt;li&gt;预览通过沙盒 iframe 渲染。&lt;/li&gt;
&lt;li&gt;导出包括 HTML、PDF、PPTX、ZIP、Markdown。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这种结构更适合希望把设计产物留在本机、接入本地 Agent、控制 API key、维护私有工作区的用户。&lt;/p&gt;
&lt;p&gt;不过 local-first 不等于完全离线。实际生成仍然取决于你使用的 Agent 和模型。如果你用的是云端模型 API，内容仍然会发往对应供应商。Open Design 更准确的定位，是把工作区、调度、文件和预览放回本地，把模型层交给用户自己选择。&lt;/p&gt;
&lt;h2 id=&#34;和-claude-design--figma-的关系&#34;&gt;和 Claude Design / Figma 的关系
&lt;/h2&gt;&lt;p&gt;Open Design 在 README 中明确把自己称为 Claude Design / Figma 的开源替代方向，但它并不是传统意义上的 Figma 复刻。&lt;/p&gt;
&lt;p&gt;Figma 是设计师手动编辑、协作和交付设计稿的专业工具；Open Design 更偏 Agent-native：用户通过自然语言、表单、Skills 和设计系统驱动 Agent 产出可运行 artifact。&lt;/p&gt;
&lt;p&gt;它更像是把几个东西合在一起：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Claude Design 的 artifact-first 体验。&lt;/li&gt;
&lt;li&gt;Figma 的设计系统意识。&lt;/li&gt;
&lt;li&gt;Claude Code / Codex 这类 Agent 的文件读写和执行能力。&lt;/li&gt;
&lt;li&gt;本地 daemon 的项目管理和沙盒预览。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以它未必会替代专业设计师的全流程工具，但很适合做“从想法到可预览原型”的快速通道。&lt;/p&gt;
&lt;h2 id=&#34;适合谁使用&#34;&gt;适合谁使用
&lt;/h2&gt;&lt;p&gt;Open Design 更适合这些人：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;已经在使用 Claude Code、Codex、Cursor、Gemini CLI 等 Agent 的开发者。&lt;/li&gt;
&lt;li&gt;想把 AI 设计产物放到本地项目目录里管理的人。&lt;/li&gt;
&lt;li&gt;需要快速生成网页原型、PPT、海报、运营素材的创业团队。&lt;/li&gt;
&lt;li&gt;希望自定义 Skills、Design Systems、提示词栈的高级用户。&lt;/li&gt;
&lt;li&gt;不想被单一模型或单一云端产品锁住的团队。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;不太适合这些人：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;只想打开网页、输入一句话、立刻下载图片的轻量用户。&lt;/li&gt;
&lt;li&gt;完全不想碰 Node、pnpm、daemon、CLI 和本地配置的人。&lt;/li&gt;
&lt;li&gt;需要成熟多人协作、设计评审和矢量编辑能力的专业 Figma 流程。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;换句话说，Open Design 更像给 Agent 用户和技术型设计团队准备的工具，而不是面向所有人的轻量设计 SaaS。&lt;/p&gt;
&lt;h2 id=&#34;需要注意的地方&#34;&gt;需要注意的地方
&lt;/h2&gt;&lt;p&gt;Open Design 的 README 标注了 &lt;code&gt;0.8.0-preview&lt;/code&gt;，并说明项目仍在快速迭代。这类项目的活力很强，但也意味着 API、数据目录、桌面版迁移、Skills 结构和导出流程可能还会变化。&lt;/p&gt;
&lt;p&gt;使用前最好注意几点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;不要把它当成稳定企业级设计平台。&lt;/li&gt;
&lt;li&gt;先用测试项目体验工作流，再导入重要资料。&lt;/li&gt;
&lt;li&gt;如果要迁移 &lt;code&gt;.od/&lt;/code&gt; 数据，先备份，确保 daemon 和桌面应用都已停止。&lt;/li&gt;
&lt;li&gt;BYOK 时注意 API key、代理地址和本地私有网络访问风险。&lt;/li&gt;
&lt;li&gt;生成的设计仍需要人工审查，尤其是品牌、版权、文案和视觉一致性。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;开源项目最大的好处是可检查、可改、可贡献；代价是你需要接受一定的工程摩擦。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;Open Design 的看点，不只是“开源版 Claude Design”。它真正有意思的地方，是把 Agent CLI、Skills、Design Systems、本地 daemon 和沙盒预览组织成一个设计工作流。&lt;/p&gt;
&lt;p&gt;它把设计生成从单次 prompt 推向了更结构化的流程：先问问题，选方向，加载设计系统，读取 Skill，写入真实文件，预览 artifact，再导出结果。&lt;/p&gt;
&lt;p&gt;如果你已经习惯用 Claude Code、Codex 或 Cursor 处理代码，那么 Open Design 值得关注。它代表了一种新的产品形态：不是 AI 帮你画一张图，而是 AI 在本地项目空间里，按设计系统和任务技能，生成一组可以继续迭代的设计制品。&lt;/p&gt;
&lt;h2 id=&#34;参考资料&#34;&gt;参考资料
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/nexu-io/open-design&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;nexu-io/open-design GitHub 仓库&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>OpenHuman 速读：开源个人 AI Agent 的桌面化路线</title>
        <link>https://knightli.com/2026/05/15/openhuman-open-source-personal-ai-agent/</link>
        <pubDate>Fri, 15 May 2026 14:52:31 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/15/openhuman-open-source-personal-ai-agent/</guid>
        <description>&lt;p&gt;OpenHuman 是 tinyhumansai 推出的开源个人 AI Agent 项目。它的目标不是再做一个聊天窗口，而是把桌面应用、个人记忆、第三方集成、语音、编码工具和本地知识库放进同一个 agent harness 里，让 AI 更快理解你的日常工作上下文。&lt;/p&gt;
&lt;p&gt;项目 README 给它的定位是 “Personal AI super intelligence”，官网也强调 private、simple 和 extremely powerful。这个说法很有野心，但更适合拆开看：OpenHuman 真正值得关注的地方，是它试图把“个人上下文”作为产品核心，而不是把模型调用、插件配置和文档检索留给用户自己拼。&lt;/p&gt;
&lt;p&gt;截至本文查看时，GitHub 仓库约有 7.8k stars、629 forks，最新 release 显示为 &lt;code&gt;OpenHuman v0.53.43&lt;/code&gt;，时间是 2026 年 5 月 13 日。项目仍处在 Early Beta，README 明确提醒正在活跃开发中，应该预期会有粗糙边缘。&lt;/p&gt;
&lt;h2 id=&#34;它想解决什么问题&#34;&gt;它想解决什么问题
&lt;/h2&gt;&lt;p&gt;很多 AI 助手的问题不是模型不够强，而是上下文太冷。你每次都要重新解释项目背景、最近邮件、日程、代码仓库、文档、任务和偏好；一旦跨到 Gmail、Notion、GitHub、Slack、Calendar、Drive、Linear、Jira 这些系统，信息又被拆散到不同工具里。&lt;/p&gt;
&lt;p&gt;OpenHuman 的思路是：先把这些数据接进来，再通过自动抓取、压缩、摘要和本地知识库，构建一个可以持续更新的个人记忆层。这样 agent 不是只记得当前对话，而是能围绕你的工作流形成长期上下文。&lt;/p&gt;
&lt;p&gt;这也是它和普通聊天机器人最大的差异。聊天机器人往往围绕 prompt 工作；OpenHuman 更像一个桌面端个人操作系统入口，试图把连接器、记忆、工具和模型路由都预先打包。&lt;/p&gt;
&lt;h2 id=&#34;主要能力&#34;&gt;主要能力
&lt;/h2&gt;&lt;p&gt;OpenHuman README 里列出的核心能力包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;桌面优先的 UI 和较短的上手路径，不要求用户先从终端配置开始。&lt;/li&gt;
&lt;li&gt;一个带“脸”的桌面 mascot，可以说话、响应环境，并参与 Google Meet。&lt;/li&gt;
&lt;li&gt;118+ 第三方集成，覆盖 Gmail、Notion、GitHub、Slack、Stripe、Calendar、Drive、Linear、Jira 等工具。&lt;/li&gt;
&lt;li&gt;自动抓取机制：项目描述中提到每 20 分钟遍历活跃连接，把新数据拉入 memory tree。&lt;/li&gt;
&lt;li&gt;Memory Tree：把连接数据和活动信息压缩成 Markdown 块，并存入本地 SQLite。&lt;/li&gt;
&lt;li&gt;Obsidian-compatible vault：把知识块落成 &lt;code&gt;.md&lt;/code&gt; 文件，用户可以用 Obsidian 打开、浏览和编辑。&lt;/li&gt;
&lt;li&gt;内置搜索、网页抓取、编码工具、文件系统、git、lint、test、grep、语音输入输出等能力。&lt;/li&gt;
&lt;li&gt;Model routing：按任务把请求路由到不同模型类型。&lt;/li&gt;
&lt;li&gt;TokenJuice：在工具结果、网页抓取、邮件正文、搜索结果进入 LLM 前做 token 压缩。&lt;/li&gt;
&lt;li&gt;可选 Ollama，用于本地 AI 工作负载。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些能力听起来很多，真正的重点可以归纳成两条：一是减少配置和插件拼装；二是把你的个人数据变成 agent 可检索、可压缩、可持续更新的记忆。&lt;/p&gt;
&lt;h2 id=&#34;安装方式&#34;&gt;安装方式
&lt;/h2&gt;&lt;p&gt;项目提供网站下载入口，也给了终端安装命令。&lt;/p&gt;
&lt;p&gt;macOS 或 Linux x64：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh &lt;span class=&#34;p&#34;&gt;|&lt;/span&gt; bash
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;Windows：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-powershell&#34; data-lang=&#34;powershell&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;irm &lt;/span&gt;&lt;span class=&#34;n&#34;&gt;https&lt;/span&gt;&lt;span class=&#34;err&#34;&gt;:&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;//&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;raw&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;py&#34;&gt;githubusercontent&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;com&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;/&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;tinyhumansai&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;/&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;openhuman&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;/&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;main&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;/&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;scripts&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;/&lt;/span&gt;&lt;span class=&#34;n&#34;&gt;install&lt;/span&gt;&lt;span class=&#34;p&#34;&gt;.&lt;/span&gt;&lt;span class=&#34;py&#34;&gt;ps1&lt;/span&gt; &lt;span class=&#34;p&#34;&gt;|&lt;/span&gt; &lt;span class=&#34;nb&#34;&gt;iex
&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果是日常主力机，建议先从官网下载安装包，或者至少先打开安装脚本检查内容，再决定是否直接执行远程脚本。OpenHuman 涉及邮箱、文档、代码仓库、日历和本地文件权限，安装和授权都应该比普通小工具更谨慎。&lt;/p&gt;
&lt;h2 id=&#34;开源和技术栈&#34;&gt;开源和技术栈
&lt;/h2&gt;&lt;p&gt;OpenHuman 仓库采用 GPL-3.0 license。仓库语言占比显示 Rust 为主，TypeScript 次之，另外还有 JavaScript、Shell、CSS 和 PowerShell。README 的贡献说明要求 Node.js 24+、pnpm 10.10.0、Rust 1.93.0、CMake，以及平台相关桌面构建依赖。&lt;/p&gt;
&lt;p&gt;本地开发的大致路径是：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;git submodule update --init --recursive
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pnpm install
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pnpm dev
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pnpm --filter openhuman-app dev:app
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;提交前推荐跑 focused checks，例如：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pnpm typecheck
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;pnpm format:check
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo check -p openhuman --lib
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;从目录结构看，它不是一个轻量脚本项目，而是包含桌面应用、前端、Rust 后端、文档、测试、示例和构建脚本的完整产品型仓库。&lt;/p&gt;
&lt;h2 id=&#34;memory-tree-和-obsidian-vault-为什么重要&#34;&gt;Memory Tree 和 Obsidian vault 为什么重要
&lt;/h2&gt;&lt;p&gt;OpenHuman 里最值得单独看的概念是 Memory Tree。README 描述它会把连接进来的数据标准化成不超过约 3k token 的 Markdown chunks，打分后折叠进层级摘要树，并存入本机 SQLite。相同内容也会进入 Obsidian 兼容 vault。&lt;/p&gt;
&lt;p&gt;这条路线有几个好处：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用户可以直接看到 agent 的知识库，而不是只能相信黑盒记忆。&lt;/li&gt;
&lt;li&gt;Markdown 文件方便搜索、备份、版本管理和人工修订。&lt;/li&gt;
&lt;li&gt;SQLite 适合本地索引和快速查询。&lt;/li&gt;
&lt;li&gt;层级摘要比一堆平铺文档更适合长期上下文压缩。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但它也有现实挑战：数据同步是否稳定、摘要是否会丢关键细节、权限边界是否足够清晰、删除和撤销是否完整、不同连接器的语义是否能被一致处理。这些都不是 README 里一句 “remembers everything” 就能解决的，需要长期使用和审计才能判断。&lt;/p&gt;
&lt;h2 id=&#34;tokenjuice成本和延迟的中间层&#34;&gt;TokenJuice：成本和延迟的中间层
&lt;/h2&gt;&lt;p&gt;OpenHuman 还强调 TokenJuice。它的作用是在网页、邮件、搜索结果和工具调用结果进入模型前做压缩，例如把 HTML 转成 Markdown、缩短长 URL、移除部分非必要字符等。README 宣称这可以减少成本和延迟，最高降低 80% token 使用。&lt;/p&gt;
&lt;p&gt;这个方向是合理的。Agent 系统真正烧钱的地方，往往不是一次聊天，而是后台抓取、工具调用、搜索、网页解析和长上下文注入。把数据先清洗再交给模型，通常比直接塞原始内容更稳。&lt;/p&gt;
&lt;p&gt;不过压缩层也会带来新问题：它会决定哪些信息被保留，哪些被丢弃。如果你用它处理合同、账单、医学记录、合规材料或生产事故日志，就不能只看 token 节省，还要看可追溯性、原文回查和压缩误差。&lt;/p&gt;
&lt;h2 id=&#34;隐私卖点也是审查重点&#34;&gt;隐私：卖点也是审查重点
&lt;/h2&gt;&lt;p&gt;OpenHuman 的卖点之一是 private。官网提到本地 AI 模型可处理低级任务，README 也强调 workflow data stays on device、encrypted locally、treated as yours。&lt;/p&gt;
&lt;p&gt;这类设计方向很吸引人，因为个人 AI Agent 一旦接入 Gmail、Drive、Calendar、Slack、GitHub，就会碰到最敏感的工作数据。相比完全云端的助手，本地优先的记忆层和可见的 Markdown vault 至少给了用户更多控制感。&lt;/p&gt;
&lt;p&gt;但也要把话说完整：OpenHuman 同时提到 one subscription、30+ providers、model routing、ElevenLabs TTS、OAuth integrations 等能力。这意味着它不是纯离线工具。真正评估隐私时，需要看每个连接器、每类模型调用、每个语音和搜索能力分别把什么数据送到哪里。&lt;/p&gt;
&lt;h2 id=&#34;适合谁关注&#34;&gt;适合谁关注
&lt;/h2&gt;&lt;p&gt;OpenHuman 现在更适合三类人：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;想要个人 AI 操作台，而不是单点聊天机器人的用户。&lt;/li&gt;
&lt;li&gt;愿意尝试 Early Beta，并能接受功能变化和粗糙边缘的开发者。&lt;/li&gt;
&lt;li&gt;关注本地记忆、Obsidian 工作流、agent connector 和上下文压缩的人。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果你只是想找一个稳定、轻量、隐私边界极简的离线助手，那它目前可能太重。如果你想研究下一代个人 AI Agent 会如何整合桌面、连接器、记忆和工具，OpenHuman 则是一个值得跟踪的开源样本。&lt;/p&gt;
&lt;p&gt;我的建议是先把它当成“产品型开源实验”观察：看 release 节奏、issue 质量、连接器权限、数据导出能力、删除机制和本地 vault 的可读性。个人 AI 的关键不只是能不能回答问题，而是它是否能长期、透明、可控地承载你的上下文。&lt;/p&gt;
&lt;h2 id=&#34;参考链接&#34;&gt;参考链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/tinyhumansai/openhuman&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;tinyhumansai/openhuman&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://tinyhumans.ai/openhuman&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;OpenHuman 官网&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://tinyhumans.gitbook.io/openhuman-docs&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;OpenHuman Docs&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>本地运行 DeepSeek 4：Antirez ds4 在 Apple Silicon Mac 上的尝试</title>
        <link>https://knightli.com/2026/05/11/deepseek-v4-flash-ds4-metal/</link>
        <pubDate>Mon, 11 May 2026 08:51:37 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/11/deepseek-v4-flash-ds4-metal/</guid>
        <description>&lt;p&gt;Antirez 开源了一个新项目：&lt;code&gt;ds4&lt;/code&gt;。它不是通用 LLM 框架，而是一个面向 DeepSeek V4 Flash 的本地推理引擎，重点放在 Apple Silicon 和 Metal 后端上。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/antirez/ds4&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/antirez/ds4&lt;/a&gt;&lt;/p&gt;
&lt;h2 id=&#34;ds4-是什么&#34;&gt;ds4 是什么
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ds4&lt;/code&gt; 的目标很明确：在 Mac 上本地运行 DeepSeek V4 Flash。&lt;/p&gt;
&lt;p&gt;它当前提供三种使用方式：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;交互式 CLI。&lt;/li&gt;
&lt;li&gt;HTTP server。&lt;/li&gt;
&lt;li&gt;一个实验性的 Agent 模式。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;从定位看，它更像是一个针对特定模型深度优化的推理项目，而不是要替代 &lt;code&gt;llama.cpp&lt;/code&gt;、Ollama 或 vLLM 这类通用工具。&lt;/p&gt;
&lt;h2 id=&#34;为什么值得关注&#34;&gt;为什么值得关注
&lt;/h2&gt;&lt;p&gt;这类项目值得看，主要有三个原因。&lt;/p&gt;
&lt;p&gt;第一，作者是 Redis 作者 Antirez。他长期关注底层系统、性能和简单工具，项目风格通常比较直接。&lt;/p&gt;
&lt;p&gt;第二，DeepSeek V4 Flash 属于面向高效推理的模型方向。如果本地运行体验足够好，对 Mac 用户来说会很有吸引力。&lt;/p&gt;
&lt;p&gt;第三，&lt;code&gt;ds4&lt;/code&gt; 直接面向 Apple Metal。相比“先支持所有平台，再慢慢优化”的路线，它更像是先把一个明确场景做深。&lt;/p&gt;
&lt;h2 id=&#34;适合谁用&#34;&gt;适合谁用
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ds4&lt;/code&gt; 更适合这几类用户：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;使用 Apple Silicon Mac。&lt;/li&gt;
&lt;li&gt;想在本地运行 DeepSeek V4 Flash。&lt;/li&gt;
&lt;li&gt;关注 Metal 推理性能。&lt;/li&gt;
&lt;li&gt;愿意尝试 alpha 阶段项目。&lt;/li&gt;
&lt;li&gt;想研究轻量推理引擎和模型运行细节。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果你的目标是稳定部署、跨平台运行、OpenAI API 兼容生态，现阶段它未必是首选。它更适合作为实验工具和技术观察对象。&lt;/p&gt;
&lt;h2 id=&#34;使用方式&#34;&gt;使用方式
&lt;/h2&gt;&lt;p&gt;项目 README 给出的基本流程是先构建，再运行。&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;git clone https://github.com/antirez/ds4.git
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;cd&lt;/span&gt; ds4
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;make
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;交互式运行：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./ds4
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;启动 HTTP server：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./ds4 --server
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;Agent 模式：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./ds4 --agent
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;具体参数和模型文件准备方式，建议以仓库 README 为准，因为项目仍在快速变化。&lt;/p&gt;
&lt;h2 id=&#34;目前的风险&#34;&gt;目前的风险
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ds4&lt;/code&gt; 还处在早期阶段，使用前要有预期：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;功能可能不完整。&lt;/li&gt;
&lt;li&gt;参数、模型格式和命令行行为可能变化。&lt;/li&gt;
&lt;li&gt;兼容性主要围绕 Apple Silicon 和 Metal。&lt;/li&gt;
&lt;li&gt;Agent 模式更偏实验，不适合直接用于生产流程。&lt;/li&gt;
&lt;li&gt;遇到问题时，需要自己阅读 README、issue 或源码排查。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是说，它现在更像“值得动手试的开源实验”，还不是面向普通用户的一键工具。&lt;/p&gt;
&lt;h2 id=&#34;和通用推理工具的区别&#34;&gt;和通用推理工具的区别
&lt;/h2&gt;&lt;p&gt;通用推理工具通常追求模型格式、平台、后端和 API 的广泛兼容。&lt;code&gt;ds4&lt;/code&gt; 的方向更窄：围绕 DeepSeek V4 Flash 和 Metal 做本地运行。&lt;/p&gt;
&lt;p&gt;这种选择有利有弊。&lt;/p&gt;
&lt;p&gt;好处是实现可以更集中，性能和体验更容易围绕单一目标优化。代价是适用范围有限，不适合拿来运行各种不同模型，也不适合替代完整的部署平台。&lt;/p&gt;
&lt;p&gt;如果你已经在用 &lt;code&gt;llama.cpp&lt;/code&gt; 或 Ollama，&lt;code&gt;ds4&lt;/code&gt; 可以作为补充测试工具，而不是马上替换现有工作流。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ds4&lt;/code&gt; 的看点不在“又一个本地大模型工具”，而在于它把范围收得很窄：DeepSeek V4 Flash、Apple Silicon、Metal、本地推理。&lt;/p&gt;
&lt;p&gt;如果你手上有合适的 Mac，并且愿意折腾早期项目，可以关注它后续的性能表现、模型支持方式和 server/agent 能力演进。对于生产环境，建议继续观望，等接口和使用方式稳定后再评估。&lt;/p&gt;
&lt;h2 id=&#34;参考&#34;&gt;参考
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHub 项目：&lt;a class=&#34;link&#34; href=&#34;https://github.com/antirez/ds4&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/antirez/ds4&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Pixelle-Video：一句主题生成短视频的开源 AI 引擎</title>
        <link>https://knightli.com/2026/05/07/pixelle-video-ai-short-video-engine/</link>
        <pubDate>Thu, 07 May 2026 20:25:17 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/07/pixelle-video-ai-short-video-engine/</guid>
        <description>&lt;p&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/AIDC-AI/Pixelle-Video&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Pixelle-Video&lt;/a&gt; 是 AIDC-AI 开源的全自动短视频生成引擎。它的目标很直白：用户输入一个主题，系统自动完成视频文案、AI 配图或视频、语音解说、背景音乐和最终合成。&lt;/p&gt;
&lt;p&gt;这类工具适合短视频批量创作、知识科普、口播内容、小说解说、历史文化类视频和自媒体素材实验。它不是单一的“文生视频模型”，而是把多种 AI 能力接成一条生产流水线。&lt;/p&gt;
&lt;h2 id=&#34;它能自动做什么&#34;&gt;它能自动做什么
&lt;/h2&gt;&lt;p&gt;Pixelle-Video 的默认流程可以概括为：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;输入主题或固定文案；&lt;/li&gt;
&lt;li&gt;由大语言模型生成解说词；&lt;/li&gt;
&lt;li&gt;根据分镜规划生成配图或视频素材；&lt;/li&gt;
&lt;li&gt;使用 TTS 生成语音解说；&lt;/li&gt;
&lt;li&gt;添加背景音乐；&lt;/li&gt;
&lt;li&gt;套用视频模板并合成最终成片。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;README 中给出的流程是“文案生成 → 配图规划 → 逐帧处理 → 视频合成”。这种模块化设计的好处是清晰：每一步都可以替换模型、调整参数或改用自定义工作流。&lt;/p&gt;
&lt;h2 id=&#34;功能亮点&#34;&gt;功能亮点
&lt;/h2&gt;&lt;p&gt;项目支持的能力比较完整：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;AI 智能文案：根据主题自动生成视频解说词；&lt;/li&gt;
&lt;li&gt;AI 配图：为每句话或每个分镜生成插图；&lt;/li&gt;
&lt;li&gt;AI 视频生成：支持接入 WAN 2.1 等视频生成模型；&lt;/li&gt;
&lt;li&gt;TTS 语音：支持 Edge-TTS、Index-TTS 等方案；&lt;/li&gt;
&lt;li&gt;背景音乐：可以使用内置 BGM，也可以放入自定义音乐；&lt;/li&gt;
&lt;li&gt;多尺寸输出：支持竖屏、横屏等不同视频比例；&lt;/li&gt;
&lt;li&gt;多模型选择：可接入 GPT、通义千问、DeepSeek、Ollama 等；&lt;/li&gt;
&lt;li&gt;ComfyUI 工作流：可以使用预置工作流，也可以替换生图、TTS、视频生成等环节。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;最近更新里还提到动作迁移、数字人口播、图生视频、多语言 TTS 音色、RunningHub 支持、Windows 一键整合包等内容。这说明项目已经不只是一个脚本，而是在往完整创作工具方向发展。&lt;/p&gt;
&lt;h2 id=&#34;安装和启动方式&#34;&gt;安装和启动方式
&lt;/h2&gt;&lt;p&gt;Windows 用户可以优先看官方提供的一键整合包。它的定位是降低安装门槛，不需要手动准备 Python、uv 或 ffmpeg，解压后运行 &lt;code&gt;start.bat&lt;/code&gt;，再在浏览器里打开 Web 界面配置 API 和图像生成服务。&lt;/p&gt;
&lt;p&gt;如果从源码启动，README 给出的基本方式是：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;git clone https://github.com/AIDC-AI/Pixelle-Video.git
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;&lt;span class=&#34;nb&#34;&gt;cd&lt;/span&gt; Pixelle-Video
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;uv run streamlit run web/app.py
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;源码方式适合 macOS、Linux 用户，也适合需要修改模板、工作流或服务配置的人。前置依赖主要是 &lt;code&gt;uv&lt;/code&gt; 和 &lt;code&gt;ffmpeg&lt;/code&gt;。&lt;/p&gt;
&lt;h2 id=&#34;配置重点&#34;&gt;配置重点
&lt;/h2&gt;&lt;p&gt;第一次使用时，关键不是先点“生成”，而是把几个外部能力接好。&lt;/p&gt;
&lt;p&gt;LLM 配置决定文案质量。你可以选择通义千问、GPT、DeepSeek、Ollama 等模型，并填写对应的 API Key、Base URL 和模型名。如果想尽量降低成本，本地 Ollama 是一个方向；如果追求稳定效果，云端模型会更省心。&lt;/p&gt;
&lt;p&gt;图像和视频生成配置决定画面质量。项目支持本地 ComfyUI，也支持 RunningHub。懂 ComfyUI 的用户可以把自己的工作流放进 &lt;code&gt;workflows/&lt;/code&gt; 目录，用来替换默认生图、视频或 TTS 流程。&lt;/p&gt;
&lt;p&gt;模板配置决定最终成片的视觉形态。项目用 &lt;code&gt;templates/&lt;/code&gt; 目录组织视频模板，静态模板、图片模板和视频模板按命名规则区分。对内容创作者来说，这比只生成一段素材更实用，因为最终交付物是可以直接预览和下载的视频。&lt;/p&gt;
&lt;h2 id=&#34;适合什么人&#34;&gt;适合什么人
&lt;/h2&gt;&lt;p&gt;Pixelle-Video 比较适合三类用户：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;短视频创作者&lt;/strong&gt;：想快速把选题变成可发布的草稿视频；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;AIGC 工具玩家&lt;/strong&gt;：想把 LLM、ComfyUI、TTS 和视频合成串起来；&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;开发者和自动化用户&lt;/strong&gt;：想基于开源项目改模板、改工作流，甚至接入自己的素材和模型。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果你只想偶尔做一个高质量精品视频，它未必能直接替代人工剪辑；但如果你想批量生成结构一致的解释类、口播类、科普类内容，它的流水线思路很有价值。&lt;/p&gt;
&lt;h2 id=&#34;需要注意的地方&#34;&gt;需要注意的地方
&lt;/h2&gt;&lt;p&gt;这类工具的上限由多个环节共同决定。文案模型不好，内容会空；配图模型不好，画面会散；TTS 不自然，视频会显得粗糙；模板不合适，最终成片也会缺少辨识度。&lt;/p&gt;
&lt;p&gt;所以使用 Pixelle-Video 时，建议先从一个固定场景开始调试，比如“60 秒知识科普竖屏视频”。把 LLM、画面风格、TTS 音色、BGM 和模板固定下来，再逐步扩大到其他主题。&lt;/p&gt;
&lt;p&gt;另外，项目虽然支持本地免费方案，但本地方案通常需要显卡、ComfyUI 配置和模型文件。没有本地推理环境的用户，可以用云端 LLM 加 RunningHub 的方式降低部署难度，但要留意调用成本。&lt;/p&gt;
&lt;h2 id=&#34;简短判断&#34;&gt;简短判断
&lt;/h2&gt;&lt;p&gt;Pixelle-Video 的看点不只是“输入一句话生成视频”，而是它把短视频生产拆成可替换的模块：文案、画面、语音、音乐、模板和合成。对普通用户，它是一个低门槛 AI 视频工具；对开发者，它更像一个可改造的短视频自动化框架。&lt;/p&gt;
&lt;p&gt;如果你正在研究 AI 短视频流水线，或者想把 ComfyUI、TTS、LLM 和模板合成串成一个可用产品，Pixelle-Video 值得试用和拆解。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>Warp 开源：从终端到 Agentic Development Environment</title>
        <link>https://knightli.com/2026/05/07/warpdotdev-warp-open-source-agentic-terminal/</link>
        <pubDate>Thu, 07 May 2026 20:15:08 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/07/warpdotdev-warp-open-source-agentic-terminal/</guid>
        <description>&lt;p&gt;&lt;code&gt;warpdotdev/warp&lt;/code&gt; 是 Warp 的开源客户端仓库。Warp 官方现在把它定位为一个“从终端生长出来的 agentic development environment”，也就是以终端为基础，但把 AI coding agent、代码库索引、任务管理和开发工作流放进同一个环境里。&lt;/p&gt;
&lt;p&gt;这不是一个普通的终端模拟器开源仓库。它更像是在回答一个问题：当 Claude Code、Codex、Gemini CLI 这类 agent 越来越常见时，终端本身要不要变成一个能调度、观察和管理 agent 的开发环境？&lt;/p&gt;
&lt;p&gt;Warp 的答案是：要。&lt;/p&gt;
&lt;h2 id=&#34;这个仓库现在是什么状态&#34;&gt;这个仓库现在是什么状态
&lt;/h2&gt;&lt;p&gt;截至 2026 年 5 月 7 日查看，&lt;code&gt;warpdotdev/warp&lt;/code&gt; 是公开仓库，GitHub 页面显示约 56k stars、4.1k forks。仓库 README 说明，Warp 的客户端代码已经开源，并欢迎社区贡献。&lt;/p&gt;
&lt;p&gt;仓库的主语言是 Rust。GitHub 语言统计里，Rust 占比超过 98%。这和 Warp 的定位一致：它不是网页壳，而是一个跨平台的原生开发工具。&lt;/p&gt;
&lt;p&gt;README 中有几个信息点很重要：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Warp 是一个 agentic development environment, born out of the terminal。&lt;/li&gt;
&lt;li&gt;它可以使用内置 coding agent，也可以接入 Claude Code、Codex、Gemini CLI 等外部 CLI agent。&lt;/li&gt;
&lt;li&gt;OpenAI 是新开源 Warp 仓库的 founding sponsor。&lt;/li&gt;
&lt;li&gt;仓库中的 agentic management workflows 由 GPT models 驱动。&lt;/li&gt;
&lt;li&gt;Warp UI 框架相关 crate 使用 MIT license，其余代码使用 AGPL v3。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些信息说明，Warp 开源不是单纯把一个终端放出来，而是把它作为“agent 工作流实验场”来运营。&lt;/p&gt;
&lt;h2 id=&#34;warp-不只是终端&#34;&gt;Warp 不只是终端
&lt;/h2&gt;&lt;p&gt;传统终端主要解决三个问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;启动 shell。&lt;/li&gt;
&lt;li&gt;执行命令。&lt;/li&gt;
&lt;li&gt;显示输出。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Warp 早期的差异化，是让终端更现代：命令块、补全、历史、协作、UI 化交互、跨平台体验。现在它的重心继续往前走，开始围绕 AI agent 组织开发流程。&lt;/p&gt;
&lt;p&gt;从 README 看，Warp 不再只强调“更好用的 terminal”，而是强调：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;内置 coding agent。&lt;/li&gt;
&lt;li&gt;支持外部 CLI agent。&lt;/li&gt;
&lt;li&gt;issue triage。&lt;/li&gt;
&lt;li&gt;spec 编写。&lt;/li&gt;
&lt;li&gt;PR review。&lt;/li&gt;
&lt;li&gt;contributor coordination。&lt;/li&gt;
&lt;li&gt;可观察的 agent sessions。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;也就是说，Warp 想把终端从“你输入命令的地方”，变成“你和多个 agent 一起工作的地方”。&lt;/p&gt;
&lt;h2 id=&#34;oz-和开源项目管理&#34;&gt;Oz 和开源项目管理
&lt;/h2&gt;&lt;p&gt;README 里多次提到 &lt;code&gt;Oz&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;Warp 的贡献概览页面可以看到成千上万个 Oz agents 在做 issue triage、写 specs、实现改动、review PR。这个设计很有意思，因为它把 AI agent 从“帮个人写代码”扩展到了“帮开源项目管理协作”。&lt;/p&gt;
&lt;p&gt;传统开源项目最难的不是写代码，而是维护：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;issue 太多，没人分类。&lt;/li&gt;
&lt;li&gt;bug 和 feature request 混在一起。&lt;/li&gt;
&lt;li&gt;新贡献者不知道哪些任务能做。&lt;/li&gt;
&lt;li&gt;PR review 压力大。&lt;/li&gt;
&lt;li&gt;维护者很难持续跟进社区讨论。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Warp 的思路是，让 agent 先承担一部分项目管理和协作工作。README 中还提到 &lt;code&gt;Oz for OSS&lt;/code&gt;，这是面向维护者的合作计划，用于把类似 agentic open-source management workflows 带到其他开源仓库。&lt;/p&gt;
&lt;p&gt;这说明 Warp 的野心不只是终端产品本身，也包括探索 AI 时代开源维护的新模式。&lt;/p&gt;
&lt;h2 id=&#34;仓库结构和技术栈&#34;&gt;仓库结构和技术栈
&lt;/h2&gt;&lt;p&gt;从仓库结构看，Warp 是一个大型 Rust 项目。&lt;/p&gt;
&lt;p&gt;根目录里能看到：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;app/&lt;/code&gt;：主应用相关代码。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/&lt;/code&gt;：核心 Rust crates。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;assets/&lt;/code&gt;：资源文件。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;command-signatures-v2/&lt;/code&gt;：命令签名相关内容。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;docker/&lt;/code&gt;、&lt;code&gt;script/&lt;/code&gt;、&lt;code&gt;resources/&lt;/code&gt;、&lt;code&gt;specs/&lt;/code&gt; 等工程目录。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;.claude/&lt;/code&gt;、&lt;code&gt;.warp/&lt;/code&gt;、&lt;code&gt;.agents/skills&lt;/code&gt; 等 agent 相关配置。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;code&gt;WARP.md&lt;/code&gt; 里给出了更详细的工程说明。它提到 Warp 是 Rust-based terminal emulator，并使用一个自研 UI 框架 &lt;code&gt;WarpUI&lt;/code&gt;。&lt;/p&gt;
&lt;p&gt;主要模块可以粗略理解为：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;app/&lt;/code&gt;：终端模拟、shell 管理、AI 集成、Drive、认证、设置、workspace 和 session。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/warp_core/&lt;/code&gt;：核心工具和平台抽象。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/editor/&lt;/code&gt;：文本编辑功能。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/warpui/&lt;/code&gt; 和 &lt;code&gt;crates/warpui_core/&lt;/code&gt;：自研 UI 框架。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/ipc/&lt;/code&gt;：进程间通信。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;crates/graphql/&lt;/code&gt;：GraphQL 客户端和 schema。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;WARP.md 还提到几个架构特点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Entity-Handle system。&lt;/li&gt;
&lt;li&gt;模块化 workspace 结构。&lt;/li&gt;
&lt;li&gt;macOS、Windows、Linux 跨平台，以及 WASM target。&lt;/li&gt;
&lt;li&gt;AI integration，包含 Agent Mode、上下文感知和代码库索引。&lt;/li&gt;
&lt;li&gt;Warp Drive 云同步。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这说明 Warp 的复杂度已经接近一个完整 IDE，而不是传统意义上的轻量 terminal。&lt;/p&gt;
&lt;h2 id=&#34;本地构建方式&#34;&gt;本地构建方式
&lt;/h2&gt;&lt;p&gt;README 给出的本地构建方式很简洁：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./script/bootstrap
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./script/run
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;./script/presubmit
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;其中：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;./script/bootstrap&lt;/code&gt;：执行平台相关初始化。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;./script/run&lt;/code&gt;：构建并运行 Warp。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;./script/presubmit&lt;/code&gt;：执行格式化、clippy 和测试等提交前检查。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;WARP.md 里还列出了更细的命令：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;2
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;3
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;4
&lt;/span&gt;&lt;span class=&#34;lnt&#34;&gt;5
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo run
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo bundle --bin warp
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo nextest run --no-fail-fast --workspace --exclude command-signatures-v2
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo fmt
&lt;/span&gt;&lt;/span&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;cargo clippy --workspace --all-targets --all-features --tests -- -D warnings
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果要给 Warp 提交代码，&lt;code&gt;./script/presubmit&lt;/code&gt; 基本是必须跑的。&lt;/p&gt;
&lt;h2 id=&#34;贡献流程&#34;&gt;贡献流程
&lt;/h2&gt;&lt;p&gt;Warp 的贡献流程不是简单“发 PR 就行”。&lt;/p&gt;
&lt;p&gt;README 描述了一个从 issue 到 PR 的轻量流程：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;先搜索已有 issue。&lt;/li&gt;
&lt;li&gt;没有重复再提交 bug 或 feature request。&lt;/li&gt;
&lt;li&gt;维护者会 review issue，并可能打上 readiness label。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;ready-to-spec&lt;/code&gt; 表示设计可以被贡献者展开成 spec。&lt;/li&gt;
&lt;li&gt;&lt;code&gt;ready-to-implement&lt;/code&gt; 表示设计已相对明确，可以开始写代码 PR。&lt;/li&gt;
&lt;li&gt;贡献者可以认领带标签的 issue。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这个流程适合大型开源项目。它把“想法”“设计”“实现”拆开，减少贡献者一上来就写错方向的风险。&lt;/p&gt;
&lt;p&gt;对 AI agent 来说，这也很适合。agent 可以先整理 issue、写 spec、补测试，再进入实现。Warp 自己也在用这种方式展示 agentic project management。&lt;/p&gt;
&lt;h2 id=&#34;许可mit--agpl-v3&#34;&gt;许可：MIT + AGPL v3
&lt;/h2&gt;&lt;p&gt;Warp 采用双许可结构。&lt;/p&gt;
&lt;p&gt;README 说明：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Warp UI framework，也就是 &lt;code&gt;warpui_core&lt;/code&gt; 和 &lt;code&gt;warpui&lt;/code&gt; crates，使用 MIT license。&lt;/li&gt;
&lt;li&gt;仓库其余代码使用 AGPL v3。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这点很重要。AGPL v3 对网络服务和分发有更强的开源要求。如果你只是学习、研究、贡献代码，问题不大；但如果想把 Warp 代码用于商业产品或闭源衍生项目，就必须认真读 license，必要时咨询法律意见。&lt;/p&gt;
&lt;p&gt;简单说，Warp 是开源了，但不是“随便拿去闭源商用”的宽松许可。&lt;/p&gt;
&lt;h2 id=&#34;值得关注的地方&#34;&gt;值得关注的地方
&lt;/h2&gt;&lt;p&gt;第一，Warp 把终端、agent、项目管理放在一起。&lt;/p&gt;
&lt;p&gt;很多 AI coding 工具仍然是 CLI 或编辑器插件。Warp 试图从终端入口出发，把 agent 任务、代码执行、命令输出、PR 工作流和团队协作整合起来。&lt;/p&gt;
&lt;p&gt;第二，Warp 的开源方式很适合观察 agent 工作流。&lt;/p&gt;
&lt;p&gt;它不只是发布代码，还把贡献概览、agent session、issue triage 和 spec 流程公开出来。对于想研究 AI 如何参与开源协作的人，这个仓库本身就是样本。&lt;/p&gt;
&lt;p&gt;第三，Warp 是一个复杂 Rust 桌面应用。&lt;/p&gt;
&lt;p&gt;如果你想学习 Rust GUI、终端模拟器、跨平台应用、GraphQL 客户端、云同步和 AI 集成，Warp 仓库有不少可看的结构。但它不是小项目，新贡献者需要先读文档和 issue 流程。&lt;/p&gt;
&lt;p&gt;第四，Warp 支持“自带 agent”和“bring your own CLI agent”两条线。&lt;/p&gt;
&lt;p&gt;这点很现实。开发者不会只用一个 agent。Claude Code、Codex、Gemini CLI、OpenCode、OpenClaw 等工具会长期共存。Warp 如果能成为它们的工作台，就比单一终端更有价值。&lt;/p&gt;
&lt;h2 id=&#34;适合谁关注&#34;&gt;适合谁关注
&lt;/h2&gt;&lt;p&gt;如果你是普通终端用户，关注 Warp 的意义在于：终端可能正在从命令行工具变成 AI 工作台。&lt;/p&gt;
&lt;p&gt;如果你是 AI coding agent 重度用户，Warp 值得关注，因为它试图管理多个 agent，而不是只做一个聊天入口。&lt;/p&gt;
&lt;p&gt;如果你是开源维护者，可以关注 Oz for OSS 这条线。它试图用 agent 做 issue triage、PR review、社区协作和贡献者引导。&lt;/p&gt;
&lt;p&gt;如果你是 Rust 开发者，Warp 是一个大型真实桌面应用样本，可以研究它如何组织 UI、终端、云同步、AI 集成和跨平台代码。&lt;/p&gt;
&lt;p&gt;如果你只是想找一个能马上替代传统终端的工具，建议先下载正式版使用，再决定是否研究源码。直接从源码构建更适合贡献者和深度玩家。&lt;/p&gt;
&lt;h2 id=&#34;简短判断&#34;&gt;简短判断
&lt;/h2&gt;&lt;p&gt;Warp 开源的重点，不只是“一个现代终端开源了”。&lt;/p&gt;
&lt;p&gt;更准确地说，Warp 正在把终端升级成 agentic development environment：终端负责连接 shell、代码库、命令执行、agent、issue、PR 和协作流程。&lt;/p&gt;
&lt;p&gt;在 AI coding agent 继续增长的背景下，开发环境的入口可能会发生变化。过去是 IDE 统治开发体验，终端负责命令执行；现在终端可能反过来成为 agent 协作的中心。Warp 这个仓库，正是在探索这种可能性。&lt;/p&gt;
&lt;h2 id=&#34;相关链接&#34;&gt;相关链接
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;GitHub 仓库：&lt;a class=&#34;link&#34; href=&#34;https://github.com/warpdotdev/warp&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/warpdotdev/warp&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Warp 官网：&lt;a class=&#34;link&#34; href=&#34;https://www.warp.dev&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://www.warp.dev&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Warp 文档：&lt;a class=&#34;link&#34; href=&#34;https://docs.warp.dev&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://docs.warp.dev&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;Warp 构建概览：&lt;a class=&#34;link&#34; href=&#34;https://build.warp.dev&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://build.warp.dev&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;WARP.md：&lt;a class=&#34;link&#34; href=&#34;https://github.com/warpdotdev/warp/blob/master/WARP.md&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/warpdotdev/warp/blob/master/WARP.md&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;CONTRIBUTING.md：&lt;a class=&#34;link&#34; href=&#34;https://github.com/warpdotdev/warp/blob/master/CONTRIBUTING.md&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/warpdotdev/warp/blob/master/CONTRIBUTING.md&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
