<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>前端开发 on KnightLi的博客</title>
        <link>https://knightli.com/tags/%E5%89%8D%E7%AB%AF%E5%BC%80%E5%8F%91/</link>
        <description>Recent content in 前端开发 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sat, 06 Jun 2026 22:26:00 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/%E5%89%8D%E7%AB%AF%E5%BC%80%E5%8F%91/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>CopilotKit 怎么用？给前端应用接入 AI Copilot 和 Generative UI</title>
        <link>https://knightli.com/2026/06/06/copilotkit-frontend-ai-copilot/</link>
        <pubDate>Sat, 06 Jun 2026 22:26:00 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/copilotkit-frontend-ai-copilot/</guid>
        <description>&lt;p&gt;&lt;code&gt;CopilotKit/CopilotKit&lt;/code&gt; 是一个面向前端应用的 AI Copilot 框架。它的定位不是“再做一个聊天框”，而是给 React、Angular、移动端、Slack 等应用接入 Agent、Generative UI 和上下文感知交互。&lt;/p&gt;
&lt;p&gt;如果你的产品里只是想放一个 FAQ 机器人，CopilotKit 可能有点重；如果你想让 AI 真正理解当前页面状态、操作业务对象、生成 UI、辅助用户完成工作流，它就更有价值。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;很多产品接 AI 的第一步是加聊天框，但聊天框和应用本身往往是割裂的：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;AI 不知道用户当前页面；&lt;/li&gt;
&lt;li&gt;不知道表单、列表、选中项和业务状态；&lt;/li&gt;
&lt;li&gt;只能回答问题，不能参与操作；&lt;/li&gt;
&lt;li&gt;生成的内容很难变成真实 UI；&lt;/li&gt;
&lt;li&gt;前端和 Agent 后端协议不统一。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;CopilotKit 想做的是“Agent-native frontend stack”，让 AI 和前端状态、组件、动作更自然地连起来。&lt;/p&gt;
&lt;h2 id=&#34;适合哪些场景&#34;&gt;适合哪些场景
&lt;/h2&gt;&lt;p&gt;它适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;SaaS 产品里的智能助手；&lt;/li&gt;
&lt;li&gt;表单填写和业务流程引导；&lt;/li&gt;
&lt;li&gt;数据看板里的自然语言分析；&lt;/li&gt;
&lt;li&gt;复杂后台系统的操作辅助；&lt;/li&gt;
&lt;li&gt;Generative UI 组件生成；&lt;/li&gt;
&lt;li&gt;前端应用与 Agent 后端联动；&lt;/li&gt;
&lt;li&gt;想研究 AG-UI Protocol 的团队。&lt;/li&gt;
&lt;/ul&gt;
&lt;h2 id=&#34;使用边界&#34;&gt;使用边界
&lt;/h2&gt;&lt;p&gt;CopilotKit 不是让 AI 随便控制你的应用。真正落地时，权限设计很重要：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;哪些动作可以自动执行；&lt;/li&gt;
&lt;li&gt;哪些动作必须二次确认；&lt;/li&gt;
&lt;li&gt;AI 能看到哪些页面数据；&lt;/li&gt;
&lt;li&gt;错误操作如何回滚；&lt;/li&gt;
&lt;li&gt;用户隐私和审计日志怎么处理。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;前端 Copilot 的关键不是“模型回答多聪明”，而是“它能否在正确上下文里安全地帮用户做事”。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;CopilotKit 适合想把 AI 深度嵌入产品前端的开发者。它比普通聊天组件更进一步，关注 Agent、Generative UI 和应用状态联动。&lt;/p&gt;
&lt;p&gt;如果你正在做 AI 原生产品界面，可以认真看看它；如果只是简单客服问答，用更轻的聊天组件可能就够了。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/CopilotKit/CopilotKit&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;CopilotKit/CopilotKit - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>HyperFrames 怎么用？用 HTML 写视频的 Agent 友好工具</title>
        <link>https://knightli.com/2026/06/06/hyperframes-html-video-rendering/</link>
        <pubDate>Sat, 06 Jun 2026 22:26:00 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/hyperframes-html-video-rendering/</guid>
        <description>&lt;p&gt;&lt;code&gt;heygen-com/hyperframes&lt;/code&gt; 的定位很直白：Write HTML. Render video. Built for agents. 也就是用 HTML 写画面，再把它渲染成视频。&lt;/p&gt;
&lt;p&gt;这类工具很适合 AI Agent。原因很简单：让模型直接生成传统视频工程文件很麻烦，但让模型写 HTML、CSS、布局和动画，它已经很熟了。如果能把 HTML 画面稳定渲染成视频，AI 生成短视频、产品演示、动态图文和说明视频就会简单很多。&lt;/p&gt;
&lt;h2 id=&#34;它解决什么问题&#34;&gt;它解决什么问题
&lt;/h2&gt;&lt;p&gt;现在做程序化视频通常有几条路：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;用 After Effects 模板，灵活但自动化复杂；&lt;/li&gt;
&lt;li&gt;用 Remotion 这类 React 视频框架，开发体验好但需要写组件；&lt;/li&gt;
&lt;li&gt;用 Canvas / FFmpeg 手搓，控制强但门槛高；&lt;/li&gt;
&lt;li&gt;用 AI 视频模型生成，视觉强但可控性不稳定；&lt;/li&gt;
&lt;li&gt;用 PPT 或图片拼接，简单但表达有限。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;HyperFrames 的思路更前端：既然 HTML 本来就擅长排版、图片、文字、组件和动效，那就把视频当作一段可渲染的网页时间线。&lt;/p&gt;
&lt;h2 id=&#34;适合什么场景&#34;&gt;适合什么场景
&lt;/h2&gt;&lt;p&gt;HyperFrames 更适合结构化、可控的视频，而不是电影级生成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;产品功能演示；&lt;/li&gt;
&lt;li&gt;SaaS onboarding 视频；&lt;/li&gt;
&lt;li&gt;数据报告动态图；&lt;/li&gt;
&lt;li&gt;社交媒体短图文；&lt;/li&gt;
&lt;li&gt;自动生成课程片段；&lt;/li&gt;
&lt;li&gt;AI Agent 根据文案生成视觉脚本；&lt;/li&gt;
&lt;li&gt;批量生成不同语言、不同数据版本的视频。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不适合替代真实拍摄，也不适合追求复杂人物动作、真实光影和电影镜头的场景。HTML 视频的优势是可控、可重复、可程序化。&lt;/p&gt;
&lt;h2 id=&#34;为什么对-agent-友好&#34;&gt;为什么对 Agent 友好
&lt;/h2&gt;&lt;p&gt;AI Agent 很擅长生成这些东西：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;HTML 结构；&lt;/li&gt;
&lt;li&gt;CSS 布局；&lt;/li&gt;
&lt;li&gt;Tailwind 类名；&lt;/li&gt;
&lt;li&gt;SVG / 图标；&lt;/li&gt;
&lt;li&gt;文案层级；&lt;/li&gt;
&lt;li&gt;简单动画；&lt;/li&gt;
&lt;li&gt;数据驱动组件。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;但 Agent 不擅长直接控制传统视频软件。HyperFrames 把视频表达转成 HTML，等于把视频生成问题拉回到前端工程领域。这样 Codex、Claude Code、Cursor 之类工具就可以参与：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;根据脚本生成页面；&lt;/li&gt;
&lt;li&gt;调整标题、字幕、卡片和转场；&lt;/li&gt;
&lt;li&gt;批量替换文案和数据；&lt;/li&gt;
&lt;li&gt;用设计规范约束视觉风格；&lt;/li&gt;
&lt;li&gt;把同一模板渲染成多条视频。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这比“让模型凭空生成视频”更工程化，也更容易复现。&lt;/p&gt;
&lt;h2 id=&#34;使用时要注意什么&#34;&gt;使用时要注意什么
&lt;/h2&gt;&lt;p&gt;HTML 写视频有优势，也有边界：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;字体、图片和外部资源要可稳定加载；&lt;/li&gt;
&lt;li&gt;动画时间线要明确，不然渲染结果容易飘；&lt;/li&gt;
&lt;li&gt;响应式布局不等于视频布局，分辨率应该固定；&lt;/li&gt;
&lt;li&gt;视频里的文字必须检查可读性；&lt;/li&gt;
&lt;li&gt;如果要批量生成，模板变量和数据校验很重要；&lt;/li&gt;
&lt;li&gt;AI 生成的 HTML 要经过截图和预览检查，不能直接信。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;尤其是商业视频，不要只看第一帧。要完整看一遍，确认动效、遮挡、字幕、图片加载和结尾都正常。&lt;/p&gt;
&lt;h2 id=&#34;和-ai-视频模型的区别&#34;&gt;和 AI 视频模型的区别
&lt;/h2&gt;&lt;p&gt;AI 视频模型适合“生成真实或风格化画面”，HyperFrames 更适合“把明确内容变成视频”。&lt;/p&gt;
&lt;p&gt;简单对比：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;方向&lt;/th&gt;
          &lt;th&gt;优势&lt;/th&gt;
          &lt;th&gt;短板&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;AI 视频模型&lt;/td&gt;
          &lt;td&gt;真实感、镜头感、风格化强&lt;/td&gt;
          &lt;td&gt;字幕、排版、产品 UI、细节一致性不稳定&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;HTML 渲染视频&lt;/td&gt;
          &lt;td&gt;字体、布局、数据、品牌规范可控&lt;/td&gt;
          &lt;td&gt;真实人物和复杂镜头不擅长&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;所以它不是和 AI 视频模型抢同一个位置。更现实的组合是：背景、素材、人物视频可以来自 AI 或素材库；标题、数据、UI、字幕和结构化画面用 HTML 管。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;HyperFrames 的价值在于，它把视频生成变成前端开发问题。对 AI Agent 来说，这非常舒服：模型写 HTML 比控制传统视频软件靠谱得多。&lt;/p&gt;
&lt;p&gt;如果你想批量生成产品演示、课程短片、动态图文、数据报告视频，或者想让 Codex/Claude Code 参与视频模板开发，可以关注这个项目。别指望它替代所有视频生产，但它确实让“写代码出视频”这条路更顺。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/heygen-com/hyperframes&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;heygen-com/hyperframes - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Svelte 还值得学吗？重新理解这个编译型前端框架</title>
        <link>https://knightli.com/2026/06/06/svelte-frontend-framework-guide/</link>
        <pubDate>Sat, 06 Jun 2026 22:26:00 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/svelte-frontend-framework-guide/</guid>
        <description>&lt;p&gt;&lt;code&gt;sveltejs/svelte&lt;/code&gt; 是一个编译型前端框架。它的口号是 “web development for the rest of us”，意思很清楚：让 Web 开发更少样板、更接近直接写 HTML、CSS 和 JavaScript。&lt;/p&gt;
&lt;p&gt;和 React、Vue 这类运行时框架相比，Svelte 的核心差异是编译。它在构建阶段把组件编译成更直接的 JavaScript，尽量减少运行时负担。&lt;/p&gt;
&lt;h2 id=&#34;svelte-的特点&#34;&gt;Svelte 的特点
&lt;/h2&gt;&lt;p&gt;Svelte 最吸引人的地方通常是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;写法简洁，模板感少；&lt;/li&gt;
&lt;li&gt;响应式语法直接；&lt;/li&gt;
&lt;li&gt;组件文件结构清晰；&lt;/li&gt;
&lt;li&gt;编译期做更多工作；&lt;/li&gt;
&lt;li&gt;产物相对轻；&lt;/li&gt;
&lt;li&gt;学习曲线对普通前端更友好；&lt;/li&gt;
&lt;li&gt;配合 SvelteKit 可以做完整应用。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它适合喜欢“少一点框架仪式感”的开发者。很多时候，你写出来的代码更像增强版 HTML，而不是一堆状态管理和 hooks 拼装。&lt;/p&gt;
&lt;h2 id=&#34;适合哪些项目&#34;&gt;适合哪些项目
&lt;/h2&gt;&lt;p&gt;Svelte 适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;交互型网站；&lt;/li&gt;
&lt;li&gt;小到中型 Web App；&lt;/li&gt;
&lt;li&gt;文档站和内容产品；&lt;/li&gt;
&lt;li&gt;数据可视化页面；&lt;/li&gt;
&lt;li&gt;需要轻量产物的前端项目；&lt;/li&gt;
&lt;li&gt;个人工具和独立开发产品。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;如果团队已经深度押注 React 生态，或者依赖大量 React 组件库，迁移成本要认真评估。Svelte 好用，不代表每个团队都应该换。&lt;/p&gt;
&lt;h2 id=&#34;和-react--vue-的区别&#34;&gt;和 React / Vue 的区别
&lt;/h2&gt;&lt;p&gt;可以粗略这样理解：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;框架&lt;/th&gt;
          &lt;th&gt;思路&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;React&lt;/td&gt;
          &lt;td&gt;用 JavaScript 表达 UI，生态极大&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Vue&lt;/td&gt;
          &lt;td&gt;模板、响应式和工程化平衡&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;Svelte&lt;/td&gt;
          &lt;td&gt;编译期消化框架复杂度，写法更轻&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;Svelte 的爽感来自简洁，但生态规模、招聘供给、组件库成熟度仍然要按项目实际看。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;Svelte 值得学，尤其适合想理解“编译型前端框架”思路的人。它不是 React 的全面替代品，而是一种更轻、更直接的前端开发路径。&lt;/p&gt;
&lt;p&gt;如果你做个人产品、交互页面或中小型应用，Svelte 会很舒服；如果是大型团队项目，就要把生态、人才和长期维护一起算进去。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/sveltejs/svelte&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;sveltejs/svelte - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Vite 为什么快？现代前端构建工具的默认选择</title>
        <link>https://knightli.com/2026/06/06/vite-next-generation-frontend-tooling/</link>
        <pubDate>Sat, 06 Jun 2026 22:26:00 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/vite-next-generation-frontend-tooling/</guid>
        <description>&lt;p&gt;&lt;code&gt;vitejs/vite&lt;/code&gt; 是现代前端项目里非常常见的构建工具。它的描述很短：Next generation frontend tooling. It&amp;rsquo;s fast! 这句话基本概括了 Vite 的核心卖点：开发启动快、热更新快、配置相对轻。&lt;/p&gt;
&lt;p&gt;如果你这几年新建过 Vue、React、Svelte、Solid 或普通 TypeScript 前端项目，很可能已经用过 Vite。&lt;/p&gt;
&lt;h2 id=&#34;为什么-vite-快&#34;&gt;为什么 Vite 快
&lt;/h2&gt;&lt;p&gt;Vite 的快主要来自两个阶段的取舍：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;开发阶段：利用浏览器原生 ESM，避免一开始把整个项目打包；&lt;/li&gt;
&lt;li&gt;生产阶段：使用 Rollup 做优化构建；&lt;/li&gt;
&lt;li&gt;依赖预构建：用更快的工具处理依赖；&lt;/li&gt;
&lt;li&gt;HMR：模块级热更新，改哪里刷新哪里。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;传统 bundler 往往在项目变大后启动慢、热更新慢。Vite 把开发体验往“按需加载”方向推了一步。&lt;/p&gt;
&lt;h2 id=&#34;适合哪些项目&#34;&gt;适合哪些项目
&lt;/h2&gt;&lt;p&gt;Vite 适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Vue / React / Svelte / Solid 项目；&lt;/li&gt;
&lt;li&gt;TypeScript 前端应用；&lt;/li&gt;
&lt;li&gt;组件库开发；&lt;/li&gt;
&lt;li&gt;静态站点和工具页面；&lt;/li&gt;
&lt;li&gt;中小型 Web App；&lt;/li&gt;
&lt;li&gt;需要快启动和快 HMR 的团队。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;大型项目也可以用，但要注意 monorepo、SSR、插件兼容、构建缓存和 legacy 浏览器支持。&lt;/p&gt;
&lt;h2 id=&#34;使用时要注意什么&#34;&gt;使用时要注意什么
&lt;/h2&gt;&lt;p&gt;Vite 默认体验很好，但不是完全不用配置：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;环境变量前缀和注入规则要理解；&lt;/li&gt;
&lt;li&gt;dev server 代理要配置清楚；&lt;/li&gt;
&lt;li&gt;alias、路径、tsconfig 要对齐；&lt;/li&gt;
&lt;li&gt;SSR 和库模式要单独看文档；&lt;/li&gt;
&lt;li&gt;插件版本和框架版本要匹配；&lt;/li&gt;
&lt;li&gt;生产构建仍然要看包体积和分包。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;不要把“开发快”误解成“生产构建不用管”。上线前仍然要看性能、缓存和兼容性。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;Vite 已经成为现代前端默认选项之一。它不是因为概念复杂而流行，而是因为日常开发体验确实轻快。&lt;/p&gt;
&lt;p&gt;如果你还在用很老的脚手架，新项目可以优先试 Vite；老项目迁移则要先评估插件、构建流程和团队习惯。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/vitejs/vite&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;vitejs/vite - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Taste Skill 怎么用？给 AI 前端生成加一点审美约束</title>
        <link>https://knightli.com/2026/06/06/taste-skill-ai-frontend-design/</link>
        <pubDate>Sat, 06 Jun 2026 22:22:56 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/taste-skill-ai-frontend-design/</guid>
        <description>&lt;p&gt;&lt;code&gt;Leonxlnx/taste-skill&lt;/code&gt; 是一个很有意思的前端 Agent Skill 项目。它的目标不是再做一个 UI 组件库，而是给 Codex、Cursor、Claude Code 这类 AI 编程工具加一套“审美约束”，减少那种一眼 AI 味的模板界面。&lt;/p&gt;
&lt;p&gt;项目 README 里把它叫做 Anti-Slop Frontend Framework。这个说法有点夸张，但方向很准：AI 写前端最大的问题，经常不是不会写代码，而是默认布局太平、层级太弱、间距像自动生成、动效和字体都没有判断。&lt;/p&gt;
&lt;h2 id=&#34;它到底是什么&#34;&gt;它到底是什么
&lt;/h2&gt;&lt;p&gt;Taste Skill 本质上是一组可安装、可复制、可粘贴的 Agent Skills。它们不是运行时依赖，也不是浏览器插件，而是给 AI Agent 的工作规则。&lt;/p&gt;
&lt;p&gt;它会要求模型在生成前端时更关注：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;layout：布局不要只会居中卡片；&lt;/li&gt;
&lt;li&gt;typography：字号、字重、行高要有层级；&lt;/li&gt;
&lt;li&gt;spacing：留白、边距、密度要符合场景；&lt;/li&gt;
&lt;li&gt;motion：动效要服务交互，不是随便加动画；&lt;/li&gt;
&lt;li&gt;design language：根据产品类型推断设计语言；&lt;/li&gt;
&lt;li&gt;anti-slop：避免模板感、占位符和半成品输出。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类 skill 的价值不在于“多写几句 prompt”，而是把一些前端审美判断固定成可复用规则，让不同项目里都能调用。&lt;/p&gt;
&lt;h2 id=&#34;怎么安装&#34;&gt;怎么安装
&lt;/h2&gt;&lt;p&gt;README 推荐用 &lt;code&gt;npx skills add&lt;/code&gt; 安装：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;npx skills add https://github.com/Leonxlnx/taste-skill
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果只安装默认前端设计 skill，可以指定：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;npx skills add https://github.com/Leonxlnx/taste-skill --skill &lt;span class=&#34;s2&#34;&gt;&amp;#34;design-taste-frontend&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;如果你依赖旧版行为，也可以安装 v1：&lt;/p&gt;
&lt;div class=&#34;highlight&#34;&gt;&lt;div class=&#34;chroma&#34;&gt;
&lt;table class=&#34;lntable&#34;&gt;&lt;tr&gt;&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code&gt;&lt;span class=&#34;lnt&#34;&gt;1
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;
&lt;td class=&#34;lntd&#34;&gt;
&lt;pre tabindex=&#34;0&#34; class=&#34;chroma&#34;&gt;&lt;code class=&#34;language-bash&#34; data-lang=&#34;bash&#34;&gt;&lt;span class=&#34;line&#34;&gt;&lt;span class=&#34;cl&#34;&gt;npx skills add https://github.com/Leonxlnx/taste-skill --skill &lt;span class=&#34;s2&#34;&gt;&amp;#34;design-taste-frontend-v1&amp;#34;&lt;/span&gt;
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
&lt;/div&gt;
&lt;/div&gt;&lt;p&gt;项目也说明，可以直接复制任意 &lt;code&gt;SKILL.md&lt;/code&gt; 到项目里，或者把内容粘贴到 ChatGPT / Codex 对话中使用。也就是说，它不是必须绑定某个具体平台。&lt;/p&gt;
&lt;h2 id=&#34;内置哪些-skill&#34;&gt;内置哪些 Skill
&lt;/h2&gt;&lt;p&gt;Taste Skill 不是只有一个文件。README 里列了多种 skill：&lt;/p&gt;
&lt;table&gt;
  &lt;thead&gt;
      &lt;tr&gt;
          &lt;th&gt;Skill&lt;/th&gt;
          &lt;th&gt;Install name&lt;/th&gt;
          &lt;th&gt;用途&lt;/th&gt;
      &lt;/tr&gt;
  &lt;/thead&gt;
  &lt;tbody&gt;
      &lt;tr&gt;
          &lt;td&gt;taste-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;design-taste-frontend&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;默认前端审美规则，当前 v2 仍在实验迭代&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;taste-skill-v1&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;design-taste-frontend-v1&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;保留旧版行为&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;gpt-tasteskill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;gpt-taste&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;更适合 GPT / Codex 的严格版本&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;image-to-code-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;image-to-code&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;先生成参考图，再分析，再写代码&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;redesign-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;redesign-existing-projects&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;先审计已有项目，再改 UI&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;soft-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;high-end-visual-design&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;偏高级、柔和、留白充足的视觉方向&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;minimalist-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;minimalist-ui&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;偏 Notion / Linear 风格的克制产品 UI&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;brutalist-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;industrial-brutalist-ui&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;偏工业、瑞士字体、强对比的实验风格&lt;/td&gt;
      &lt;/tr&gt;
      &lt;tr&gt;
          &lt;td&gt;output-skill&lt;/td&gt;
          &lt;td&gt;&lt;code&gt;full-output-enforcement&lt;/code&gt;&lt;/td&gt;
          &lt;td&gt;用来压制半截输出和占位符&lt;/td&gt;
      &lt;/tr&gt;
  &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;另外还有 image generation skills，用来生成网页、移动端和品牌板参考图。它们不直接输出代码，而是产出视觉参考，再交给 Codex、Cursor 或 Claude Code 实现。&lt;/p&gt;
&lt;h2 id=&#34;适合怎么用&#34;&gt;适合怎么用
&lt;/h2&gt;&lt;p&gt;如果你只是让 AI 写一个后台表单，直接说清楚需求也许就够了。但如果你要做：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;产品官网；&lt;/li&gt;
&lt;li&gt;SaaS Dashboard；&lt;/li&gt;
&lt;li&gt;移动端页面；&lt;/li&gt;
&lt;li&gt;品牌落地页；&lt;/li&gt;
&lt;li&gt;作品集；&lt;/li&gt;
&lt;li&gt;高级感工具界面；&lt;/li&gt;
&lt;li&gt;已有项目 UI 重设计；&lt;/li&gt;
&lt;li&gt;从参考图还原前端。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那 Taste Skill 会更有用。它帮你提前约束“这应该是什么气质的界面”，而不是等 AI 生成一堆卡片后再一点点骂回去。&lt;/p&gt;
&lt;p&gt;我会这样用：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;新项目先用 &lt;code&gt;design-taste-frontend&lt;/code&gt;；&lt;/li&gt;
&lt;li&gt;Codex / GPT 项目可以试 &lt;code&gt;gpt-taste&lt;/code&gt;；&lt;/li&gt;
&lt;li&gt;已有项目改版用 &lt;code&gt;redesign-existing-projects&lt;/code&gt;；&lt;/li&gt;
&lt;li&gt;有明确风格时再加 &lt;code&gt;minimalist-ui&lt;/code&gt;、&lt;code&gt;high-end-visual-design&lt;/code&gt; 或 &lt;code&gt;industrial-brutalist-ui&lt;/code&gt;；&lt;/li&gt;
&lt;li&gt;如果 AI 老是留 TODO 或省略代码，再加 &lt;code&gt;full-output-enforcement&lt;/code&gt;。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id=&#34;它不是万能审美按钮&#34;&gt;它不是万能审美按钮
&lt;/h2&gt;&lt;p&gt;Taste Skill 解决的是“AI 前端输出太模板”的问题，但它不是设计师替代品。&lt;/p&gt;
&lt;p&gt;几个边界要说清楚：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;它不能替你定义品牌定位；&lt;/li&gt;
&lt;li&gt;它不能保证每次生成都好看；&lt;/li&gt;
&lt;li&gt;它更适合有前端审美基础的人做二次判断；&lt;/li&gt;
&lt;li&gt;Skill 写得再细，也需要你提供产品背景、受众和功能优先级；&lt;/li&gt;
&lt;li&gt;已有设计系统的团队，不应该让 skill 覆盖内部规范。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;换句话说，它更像一个“前端生成的审美脚手架”。它能把默认下限抬高，但最终效果还是要靠你审稿、截图、调 CSS 和真实设备检查。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;taste-skill&lt;/code&gt; 的价值在于，它把很多前端设计经验变成了 Agent 可执行的规则。对 Codex、Cursor、Claude Code 这类工具来说，这种 skill 很适合补齐“会写代码但容易没品”的短板。&lt;/p&gt;
&lt;p&gt;如果你经常用 AI 生成前端页面，尤其受够了大渐变、大圆角、满屏卡片、随机图标和没层级的模板感界面，可以把它当成一个起点。但别把它当成设计总监，真实项目仍然需要你自己做取舍。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/Leonxlnx/taste-skill&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;Leonxlnx/taste-skill - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        <item>
        <title>Prompt-Vault：一个适合测试 AI 编程能力的 Prompt 规格库</title>
        <link>https://knightli.com/2026/05/15/prompt-vault-coding-prompt-benchmark/</link>
        <pubDate>Fri, 15 May 2026 09:00:52 +0800</pubDate>
        
        <guid>https://knightli.com/2026/05/15/prompt-vault-coding-prompt-benchmark/</guid>
        <description>&lt;p&gt;&lt;code&gt;w512/Prompt-Vault&lt;/code&gt; 是一个很小但有用的 prompt 仓库。它不是收集“万能咒语”，而是把一组可执行的 coding prompt 按难度整理成规格文档，用来测试 LLM 或 coding agent 能不能真正完成一个小项目。&lt;/p&gt;
&lt;p&gt;项目地址：&lt;a class=&#34;link&#34; href=&#34;https://github.com/w512/Prompt-Vault&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;https://github.com/w512/Prompt-Vault&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;截至写作时，这个仓库只有少量文件和提交，但结构很清楚：&lt;code&gt;Easy&lt;/code&gt;、&lt;code&gt;Medium&lt;/code&gt;、&lt;code&gt;Hard&lt;/code&gt; 三个目录，每个 Markdown 文件都是一个独立任务。README 里也写得很直接：这些 prompt 适合测试大语言模型，或者给开发者当练手项目。&lt;/p&gt;
&lt;h2 id=&#34;它不是-prompt-收藏夹&#34;&gt;它不是 prompt 收藏夹
&lt;/h2&gt;&lt;p&gt;很多 prompt 仓库的问题，是内容看起来很多，但很难判断质量。标题很吸引人，真正拿去用时却缺少验收标准。&lt;/p&gt;
&lt;p&gt;Prompt-Vault 更像一个小型规格库。每个任务都尽量写清楚：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;要做什么应用&lt;/li&gt;
&lt;li&gt;必须有哪些功能&lt;/li&gt;
&lt;li&gt;UI 应该是什么风格&lt;/li&gt;
&lt;li&gt;技术约束是什么&lt;/li&gt;
&lt;li&gt;是否必须单文件运行&lt;/li&gt;
&lt;li&gt;是否允许外部依赖&lt;/li&gt;
&lt;li&gt;数据是否需要持久化&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这种结构比“请帮我做一个好看的看板”更适合测试模型。因为它能看出模型是否真的理解需求，而不是只生成一份看似完整的页面。&lt;/p&gt;
&lt;h2 id=&#34;easy测试基础交互&#34;&gt;Easy：测试基础交互
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Easy&lt;/code&gt; 目录里有两个任务。&lt;/p&gt;
&lt;p&gt;第一个是 &lt;code&gt;Bubble_Sort_Visualizer.md&lt;/code&gt;，要求做一个单文件 &lt;code&gt;index.html&lt;/code&gt;，用柱状条实时展示冒泡排序。它要求有开始按钮、重置按钮、速度滑块、比较次数统计和深色主题。&lt;/p&gt;
&lt;p&gt;这个任务适合测试模型的基础前端能力：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;能不能把算法状态映射到 UI&lt;/li&gt;
&lt;li&gt;能不能做动画节奏控制&lt;/li&gt;
&lt;li&gt;能不能正确处理重置和运行状态&lt;/li&gt;
&lt;li&gt;能不能保持代码简单可读&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;第二个是 &lt;code&gt;ToDo_List.md&lt;/code&gt;，从静态 HTML 开始，一步步增加添加任务、完成状态、删除按钮、计数器、Active / Completed 统计和 &lt;code&gt;localStorage&lt;/code&gt; 持久化。&lt;/p&gt;
&lt;p&gt;这个任务看起来普通，但很适合测试模型是否会按步骤演进，而不是一口气堆出一份混乱代码。&lt;/p&gt;
&lt;h2 id=&#34;medium测试复杂状态和动画&#34;&gt;Medium：测试复杂状态和动画
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Medium/Sorting_Visualization.md&lt;/code&gt; 把排序可视化升级了一档。&lt;/p&gt;
&lt;p&gt;它要求同一个页面支持 6 种排序算法：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Bubble Sort&lt;/li&gt;
&lt;li&gt;Insertion Sort&lt;/li&gt;
&lt;li&gt;Selection Sort&lt;/li&gt;
&lt;li&gt;Merge Sort&lt;/li&gt;
&lt;li&gt;Quick Sort&lt;/li&gt;
&lt;li&gt;Heap Sort&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;同时还要有算法选择、速度滑块、数组大小滑块、重置按钮、开始 / 暂停切换，以及实时统计面板。&lt;/p&gt;
&lt;p&gt;这个任务能测出不少问题。很多模型可以写出一个冒泡排序动画，但一旦要支持多个算法、暂停恢复、统计比较次数和交换次数，就容易出现状态混乱。&lt;/p&gt;
&lt;p&gt;如果用它做评测，可以重点看这些点：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;每种算法是否真的按预期排序&lt;/li&gt;
&lt;li&gt;动画是否和算法步骤一致&lt;/li&gt;
&lt;li&gt;暂停后能否继续&lt;/li&gt;
&lt;li&gt;重置是否会停止旧动画&lt;/li&gt;
&lt;li&gt;数组大小变化是否会破坏状态&lt;/li&gt;
&lt;li&gt;统计数据是否可信&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类 prompt 很适合作为前端 coding agent 的中等难度 smoke test。&lt;/p&gt;
&lt;h2 id=&#34;hard测试完整产品感&#34;&gt;Hard：测试完整产品感
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Hard&lt;/code&gt; 目录目前有两个任务。&lt;/p&gt;
&lt;p&gt;一个是 &lt;code&gt;Kanban_Board.md&lt;/code&gt;。它要求做一个完整的看板应用：默认四列、可新增列、双击重命名、空列删除、卡片标题和描述、优先级、截止日期、拖拽、搜索、优先级过滤、&lt;code&gt;localStorage&lt;/code&gt; 持久化、底部统计栏、深色玻璃拟态风格和响应式横向滚动。&lt;/p&gt;
&lt;p&gt;这个 prompt 的价值在于它不是只测单点能力，而是测“产品完整度”：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;原生 Drag &amp;amp; Drop 是否可靠&lt;/li&gt;
&lt;li&gt;新增列和卡片后状态是否持久化&lt;/li&gt;
&lt;li&gt;搜索和过滤是否影响布局&lt;/li&gt;
&lt;li&gt;overdue 逻辑是否正确&lt;/li&gt;
&lt;li&gt;Done 列是否触发视觉状态变化&lt;/li&gt;
&lt;li&gt;删除、重命名、取消、保存这些边界是否完整&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;另一个是 &lt;code&gt;Markdown_Editor_Desktop.md&lt;/code&gt;，要求用 Tauri 2 做跨平台 Markdown 编辑器。它包含分栏编辑与预览、同步滚动、实时渲染、预览模式、专注模式、打开文件、保存、另存为、窗口标题未保存标记、格式化工具栏、快捷键、主题、字体设置、Vue 3、Pinia、&lt;code&gt;marked.js&lt;/code&gt;、&lt;code&gt;prism.js&lt;/code&gt; 和 Tauri 插件。&lt;/p&gt;
&lt;p&gt;这已经不是普通网页 prompt，而是一个能测试桌面应用工程能力的规格。模型需要理解前端状态、Tauri 插件、文件系统权限、IPC 边界和跨平台打包。&lt;/p&gt;
&lt;h2 id=&#34;为什么这种仓库有价值&#34;&gt;为什么这种仓库有价值
&lt;/h2&gt;&lt;p&gt;Prompt-Vault 的价值不在于任务数量，而在于它给了可复用的评测样本。&lt;/p&gt;
&lt;p&gt;如果你在比较不同模型或 coding agent，可以用同一个 prompt 反复测试：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;哪个模型更能遵守约束&lt;/li&gt;
&lt;li&gt;哪个模型更少漏功能&lt;/li&gt;
&lt;li&gt;哪个模型更会处理边界状态&lt;/li&gt;
&lt;li&gt;哪个模型生成的代码更容易维护&lt;/li&gt;
&lt;li&gt;哪个模型更擅长 UI 细节&lt;/li&gt;
&lt;li&gt;哪个模型在单文件约束下更稳定&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这比“我感觉这个模型更聪明”可靠得多。&lt;/p&gt;
&lt;p&gt;尤其是前端任务，很多失败不是语法错误，而是体验细节缺失。比如按钮能不能禁用、动画是否卡住、刷新后数据是否还在、拖拽目标是否高亮、统计是否同步更新。这些都需要具体 prompt 才能测出来。&lt;/p&gt;
&lt;h2 id=&#34;可以怎么扩展&#34;&gt;可以怎么扩展
&lt;/h2&gt;&lt;p&gt;如果要把 Prompt-Vault 变成更完整的评测库，可以继续补几类任务。&lt;/p&gt;
&lt;p&gt;第一类是验收清单。每个 prompt 后面加一组 checklist，比如“刷新后任务仍存在”“删除空列成功，非空列不能删除”“暂停排序后数组状态不变”。这样人和 agent 都更容易验收。&lt;/p&gt;
&lt;p&gt;第二类是失败用例。比如给排序可视化任务补充“快速连续点击 Start / Reset 不应产生多个动画循环”。这能测出状态管理是否扎实。&lt;/p&gt;
&lt;p&gt;第三类是评分维度。可以按功能完整度、代码可维护性、UI 质量、可访问性、性能、边界处理打分。&lt;/p&gt;
&lt;p&gt;第四类是参考实现。不是为了让模型抄答案，而是给评测者一个基准，方便判断输出是不是合理。&lt;/p&gt;
&lt;p&gt;第五类是跨模型记录。把不同模型在同一 prompt 下的结果、失败点和 token 成本记录下来，就能形成真正的 coding benchmark。&lt;/p&gt;
&lt;h2 id=&#34;使用建议&#34;&gt;使用建议
&lt;/h2&gt;&lt;p&gt;如果你想用这个仓库测试 AI 编程工具，建议不要只看“能不能生成页面”。&lt;/p&gt;
&lt;p&gt;更好的做法是：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;选一个 prompt，原样交给模型。&lt;/li&gt;
&lt;li&gt;不做额外提示，看第一次输出能完成多少。&lt;/li&gt;
&lt;li&gt;打开生成结果，按功能逐项验收。&lt;/li&gt;
&lt;li&gt;记录漏掉的功能和明显 bug。&lt;/li&gt;
&lt;li&gt;再给一次修复机会。&lt;/li&gt;
&lt;li&gt;比较总耗时、token 成本和最终代码质量。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这样测出来的结果更接近真实开发。因为真正的 coding agent 不只是生成代码，还要理解规格、处理反馈、修复缺陷，并保持代码可维护。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;Prompt-Vault 是一个轻量级 prompt 规格库。它适合拿来做 AI 编程测试，也适合前端开发者练习小项目。&lt;/p&gt;
&lt;p&gt;它提醒我们：好的 prompt 不只是描述愿望，而是写清需求、约束、交互、状态、验收和运行方式。越是想测试模型能力，越不能只给一句模糊指令。&lt;/p&gt;
&lt;p&gt;如果你正在比较 Codex、Claude Code、Cursor、Gemini CLI 或其他 coding agent，这类分级 prompt 很值得收藏。它们能帮你把“感觉好用”变成“具体哪里做对了，哪里漏了，修一次能不能补回来”。&lt;/p&gt;
</description>
        </item>
        <item>
        <title>DeepSeek V4 Pro 对比 GPT-5.5：前端、写作、代码实测后，差距比想象更大</title>
        <link>https://knightli.com/2026/04/25/deepseek-v4-pro-vs-gpt-5-5-frontend-writing-code/</link>
        <pubDate>Sat, 25 Apr 2026 11:12:00 +0800</pubDate>
        
        <guid>https://knightli.com/2026/04/25/deepseek-v4-pro-vs-gpt-5-5-frontend-writing-code/</guid>
        <description>&lt;p&gt;&lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 和 &lt;code&gt;GPT-5.5&lt;/code&gt; 这种对比，最近越来越容易引发讨论。因为它已经不是“谁能不能用”的问题，而是：&lt;strong&gt;当任务落到前端、写作、代码这三类高频场景时，谁更适合当主力？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;很多人做这类比较时，习惯先问一句：哪个更强。&lt;br&gt;
但更有价值的问题通常不是这个，而是：&lt;strong&gt;在具体任务里，哪个更稳、哪个更省沟通成本、哪个更容易产出能直接继续推进的结果。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;如果先给一个简化版结论，可以大致这样理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;需要更均衡、产品化体验更完整的综合输出时，很多人还是会先看 &lt;code&gt;GPT-5.5&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;需要中文语境下高频迭代、成本更敏感、追求响应效率时，&lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 会更容易进入候选名单&lt;/li&gt;
&lt;li&gt;真正决定体验的，往往不是模型名字本身，而是任务类型、提示方式和你后续要不要继续改&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;下面按三个最常见的比较场景展开。&lt;/p&gt;
&lt;h2 id=&#34;1-前端任务比的不是会不会写页面而是能不能继续接着改&#34;&gt;1. 前端任务：比的不是“会不会写页面”，而是能不能继续接着改
&lt;/h2&gt;&lt;p&gt;前端任务看起来很适合拿来做模型对比，因为它结果直观：&lt;br&gt;
页面能不能跑、样式好不好看、结构清不清楚，一眼就能看到。&lt;/p&gt;
&lt;p&gt;但真正拉开差距的，往往不是第一版能不能写出来，而是后续这些问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;结构是不是足够清晰&lt;/li&gt;
&lt;li&gt;组件拆分是否自然&lt;/li&gt;
&lt;li&gt;改一处时会不会连带改坏别的地方&lt;/li&gt;
&lt;li&gt;能不能在多轮指令下继续保持同一套实现思路&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这也是为什么很多“首轮效果惊艳”的前端演示，放进真实工作流后未必依然占优。&lt;/p&gt;
&lt;p&gt;如果你的任务是：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;快速生成一个可运行的页面原型&lt;/li&gt;
&lt;li&gt;把一个落地页思路先写出来&lt;/li&gt;
&lt;li&gt;按要求补齐样式、按钮、卡片、表单等基础元素&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那两类模型通常都能完成得八九不离十，区别更多体现在输出风格。&lt;/p&gt;
&lt;p&gt;而如果你的任务变成：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;持续多轮改 UI&lt;/li&gt;
&lt;li&gt;一边读现有代码一边接着改&lt;/li&gt;
&lt;li&gt;同时兼顾组件结构、样式一致性和可维护性&lt;/li&gt;
&lt;li&gt;从静态页面逐步推进到真实项目代码&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;那你更应该观察的就不是“第一轮谁更像样”，而是“谁在第五轮以后还不容易跑偏”。&lt;/p&gt;
&lt;p&gt;所以前端对比真正该看的，不是模型能不能生成页面，而是它能不能在你连续追加约束之后，依旧保持结构稳定、命名一致、修改成本可控。&lt;/p&gt;
&lt;h2 id=&#34;2-写作任务比的不是字多不多而是风格稳不稳重写顺不顺&#34;&gt;2. 写作任务：比的不是字多不多，而是风格稳不稳、重写顺不顺
&lt;/h2&gt;&lt;p&gt;写作是另一类特别容易出现误判的场景。&lt;/p&gt;
&lt;p&gt;因为很多时候，模型第一次输出看起来都不差：&lt;br&gt;
结构完整、段落齐全、语气顺滑，乍看之下很容易觉得“差不多”。&lt;/p&gt;
&lt;p&gt;但只要你把任务往前推一步，差异就会冒出来：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;能不能准确理解你要的受众&lt;/li&gt;
&lt;li&gt;能不能在同一主题下切换不同口吻&lt;/li&gt;
&lt;li&gt;重写时会不会丢掉原文重点&lt;/li&gt;
&lt;li&gt;压缩、扩写、改标题、换结构时是否稳定&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;写作任务里最怕的不是“写不出来”，而是“看起来写出来了，但你还得重改很多遍”。&lt;/p&gt;
&lt;p&gt;所以在 &lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 和 &lt;code&gt;GPT-5.5&lt;/code&gt; 之间，更实用的比较方式通常不是让它们各写一篇，而是连续做这几轮：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;先写初稿&lt;/li&gt;
&lt;li&gt;再换一个语气重写&lt;/li&gt;
&lt;li&gt;再压缩成更短版本&lt;/li&gt;
&lt;li&gt;再改成更适合标题党或搜索分发的写法&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;如果一个模型在这几轮里仍然能保持重点不散、表达不飘、结构不乱，那它在真实写作工作流里的价值才会更高。&lt;/p&gt;
&lt;p&gt;也就是说，写作任务真正比的不是“文采”，而是&lt;strong&gt;改稿能力、服从度和连续协作感&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id=&#34;3-代码任务真正拉开差距的是长链路稳定性&#34;&gt;3. 代码任务：真正拉开差距的是长链路稳定性
&lt;/h2&gt;&lt;p&gt;代码任务比前端任务更容易暴露模型真实水平，因为它不仅要“输出”，还要“对接现实”。&lt;/p&gt;
&lt;p&gt;你很快就会遇到这些问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;它能不能理解已有项目结构&lt;/li&gt;
&lt;li&gt;能不能同时修改多个文件&lt;/li&gt;
&lt;li&gt;改完以后有没有引入新的问题&lt;/li&gt;
&lt;li&gt;出错时会不会顺着日志继续往下查&lt;/li&gt;
&lt;li&gt;多轮之后还记不记得前面已经做过什么&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类任务里，用户最在意的通常不是某一段代码漂不漂亮，而是：&lt;strong&gt;能不能帮我持续往前推进，而不是让我来收拾残局。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;所以比较 &lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 和 &lt;code&gt;GPT-5.5&lt;/code&gt; 时，最值得看的往往不是单点题，而是这种更接近真实工作的过程：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;读一个已有仓库&lt;/li&gt;
&lt;li&gt;找到一个 bug&lt;/li&gt;
&lt;li&gt;改多个相关文件&lt;/li&gt;
&lt;li&gt;根据报错继续修&lt;/li&gt;
&lt;li&gt;最后把结果整理清楚&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;只要任务进入这种连续推进模式，模型的上下文保持能力、执行习惯、解释质量和返工率，都会比“单轮答题效果”更重要。&lt;/p&gt;
&lt;p&gt;这也是为什么很多用户在代码场景里，最终形成的不是“永远只用一个模型”，而是按任务阶段切换主力。&lt;/p&gt;
&lt;h2 id=&#34;4-真正值得比较的不是输赢而是哪类任务交给谁更划算&#34;&gt;4. 真正值得比较的，不是输赢，而是“哪类任务交给谁更划算”
&lt;/h2&gt;&lt;p&gt;把 &lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 和 &lt;code&gt;GPT-5.5&lt;/code&gt; 放在一起时，如果目标只是争一个总冠军，最后往往会得到一个很空的结论。&lt;/p&gt;
&lt;p&gt;因为现实任务不是统一题目：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;有的是一次性生成&lt;/li&gt;
&lt;li&gt;有的是多轮协作&lt;/li&gt;
&lt;li&gt;有的是中文写作&lt;/li&gt;
&lt;li&gt;有的是工程改动&lt;/li&gt;
&lt;li&gt;有的是强调速度&lt;/li&gt;
&lt;li&gt;有的是强调稳定性&lt;/li&gt;
&lt;li&gt;有的是强调成本&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以更接近真实使用的方法，通常是按任务目标分：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想要更完整的综合体验、更成熟的交互和更稳定的通用输出，可以优先试 &lt;code&gt;GPT-5.5&lt;/code&gt;&lt;/li&gt;
&lt;li&gt;想要在中文环境里高频试错、快速迭代，并且更关注投入产出比，&lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 值得重点放进工作流里&lt;/li&gt;
&lt;li&gt;如果任务本身是长链路、多轮修正、多人协作，那就不要只看第一轮结果，要看五轮以后谁还更稳&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;换句话说，真正该问的不是“谁绝对更强”，而是：&lt;br&gt;
&lt;strong&gt;前端、写作、代码这三类任务里，哪一个模型更像你当前阶段最顺手的工具。&lt;/strong&gt;&lt;/p&gt;
&lt;h2 id=&#34;5-怎么做一次更像样的模型对比&#34;&gt;5. 怎么做一次更像样的模型对比
&lt;/h2&gt;&lt;p&gt;如果你自己也准备测 &lt;code&gt;DeepSeek V4 Pro&lt;/code&gt; 和 &lt;code&gt;GPT-5.5&lt;/code&gt;，一个更靠谱的做法通常不是只跑一轮，而是这样测：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;给两边同一份初始需求&lt;/li&gt;
&lt;li&gt;保持相同限制条件&lt;/li&gt;
&lt;li&gt;连续追问三到五轮&lt;/li&gt;
&lt;li&gt;记录改动质量、跑偏次数和返工量&lt;/li&gt;
&lt;li&gt;最后再看速度、成本和最终可用度&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;这样测出来的结果，会比“谁第一轮更惊艳”更接近真实工作。&lt;/p&gt;
&lt;p&gt;尤其在前端、写作、代码这三类任务里，很多时候真正决定体验的不是起跑线，而是&lt;strong&gt;谁能陪你把事情做完&lt;/strong&gt;。&lt;/p&gt;
&lt;h2 id=&#34;6-可以先这样记&#34;&gt;6. 可以先这样记
&lt;/h2&gt;&lt;p&gt;如果只想先记一个够用的版本，可以先这么理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;code&gt;GPT-5.5&lt;/code&gt;：更像综合型、产品化、默认可用的主流工作台&lt;/li&gt;
&lt;li&gt;&lt;code&gt;DeepSeek V4 Pro&lt;/code&gt;：更像在中文环境和高频试错里更值得纳入日常工作流的竞争者&lt;/li&gt;
&lt;li&gt;真正的比较重点：不是首轮炫技，而是多轮修改之后谁更稳、谁更省事&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;所以这类对比里，真正重要的从来都不是“谁赢了”，而是：&lt;br&gt;
&lt;strong&gt;你的前端、写作、代码任务，交给谁之后最容易持续推进、最少返工、最能稳定产出。&lt;/strong&gt;&lt;/p&gt;
</description>
        </item>
        
    </channel>
</rss>
