<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>学习路线 on KnightLi的博客</title>
        <link>https://knightli.com/tags/%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF/</link>
        <description>Recent content in 学习路线 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-cn</language>
        <lastBuildDate>Sat, 06 Jun 2026 22:22:56 +0800</lastBuildDate><atom:link href="https://knightli.com/tags/%E5%AD%A6%E4%B9%A0%E8%B7%AF%E7%BA%BF/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>ai-engineering-from-scratch：从零手搓 AI 工程的学习路线</title>
        <link>https://knightli.com/2026/06/06/ai-engineering-from-scratch-roadmap/</link>
        <pubDate>Sat, 06 Jun 2026 22:22:56 +0800</pubDate>
        
        <guid>https://knightli.com/2026/06/06/ai-engineering-from-scratch-roadmap/</guid>
        <description>&lt;p&gt;&lt;code&gt;rohitg00/ai-engineering-from-scratch&lt;/code&gt; 是一份很大的 AI 工程学习路线。它的口号是 “Learn it. Build it. Ship it for others.”，重点不只是读概念，而是把 AI 系统从底层原理一路实现出来。&lt;/p&gt;
&lt;p&gt;如果你已经会调用 OpenAI、Claude 或 Gemini API，但想补上机器学习、Transformer、训练、推理和工程化底层知识，这个项目值得收藏。&lt;/p&gt;
&lt;h2 id=&#34;它不是普通资源列表&#34;&gt;它不是普通资源列表
&lt;/h2&gt;&lt;p&gt;很多 AI 学习仓库只是把论文、课程、博客链接堆在一起。&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; 更像一套课程目录，每个主题都标明是 Learn 还是 Build，并且大量内容要求你用 Python 从零实现。&lt;/p&gt;
&lt;p&gt;它覆盖的范围很广，包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;数学和机器学习基础；&lt;/li&gt;
&lt;li&gt;神经网络和深度学习；&lt;/li&gt;
&lt;li&gt;计算机视觉；&lt;/li&gt;
&lt;li&gt;音频和语音；&lt;/li&gt;
&lt;li&gt;Transformer 深入；&lt;/li&gt;
&lt;li&gt;生成式 AI；&lt;/li&gt;
&lt;li&gt;强化学习；&lt;/li&gt;
&lt;li&gt;LLM 从零实现；&lt;/li&gt;
&lt;li&gt;推理优化；&lt;/li&gt;
&lt;li&gt;AI Agent 和生产工程。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这种路线不适合“今晚就上线一个 AI 应用”的人，但非常适合想把 AI 工程基本功补扎实的人。&lt;/p&gt;
&lt;h2 id=&#34;学习路线有什么特点&#34;&gt;学习路线有什么特点
&lt;/h2&gt;&lt;p&gt;项目的一个明显特点是分阶段推进。比如 Transformer 部分会从 RNN 的问题讲起，再进入 self-attention、multi-head attention、positional encoding、完整 Transformer、BERT、GPT、T5、ViT、MoE、KV cache、Flash Attention、Scaling Laws 和从零构建 Transformer。&lt;/p&gt;
&lt;p&gt;LLM 部分也不是只讲 prompt，而是会覆盖：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;tokenizer：BPE、WordPiece、SentencePiece；&lt;/li&gt;
&lt;li&gt;从零构建 tokenizer；&lt;/li&gt;
&lt;li&gt;预训练数据管线；&lt;/li&gt;
&lt;li&gt;预训练 Mini GPT；&lt;/li&gt;
&lt;li&gt;分布式训练；&lt;/li&gt;
&lt;li&gt;Instruction Tuning；&lt;/li&gt;
&lt;li&gt;RLHF；&lt;/li&gt;
&lt;li&gt;DPO；&lt;/li&gt;
&lt;li&gt;推理优化和部署。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这类内容很适合把“我会用 AI API”升级成“我理解模型为什么这样工作”。&lt;/p&gt;
&lt;h2 id=&#34;为什么强调-from-scratch&#34;&gt;为什么强调 from scratch
&lt;/h2&gt;&lt;p&gt;“从零实现”听起来慢，但它有一个好处：你会知道框架帮你隐藏了什么。&lt;/p&gt;
&lt;p&gt;比如你自己写过 attention，就更容易理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;为什么上下文越长显存越吃紧；&lt;/li&gt;
&lt;li&gt;KV cache 为什么能加速推理；&lt;/li&gt;
&lt;li&gt;Flash Attention 优化的到底是什么；&lt;/li&gt;
&lt;li&gt;RoPE 和 ALiBi 在位置编码上有什么差别；&lt;/li&gt;
&lt;li&gt;MoE 为什么不是简单把参数量堆大；&lt;/li&gt;
&lt;li&gt;tokenization 为什么会影响多语言效果；&lt;/li&gt;
&lt;li&gt;微调、RLHF、DPO 解决的是不同层面的问题。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这些东西平时调用 API 不一定用得上，但一旦你要做模型选型、成本优化、本地部署、长上下文系统或 Agent 框架，就会变得很有用。&lt;/p&gt;
&lt;h2 id=&#34;适合谁学&#34;&gt;适合谁学
&lt;/h2&gt;&lt;p&gt;这份路线更适合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;已经会写 Python，想系统补 AI 工程的人；&lt;/li&gt;
&lt;li&gt;做 AI 应用，但对模型底层不够踏实的人；&lt;/li&gt;
&lt;li&gt;想从 API 调用者进阶到 AI Engineer 的开发者；&lt;/li&gt;
&lt;li&gt;准备研究 LLM、推理优化或模型训练的人；&lt;/li&gt;
&lt;li&gt;喜欢边学边实现，而不是只看视频和文章的人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不太适合完全零基础用户。至少要有 Python、基础数学和一点机器学习概念，否则会很容易卡住。&lt;/p&gt;
&lt;h2 id=&#34;怎么开始比较稳&#34;&gt;怎么开始比较稳
&lt;/h2&gt;&lt;p&gt;不要试图一口气啃完整个仓库。更实际的方式是按目标选择路径：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想做 AI 应用：优先看 LLM、Agent、推理和工程化部分；&lt;/li&gt;
&lt;li&gt;想理解模型：从神经网络、Transformer、LLM from scratch 开始；&lt;/li&gt;
&lt;li&gt;想做语音产品：看 audio、Whisper、TTS、voice assistant pipeline；&lt;/li&gt;
&lt;li&gt;想做图像生成：看 generative AI、diffusion、Stable Diffusion、ControlNet；&lt;/li&gt;
&lt;li&gt;想补基础：从数学、机器学习、深度学习开始。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;学习时最好每个阶段都留一个小项目。只读目录会很爽，但真正有价值的是把 tokenizer、attention、mini GPT、RAG 或推理服务跑起来。&lt;/p&gt;
&lt;h2 id=&#34;和普通-ai-应用开发的关系&#34;&gt;和普通 AI 应用开发的关系
&lt;/h2&gt;&lt;p&gt;现在很多 AI 应用开发确实不需要从零训练模型。你可以用云端 API、向量数据库、工作流引擎和几个工具调用，很快做出一个产品原型。&lt;/p&gt;
&lt;p&gt;但如果你要走得更远，就会遇到这些问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;为什么这个模型上下文长但很慢；&lt;/li&gt;
&lt;li&gt;为什么 RAG 检索到了答案但模型没用上；&lt;/li&gt;
&lt;li&gt;为什么微调后某些能力退化；&lt;/li&gt;
&lt;li&gt;为什么本地部署显存爆了；&lt;/li&gt;
&lt;li&gt;为什么 Agent 工具调用不稳定；&lt;/li&gt;
&lt;li&gt;为什么同样参数下不同模型成本差这么多。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;这时底层知识就不是装饰，而是排错能力。&lt;/p&gt;
&lt;h2 id=&#34;小结&#34;&gt;小结
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; 适合想认真补 AI 工程底层的人。它不承诺速成，也不只是“收藏夹式资源大全”，而是把很多 AI 核心模块拆成可以学习、实现和交付的阶段。&lt;/p&gt;
&lt;p&gt;如果你只是做简单 AI 应用，没必要从头啃完；但如果你希望自己不只会调 API，而是能理解模型、训练、推理、优化和工程落地，这个仓库可以作为长期路线图。&lt;/p&gt;
&lt;h2 id=&#34;参考来源&#34;&gt;参考来源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/rohitg00/ai-engineering-from-scratch&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;rohitg00/ai-engineering-from-scratch - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
