<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>學習路線 on KnightLi的博客</title>
        <link>https://knightli.com/zh-tw/tags/%E5%AD%B8%E7%BF%92%E8%B7%AF%E7%B7%9A/</link>
        <description>Recent content in 學習路線 on KnightLi的博客</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>zh-tw</language>
        <lastBuildDate>Sat, 06 Jun 2026 22:22:56 +0800</lastBuildDate><atom:link href="https://knightli.com/zh-tw/tags/%E5%AD%B8%E7%BF%92%E8%B7%AF%E7%B7%9A/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>ai-engineering-from-scratch：從零手搓 AI 工程的學習路線</title>
        <link>https://knightli.com/zh-tw/2026/06/06/ai-engineering-from-scratch-roadmap/</link>
        <pubDate>Sat, 06 Jun 2026 22:22:56 +0800</pubDate>
        
        <guid>https://knightli.com/zh-tw/2026/06/06/ai-engineering-from-scratch-roadmap/</guid>
        <description>&lt;p&gt;&lt;code&gt;rohitg00/ai-engineering-from-scratch&lt;/code&gt; 是一份很大的 AI 工程學習路線。它的口號是 “Learn it. Build it. Ship it for others.”，重點不只是讀概念，而是把 AI 系統從底層原理一路實作出來。&lt;/p&gt;
&lt;p&gt;如果你已經會呼叫 OpenAI、Claude 或 Gemini API，但想補上機器學習、Transformer、訓練、推理和工程化底層知識，這個專案值得收藏。&lt;/p&gt;
&lt;h2 id=&#34;它不是普通資源列表&#34;&gt;它不是普通資源列表
&lt;/h2&gt;&lt;p&gt;很多 AI 學習倉庫只是把論文、課程、部落格連結堆在一起。&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; 更像一套課程目錄，每個主題都標明是 Learn 還是 Build，並且大量內容要求你用 Python 從零實作。&lt;/p&gt;
&lt;p&gt;它覆蓋的範圍很廣，包括：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;數學和機器學習基礎；&lt;/li&gt;
&lt;li&gt;神經網路和深度學習；&lt;/li&gt;
&lt;li&gt;電腦視覺；&lt;/li&gt;
&lt;li&gt;音訊和語音；&lt;/li&gt;
&lt;li&gt;Transformer 深入；&lt;/li&gt;
&lt;li&gt;生成式 AI；&lt;/li&gt;
&lt;li&gt;強化學習；&lt;/li&gt;
&lt;li&gt;LLM 從零實作；&lt;/li&gt;
&lt;li&gt;推理最佳化；&lt;/li&gt;
&lt;li&gt;AI Agent 和生產工程。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這種路線不適合「今晚就上線一個 AI 應用」的人，但非常適合想把 AI 工程基本功補紮實的人。&lt;/p&gt;
&lt;h2 id=&#34;學習路線有什麼特點&#34;&gt;學習路線有什麼特點
&lt;/h2&gt;&lt;p&gt;專案的一個明顯特點是分階段推進。比如 Transformer 部分會從 RNN 的問題講起，再進入 self-attention、multi-head attention、positional encoding、完整 Transformer、BERT、GPT、T5、ViT、MoE、KV cache、Flash Attention、Scaling Laws 和從零構建 Transformer。&lt;/p&gt;
&lt;p&gt;LLM 部分也不是只講 prompt，而是會覆蓋：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;tokenizer：BPE、WordPiece、SentencePiece；&lt;/li&gt;
&lt;li&gt;從零構建 tokenizer；&lt;/li&gt;
&lt;li&gt;預訓練資料管線；&lt;/li&gt;
&lt;li&gt;預訓練 Mini GPT；&lt;/li&gt;
&lt;li&gt;分散式訓練；&lt;/li&gt;
&lt;li&gt;Instruction Tuning；&lt;/li&gt;
&lt;li&gt;RLHF；&lt;/li&gt;
&lt;li&gt;DPO；&lt;/li&gt;
&lt;li&gt;推理最佳化和部署。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這類內容很適合把「我會用 AI API」升級成「我理解模型為什麼這樣工作」。&lt;/p&gt;
&lt;h2 id=&#34;為什麼強調-from-scratch&#34;&gt;為什麼強調 from scratch
&lt;/h2&gt;&lt;p&gt;「從零實作」聽起來慢，但它有一個好處：你會知道框架幫你隱藏了什麼。&lt;/p&gt;
&lt;p&gt;比如你自己寫過 attention，就更容易理解：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;為什麼上下文越長顯存越吃緊；&lt;/li&gt;
&lt;li&gt;KV cache 為什麼能加速推理；&lt;/li&gt;
&lt;li&gt;Flash Attention 最佳化的到底是什麼；&lt;/li&gt;
&lt;li&gt;RoPE 和 ALiBi 在位置編碼上有什麼差別；&lt;/li&gt;
&lt;li&gt;MoE 為什麼不是簡單把參數量堆大；&lt;/li&gt;
&lt;li&gt;tokenization 為什麼會影響多語言效果；&lt;/li&gt;
&lt;li&gt;微調、RLHF、DPO 解決的是不同層面的問題。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這些東西平時呼叫 API 不一定用得上，但一旦你要做模型選型、成本最佳化、本地部署、長上下文系統或 Agent 框架，就會變得很有用。&lt;/p&gt;
&lt;h2 id=&#34;適合誰學&#34;&gt;適合誰學
&lt;/h2&gt;&lt;p&gt;這份路線更適合：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;已經會寫 Python，想系統補 AI 工程的人；&lt;/li&gt;
&lt;li&gt;做 AI 應用，但對模型底層不夠踏實的人；&lt;/li&gt;
&lt;li&gt;想從 API 呼叫者進階到 AI Engineer 的開發者；&lt;/li&gt;
&lt;li&gt;準備研究 LLM、推理最佳化或模型訓練的人；&lt;/li&gt;
&lt;li&gt;喜歡邊學邊實作，而不是只看影片和文章的人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;它不太適合完全零基礎使用者。至少要有 Python、基礎數學和一點機器學習概念，否則會很容易卡住。&lt;/p&gt;
&lt;h2 id=&#34;怎麼開始比較穩&#34;&gt;怎麼開始比較穩
&lt;/h2&gt;&lt;p&gt;不要試圖一口氣啃完整個倉庫。更實際的方式是按目標選擇路徑：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;想做 AI 應用：優先看 LLM、Agent、推理和工程化部分；&lt;/li&gt;
&lt;li&gt;想理解模型：從神經網路、Transformer、LLM from scratch 開始；&lt;/li&gt;
&lt;li&gt;想做語音產品：看 audio、Whisper、TTS、voice assistant pipeline；&lt;/li&gt;
&lt;li&gt;想做圖像生成：看 generative AI、diffusion、Stable Diffusion、ControlNet；&lt;/li&gt;
&lt;li&gt;想補基礎：從數學、機器學習、深度學習開始。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;學習時最好每個階段都留一個小專案。只讀目錄會很爽，但真正有價值的是把 tokenizer、attention、mini GPT、RAG 或推理服務跑起來。&lt;/p&gt;
&lt;h2 id=&#34;和普通-ai-應用開發的關係&#34;&gt;和普通 AI 應用開發的關係
&lt;/h2&gt;&lt;p&gt;現在很多 AI 應用開發確實不需要從零訓練模型。你可以用雲端 API、向量資料庫、工作流引擎和幾個工具呼叫，很快做出一個產品原型。&lt;/p&gt;
&lt;p&gt;但如果你要走得更遠，就會遇到這些問題：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;為什麼這個模型上下文長但很慢；&lt;/li&gt;
&lt;li&gt;為什麼 RAG 檢索到了答案但模型沒用上；&lt;/li&gt;
&lt;li&gt;為什麼微調後某些能力退化；&lt;/li&gt;
&lt;li&gt;為什麼本地部署顯存爆了；&lt;/li&gt;
&lt;li&gt;為什麼 Agent 工具呼叫不穩定；&lt;/li&gt;
&lt;li&gt;為什麼同樣參數下不同模型成本差這麼多。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;這時底層知識就不是裝飾，而是排錯能力。&lt;/p&gt;
&lt;h2 id=&#34;小結&#34;&gt;小結
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; 適合想認真補 AI 工程底層的人。它不承諾速成，也不只是「收藏夾式資源大全」，而是把很多 AI 核心模組拆成可以學習、實作和交付的階段。&lt;/p&gt;
&lt;p&gt;如果你只是做簡單 AI 應用，沒必要從頭啃完；但如果你希望自己不只會調 API，而是能理解模型、訓練、推理、最佳化和工程落地，這個倉庫可以作為長期路線圖。&lt;/p&gt;
&lt;h2 id=&#34;參考來源&#34;&gt;參考來源
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/rohitg00/ai-engineering-from-scratch&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;rohitg00/ai-engineering-from-scratch - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
