<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
    <channel>
        <title>学習ロードマップ on KnightLiブログ</title>
        <link>https://knightli.com/ja/tags/%E5%AD%A6%E7%BF%92%E3%83%AD%E3%83%BC%E3%83%89%E3%83%9E%E3%83%83%E3%83%97/</link>
        <description>Recent content in 学習ロードマップ on KnightLiブログ</description>
        <generator>Hugo -- gohugo.io</generator>
        <language>ja</language>
        <lastBuildDate>Sat, 06 Jun 2026 22:22:56 +0800</lastBuildDate><atom:link href="https://knightli.com/ja/tags/%E5%AD%A6%E7%BF%92%E3%83%AD%E3%83%BC%E3%83%89%E3%83%9E%E3%83%83%E3%83%97/index.xml" rel="self" type="application/rss+xml" /><item>
        <title>ai-engineering-from-scratch：AI エンジニアリングをゼロから作る学習ロードマップ</title>
        <link>https://knightli.com/ja/2026/06/06/ai-engineering-from-scratch-roadmap/</link>
        <pubDate>Sat, 06 Jun 2026 22:22:56 +0800</pubDate>
        
        <guid>https://knightli.com/ja/2026/06/06/ai-engineering-from-scratch-roadmap/</guid>
        <description>&lt;p&gt;&lt;code&gt;rohitg00/ai-engineering-from-scratch&lt;/code&gt; は、大規模な AI エンジニアリング学習ロードマップです。スローガンは “Learn it. Build it. Ship it for others.”。概念を読むだけではなく、AI システムを基礎から実装していくことに重点があります。&lt;/p&gt;
&lt;p&gt;すでに OpenAI、Claude、Gemini API は呼び出せるものの、機械学習、Transformer、学習、推論、エンジニアリングの底力を補いたいなら、このプロジェクトはブックマークする価値があります。&lt;/p&gt;
&lt;h2 id=&#34;普通のリソース集ではない&#34;&gt;普通のリソース集ではない
&lt;/h2&gt;&lt;p&gt;多くの AI 学習リポジトリは、論文、講座、ブログリンクを集めただけです。&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; はそれよりもコース目録に近く、各トピックが Learn か Build かで示され、多くの内容で Python によるゼロからの実装が求められます。&lt;/p&gt;
&lt;p&gt;扱う範囲はかなり広いです。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;数学と機械学習の基礎；&lt;/li&gt;
&lt;li&gt;ニューラルネットワークと深層学習；&lt;/li&gt;
&lt;li&gt;コンピュータビジョン；&lt;/li&gt;
&lt;li&gt;音声と言語；&lt;/li&gt;
&lt;li&gt;Transformer の深掘り；&lt;/li&gt;
&lt;li&gt;生成 AI；&lt;/li&gt;
&lt;li&gt;強化学習；&lt;/li&gt;
&lt;li&gt;LLM from scratch；&lt;/li&gt;
&lt;li&gt;推論最適化；&lt;/li&gt;
&lt;li&gt;AI Agent と本番エンジニアリング。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;このルートは「今夜 AI アプリをリリースしたい」人向けではありません。AI エンジニアリングの基礎力を固めたい人に向いています。&lt;/p&gt;
&lt;h2 id=&#34;学習ロードマップの特徴&#34;&gt;学習ロードマップの特徴
&lt;/h2&gt;&lt;p&gt;明確な特徴は、段階的に進むことです。たとえば Transformer 部分では、RNN の問題から入り、self-attention、multi-head attention、positional encoding、完全な Transformer、BERT、GPT、T5、ViT、MoE、KV cache、Flash Attention、Scaling Laws、そして Transformer のゼロからの構築へ進みます。&lt;/p&gt;
&lt;p&gt;LLM 部分も prompt だけではありません。次の内容を扱います。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;tokenizer：BPE、WordPiece、SentencePiece；&lt;/li&gt;
&lt;li&gt;tokenizer をゼロから構築；&lt;/li&gt;
&lt;li&gt;事前学習データパイプライン；&lt;/li&gt;
&lt;li&gt;Mini GPT の事前学習；&lt;/li&gt;
&lt;li&gt;分散学習；&lt;/li&gt;
&lt;li&gt;Instruction Tuning；&lt;/li&gt;
&lt;li&gt;RLHF；&lt;/li&gt;
&lt;li&gt;DPO；&lt;/li&gt;
&lt;li&gt;推論最適化とデプロイ。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;このような内容は、「AI API を使える」状態から「モデルがなぜそう動くのか理解している」状態へ進むのに役立ちます。&lt;/p&gt;
&lt;h2 id=&#34;なぜ-from-scratch-を重視するのか&#34;&gt;なぜ from scratch を重視するのか
&lt;/h2&gt;&lt;p&gt;「ゼロから実装」は遅く聞こえますが、フレームワークが何を隠しているかを理解できる利点があります。&lt;/p&gt;
&lt;p&gt;たとえば自分で attention を書いたことがあれば、次のことを理解しやすくなります。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;コンテキストが長くなるほどなぜメモリを食うのか；&lt;/li&gt;
&lt;li&gt;KV cache がなぜ推論を速くするのか；&lt;/li&gt;
&lt;li&gt;Flash Attention は何を最適化しているのか；&lt;/li&gt;
&lt;li&gt;RoPE と ALiBi は位置エンコーディングでどう違うのか；&lt;/li&gt;
&lt;li&gt;MoE は単にパラメータ数を増やすだけではない理由；&lt;/li&gt;
&lt;li&gt;tokenization がなぜ多言語性能に影響するのか；&lt;/li&gt;
&lt;li&gt;微調整、RLHF、DPO がそれぞれ異なる問題を解く理由。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;API を呼び出すだけなら普段は使わない知識かもしれません。しかし、モデル選定、コスト最適化、ローカルデプロイ、長コンテキストシステム、Agent フレームワークを扱う段階になると、とても有用になります。&lt;/p&gt;
&lt;h2 id=&#34;誰に向いているか&#34;&gt;誰に向いているか
&lt;/h2&gt;&lt;p&gt;このロードマップは次のような人に向いています。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Python は書けて、AI エンジニアリングを体系的に補いたい人；&lt;/li&gt;
&lt;li&gt;AI アプリは作っているが、モデル内部に自信がない人；&lt;/li&gt;
&lt;li&gt;API 利用者から AI Engineer に進みたい開発者；&lt;/li&gt;
&lt;li&gt;LLM、推論最適化、モデル学習を研究したい人；&lt;/li&gt;
&lt;li&gt;動画や記事を見るだけでなく、作りながら学びたい人。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;完全な初心者にはあまり向いていません。少なくとも Python、基礎数学、少しの機械学習概念がないと、途中で詰まりやすいです。&lt;/p&gt;
&lt;h2 id=&#34;安定して始めるには&#34;&gt;安定して始めるには
&lt;/h2&gt;&lt;p&gt;リポジトリ全体を一気に読もうとしないほうがよいです。より現実的には、目的に合わせてルートを選びます。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;AI アプリを作りたい：LLM、Agent、推論、エンジニアリングを優先；&lt;/li&gt;
&lt;li&gt;モデルを理解したい：ニューラルネットワーク、Transformer、LLM from scratch から始める；&lt;/li&gt;
&lt;li&gt;音声プロダクトを作りたい：audio、Whisper、TTS、voice assistant pipeline を見る；&lt;/li&gt;
&lt;li&gt;画像生成をやりたい：generative AI、diffusion、Stable Diffusion、ControlNet を見る；&lt;/li&gt;
&lt;li&gt;基礎を補いたい：数学、機械学習、深層学習から始める。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;各段階で小さなプロジェクトを残すのがよいです。目次を読むだけでも気持ちはよいですが、本当に価値があるのは tokenizer、attention、mini GPT、RAG、推論サービスを実際に動かすことです。&lt;/p&gt;
&lt;h2 id=&#34;通常の-ai-アプリ開発との関係&#34;&gt;通常の AI アプリ開発との関係
&lt;/h2&gt;&lt;p&gt;現在の多くの AI アプリ開発では、モデルをゼロから学習する必要はありません。クラウド API、ベクトルデータベース、ワークフローエンジン、いくつかのツール呼び出しだけで、すぐにプロトタイプを作れます。&lt;/p&gt;
&lt;p&gt;しかし、さらに進もうとすると次の問題に出会います。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;なぜこの長コンテキストモデルは遅いのか；&lt;/li&gt;
&lt;li&gt;なぜ RAG は答えを検索できたのにモデルが使わなかったのか；&lt;/li&gt;
&lt;li&gt;なぜ微調整後に一部の能力が劣化したのか；&lt;/li&gt;
&lt;li&gt;なぜローカルデプロイで VRAM が足りなくなるのか；&lt;/li&gt;
&lt;li&gt;なぜ Agent のツール呼び出しが不安定なのか；&lt;/li&gt;
&lt;li&gt;なぜ同じようなパラメータ数でもモデルごとのコストが大きく違うのか。&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;このとき、低レイヤーの知識は飾りではなく、デバッグ能力になります。&lt;/p&gt;
&lt;h2 id=&#34;まとめ&#34;&gt;まとめ
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;ai-engineering-from-scratch&lt;/code&gt; は、AI エンジニアリングの基礎を本気で補いたい人に向いています。速成を約束するものではなく、単なるリンク集でもありません。多くの AI コアモジュールを、学習、実装、提供できる段階に分解しています。&lt;/p&gt;
&lt;p&gt;単純な AI アプリを作るだけなら、最初から最後まで読む必要はありません。しかし API を呼ぶだけでなく、モデル、学習、推論、最適化、工程化まで理解したいなら、このリポジトリは長期的なロードマップになります。&lt;/p&gt;
&lt;h2 id=&#34;参考ソース&#34;&gt;参考ソース
&lt;/h2&gt;&lt;ul&gt;
&lt;li&gt;&lt;a class=&#34;link&#34; href=&#34;https://github.com/rohitg00/ai-engineering-from-scratch&#34;  target=&#34;_blank&#34; rel=&#34;noopener&#34;
    &gt;rohitg00/ai-engineering-from-scratch - GitHub&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
</description>
        </item>
        
    </channel>
</rss>
