GitHub AI 開源專案分類整理:從 Coding Agent 到 RAG、本地語音角色和自動化工具

根據站內已更新的 GitHub 專案介紹文章,整理 AI 程式設計、Agent 工作流、RAG 知識庫、多模態內容、本地模型、自動化應用和 AI 應用開發基礎設施專案索引。

這裡按應用方向列出 GitHub AI 專案,覆蓋 AI 程式設計與 Coding Agent、Agent 技能與工作流、RAG 與知識庫、多模態創作、本地模型與推理、垂直應用與自動化、AI 應用開發基礎設施等方向。後續新增專案時,也可以繼續按這個結構補充。

分類合計

分類 專案數 適合先看的人
AI 程式設計與 Coding Agent 31 經常使用 Claude Code、Codex、Cursor、終端 Agent 或程式碼庫自動化的人
Agent 技能與工作流 13 想把 AI 程式設計、研究、求職、趨勢分析和創作流程標準化的人
RAG、知識庫與記憶 13 需要文件檢索、知識庫、長期記憶、OCR、結構化解析和本地向量索引的人
多模態與內容創作 11 做圖片、影片、語音、數位人、Live2D 角色和內容分發的人
垂直應用與自動化 12 想看金融、交易、商品監控、桌面、瀏覽器和手機自動化場景的人
AI 應用開發基礎設施 10 建構 AI 應用、Agent 工具鏈、瀏覽器自動化、AI 前端互動和 API 閘道的人
本地模型與推理 3 關注本地模型、量化、推理引擎和硬體適配的人
通用開發、維運與學習資源 11 想補齊基礎設施、開發框架、維運安全和學習資料的人

AI程式設計與 Coding Agent

這一類聚焦程式碼理解、程式碼修改、工程流程和終端 Agent,是數量最多的一組。共 22 個專案。

專案 文章 GitHub 核心用途 適合人群
Ralph Ralph 是什麼:把 Claude Code 和 Amp 變成可迴圈執行的自主開發流程 snarktank/ralph 讓 Claude Code / Amp 按 PRD、計劃、執行、評審迴圈推進任務 想把 Agent 程式設計流程拉直的人
Claude-Mem Claude-Mem:給 Claude Code 加上跨會話長期記憶 thedotmack/claude-mem 為 Claude Code 增加跨會話記憶 高頻使用 Claude Code 的開發者
Claude Code Hooks Mastery Claude Code Hooks Mastery:13 個 Hooks 生命週期與自動化控制入門 disler/claude-code-hooks-mastery 學習 Claude Code Hooks 生命週期和自動化控制 想定製 Claude Code 流程的人
Compound Engineering Plugin Compound Engineering Plugin:把 AI 程式設計變成計劃、執行、評審的工程迴圈 EveryInc/compound-engineering-plugin 把 AI 程式設計拆成計劃、執行、評審迴圈 關注工程化 AI 程式設計的人
free-claude-code free-claude-code:用代理把 Claude Code 接到 OpenRouter、DeepSeek 和本地模型 Alishahryar1/free-claude-code 透過代理把 Claude Code 接到不同模型後端 想降低 Claude Code 使用成本的人
Hermes Agent Hermes Agent 是什麼:簡介、優點、快速上手與 OpenClaw 對比 NousResearch/hermes-agent 本地 Agent 框架,支援工具呼叫和任務執行 想跑本地 Agent 的使用者
OpenHarness OpenHarness 是什麼:這個開源 Agent Harness 能做什麼 HKUDS/OpenHarness Agent Harness 與多 Agent 執行框架 研究 Agent 編排的人
CodexBridge Codex 怎麼接入國產大模型?OpenAI 相容介面與 CodexBridge 使用思路 begonia599/CodexBridge 幫 Codex 接入 OpenAI 相容模型介面 想把 Codex 接到國產模型的人
ccx Codex 怎麼接入國產大模型?用 CCX 統一管理 OpenAI 相容 API BenedictKing/ccx 統一管理 Claude、Codex、Gemini 等 API 代理 多模型切換使用者
cc-haha cc-haha 是什麼?一個把 Claude Code 做成桌面工作臺的專案 NanmiCoder/cc-haha Claude Code 桌面工作臺與 Computer Use 入口 喜歡圖形介面的 Claude Code 使用者
DeepSeek-TUI DeepSeek-TUI:把 DeepSeek V4 變成終端裡的程式設計智慧體 Hmbown/DeepSeek-TUI 在終端裡執行 DeepSeek 程式設計 Agent DeepSeek 與命令列使用者
Open Design Open Design 專案解析:把 Claude Code、Codex 變成 AI 設計工具 nexu-io/open-design 讓 Claude Code / Codex 參與設計生成 想用 Agent 做設計原型的人
agentmemory agentmemory 專案解析:給 Claude Code、Codex 和 Cursor 加持久記憶 rohitg00/agentmemory 給 Coding Agent 增加持久記憶層 長期維護專案的開發者
Graphify Graphify 解決 Claude Code 最大侷限:把程式碼庫變成 AI 可查詢知識圖譜 safishamsi/graphify 把程式碼庫轉成知識圖譜,降低 Agent 重複讀檔案成本 大型程式碼庫使用者
oh-my-pi oh-my-pi 是什麼?一個把終端、IDE 和偵錯器打通的 AI 編程助手 can1357/oh-my-pi 把終端、IDE、LSP 和偵錯器連接起來,作為本機 AI 編程控制台 想把命令列和 IDE 工作流打通的開發者
Claude Plugins Official Claude Code 也有外掛市場了:能裝什麼、怎麼裝、要注意什麼 anthropics/claude-plugins-official Claude Code 官方外掛目錄和安裝入口 想給 Claude Code 擴展能力的使用者
CodeGraph CodeGraph 是什麼?給 Claude Code、Codex 和 Cursor 加一個本機程式碼地圖 colbymchenry/codegraph 為程式碼庫生成本機索引和關係圖,幫助 Coding Agent 理解專案 維護中大型程式碼庫的開發者
CC Switch CC Switch:一個桌面工具統一管理 Claude Code、Codex、Gemini CLI 和 OpenClaw farion1231/cc-switch 管理多個 AI CLI 工具和賬號/配置切換 同時使用多套 CLI 的人
Warp Warp 開源:從終端到 Agentic Development Environment warpdotdev/warp Agentic 終端與開發環境 終端重度使用者
opencode opencode、Claude Code、Codex 有什麼區別?開源 AI 程式設計工具使用指南 anomalyco/opencode 開源 AI 程式設計 Agent 想找 Claude Code / Codex 替代品的人
9Router 9Router:把 Claude Code、Codex、Cursor 接到同一個 AI 路由器 decolua/9router AI 程式設計模型路由與 token 成本控制 多工具、多模型使用者
goose goose:桌面端、CLI 和 API 一體的開源 AI Agent aaif-goose/goose 桌面、CLI、API 一體的開源 Agent 想要通用 Agent 工作臺的人

Agent 技能與工作流

這一類更關注把 AI 能力固化成可重複的技能、流程和規格。共 7 個專案。

專案 文章 GitHub 核心用途 適合人群
mattpocock/skills 拒絕 Vibe Coding:Matt Pocock 的 skills 倉庫給 AI 程式設計補上工程約束 mattpocock/skills 用 Skills 約束 AI 程式設計流程 想給 Agent 加工程規範的人
Superpowers Superpowers:把 Coding Agent 拉回工程流程的技能框架 obra/superpowers Agentic skills framework 與軟體開發方法論 想系統化使用 Coding Agent 的人
Prompt-Vault Prompt-Vault:一個適合測試 AI 程式設計能力的 Prompt 規格庫 w512/Prompt-Vault 收集可測試 AI 程式設計能力的 prompt 規格 做模型/工具評測的人
web-video-presentation web-video-presentation:把文章做成可錄屏網頁影片的 Agent Skill ConardLi/garden-skills 把文章轉成可錄屏網頁影片的 Skill 內容創作者和自動化製作使用者
nuwa-skill nuwa-skill:把“蒸餾一個人”從靈感變成可執行流程 alchaincyf/nuwa-skill 用 Skill 復刻人物表達和思維流程 做風格化 Agent 的人
Scientific Agent Skills Scientific Agent Skills:把科研工作流交給 AI Agent 的技能庫 K-Dense-AI/scientific-agent-skills 科研工作流 Skill 集合 科研、資料分析和技術寫作使用者
easy-vibe easy-vibe:給 Vibe Coding 初學者的一張學習地圖 datawhalechina/easy-vibe Vibe Coding 入門學習地圖 AI 程式設計新手

RAG、知識庫與記憶

這一類主要解決文件檢索、知識庫構建、長期記憶和結構化抽取問題。共 7 個專案。

專案 文章 GitHub 核心用途 適合人群
LangExtract Google LangExtract:用 LLM 從長文字里抽取結構化資料 google/langextract 從長文字中抽取結構化資訊 做資訊抽取和資料處理的人
qmd qmd:給 AI Agent 使用的本地 Markdown 文件搜尋工具 tobi/qmd 本地 Markdown 文件搜尋 用 Markdown 管理知識庫的人
Firecrawl Firecrawl 專案整理:給 AI Agent 用的網頁搜尋、抓取與互動 API firecrawl/firecrawl 網頁抓取、搜尋和結構化資料入口 做 RAG 和 Agent 資料入口的人
RAGFlow RAGFlow 專案整理:開源 RAG 引擎的功能與使用方法 infiniflow/ragflow 開源 RAG 引擎 企業知識庫和文件問答使用者
OpenHuman OpenHuman 速讀:開源個人 AI Agent 的桌面化路線 tinyhumansai/openhuman 本地優先的個人 AI Agent 與記憶層 想整合個人資料的人
OpenKB OpenKB:把文件編譯成可持續更新的 LLM 知識庫 VectifyAI/OpenKB 把文件編譯成可更新知識庫 文件知識庫維護者
PageIndex PageIndex 是什麼?不用向量庫的推理式 RAG 文件索引解析 VectifyAI/PageIndex 不依賴向量庫的推理式文件索引 關注 RAG 新路線的人

多模態與內容創作

這一類面向圖片、影片、語音轉寫和內容分發等創作場景。共 5 個專案。

專案 文章 GitHub 核心用途 適合人群
rembg rembg 專案整理:本地圖片背景移除工具 danielgatis/rembg 本地圖片背景移除 電商、美工和圖片處理使用者
awesome-gpt-image-2-prompts GPT-Image 2 提示詞寶庫:電商、海報、人像、UI 全收錄 EvoLinkAI/awesome-gpt-image-2-prompts GPT-Image 2 提示詞和案例庫 AI 繪圖和提示詞使用者
faster-whisper faster-whisper:更快的 Whisper 轉寫引擎 SYSTRAN/faster-whisper 高效能語音轉文字 做字幕、轉寫和語音處理的人
Pixelle-Video Pixelle-Video:一句主題生成短影片的開源 AI 引擎 AIDC-AI/Pixelle-Video 一句話生成短影片工作流 短影片和 AIGC 內容創作者
AiToEarn 內容發太多平臺太累?AiToEarn 想用 AI Agent 幫創作者省點事 yikart/AiToEarn 多平臺內容分發與創作者自動化 內容運營和創作者

本地模型與推理

這一類關注本地模型執行和推理實驗,當前數量較少。共 1 個專案。

專案 文章 GitHub 核心用途 適合人群
ds4 本地執行 DeepSeek 4:Antirez ds4 在 Apple Silicon Mac 上的嘗試 antirez/ds4 在 Apple Silicon 上嘗試執行 DeepSeek 4 本地模型和推理實驗使用者

垂直應用與自動化

這一類是把 Agent 或 AI 能力落到金融、交易、瀏覽器、桌面和電商監控等具體場景。共 7 個專案。

專案 文章 GitHub 核心用途 適合人群
TradingAgents-CN TradingAgents-CN:面向中文使用者的多智慧體金融交易研究框架 hsliuping/TradingAgents-CN 多智慧體金融交易研究框架 量化、金融和 Agent 研究者
FinceptTerminal FinceptTerminal:開源金融終端、量化研究和 AI Agent 工作臺 Fincept-Corporation/FinceptTerminal 金融終端、量化研究和 AI Agent 工作臺 金融分析和量化使用者
Anthropic financial-services Anthropic financial-services:把金融 Agent 場景做成可複用模板 anthropics/financial-services 金融服務 Agent 模板 做金融 AI 方案的人
ai-goofish-monitor ai-goofish-monitor:用 AI 自動盯閒魚商品的開源監控系統 Usagi-org/ai-goofish-monitor AI 商品監控和閒魚自動化 二手交易監控使用者
CloakBrowser CloakBrowser 是什麼?給 Playwright 和 Puppeteer 換一個更像真實使用者的瀏覽器 CloakHQ/CloakBrowser 更像真實使用者的瀏覽器自動化環境 瀏覽器自動化和 Agent 操作場景
UI-TARS-desktop 讓 AI 自己操作電腦?UI-TARS-desktop 把桌面、瀏覽器和工具都接了起來 bytedance/UI-TARS-desktop 桌面、瀏覽器和工具操作 Agent 想讓 AI 操作電腦的人
AI-Trader AI-Trader 是什麼?一個讓 AI Agent 釋出交易訊號、做模擬交易的平臺 HKUDS/AI-Trader AI Agent 交易訊號和模擬交易平臺 金融 Agent 與交易研究使用者

AI 應用開發基礎設施

這一類提供構建 AI 應用和 Agent 工具鏈所需的基礎元件。共 5 個專案。

專案 文章 GitHub 核心用途 適合人群
Prompt Optimizer Prompt Optimizer:開源提示詞最佳化、測試與 MCP 工具 linshenkx/prompt-optimizer 提示詞最佳化、測試和 MCP 工具 做 prompt 工程和應用調參的人
Playwright CLI Playwright CLI 使用入門:安裝、Skills、會話管理與常用命令 microsoft/playwright-cli 面向 coding agent 的瀏覽器自動化 CLI 需要瀏覽器操作能力的 Agent 使用者
Vercel AI SDK Vercel AI SDK 是什麼?TypeScript 開發者構建 AI 應用的統一工具包 vercel/ai TypeScript AI 應用開發 SDK 前端和全棧開發者
CLIProxyAPI CLIProxyAPI:把 Codex、Claude Code、Gemini CLI 統一封裝成 API router-for-me/CLIProxyAPI 把多個 AI CLI 和 OAuth 登入狀態封裝成相容 API 想統一接入 Codex、Claude Code、Gemini CLI 的使用者
CLIProxyAPI Management Center CLIProxyAPI Management Center:給 CLIProxyAPI 配一個視覺化管理後台 router-for-me/Cli-Proxy-API-Management-Center CLIProxyAPI 的 Web 管理介面,管理設定、帳號、日誌和 OAuth 把 CLIProxyAPI 當團隊閘道或帳號池使用的人

站內最新補入專案

以下專案是舊版譯文之後新增的內容,用來讓譯文索引跟上新版簡體中文源文。

Project Category Article GitHub
OpenAI Symphony AI 程式設計與 Coding Agent OpenAI Symphony openai/symphony
GitHub Spec Kit AI 程式設計與 Coding Agent GitHub Spec Kit github/spec-kit
oh-my-codex AI 程式設計與 Coding Agent oh-my-codex Yeachan-Heo/oh-my-codex
RTK AI 程式設計與 Coding Agent RTK rtk-ai/rtk
Headroom AI 程式設計與 Coding Agent Headroom chopratejas/headroom
DeepSeek-Reasonix AI 程式設計與 Coding Agent DeepSeek-Reasonix esengine/DeepSeek-Reasonix
Understand-Anything AI 程式設計與 Coding Agent Understand-Anything Lum1104/Understand-Anything
Taste Skill Agent 技能與工作流 Taste Skill Leonxlnx/taste-skill
academic-research-skills Agent 技能與工作流 academic-research-skills Imbad0202/academic-research-skills
last30days-skill Agent 技能與工作流 last30days-skill mvanhorn/last30days-skill
Agent-Reach Agent 技能與工作流 Agent-Reach Panniantong/Agent-Reach
Personal AI Infrastructure Agent 技能與工作流 Personal AI Infrastructure danielmiessler/Personal_AI_Infrastructure
career-ops Agent 技能與工作流 career-ops santifer/career-ops
EverOS RAG、知識庫與記憶 EverOS EverMind-AI/EverOS
MemPalace RAG、知識庫與記憶 MemPalace MemPalace/mempalace
open-notebook RAG、知識庫與記憶 open-notebook lfnovo/open-notebook
PaddleOCR RAG、知識庫與記憶 PaddleOCR PaddlePaddle/PaddleOCR
MinerU RAG、知識庫與記憶 MinerU opendatalab/MinerU
turbovec RAG、知識庫與記憶 turbovec RyanCodrai/turbovec
HyperFrames 多模態與內容創作 HyperFrames heygen-com/hyperframes
OpenAI Whisper 多模態與內容創作 OpenAI Whisper openai/whisper
VibeVoice 多模態與內容創作 VibeVoice microsoft/VibeVoice
LongCat-Video 多模態與內容創作 LongCat-Video meituan-longcat/LongCat-Video
WavFlow 多模態與內容創作 WavFlow facebookresearch/WavFlow
Open-LLM-VTuber 多模態與內容創作 Open-LLM-VTuber Open-LLM-VTuber/Open-LLM-VTuber
xianyu-auto-reply 垂直應用與自動化 xianyu-auto-reply zhinianboke/xianyu-auto-reply
MobiAgent 垂直應用與自動化 MobiAgent IPADS-SAI/MobiAgent
Mobile-Agent 垂直應用與自動化 Mobile-Agent X-PLUG/MobileAgent
Mobilerun 垂直應用與自動化 Mobilerun droidrun/mobilerun
mobile-use 垂直應用與自動化 mobile-use minitap-ai/mobile-use
browser-harness AI 應用開發基礎設施 browser-harness browser-use/browser-harness
CopilotKit AI 應用開發基礎設施 CopilotKit CopilotKit/CopilotKit
Vite AI 應用開發基礎設施 Vite vitejs/vite
Svelte AI 應用開發基礎設施 Svelte sveltejs/svelte
Microsoft MXC AI 應用開發基礎設施 Microsoft MXC microsoft/mxc
Remotion AI 應用開發基礎設施 Remotion remotion-dev/remotion
llama.cpp 本地模型與推理 llama.cpp ggml-org/llama.cpp
NVIDIA Model Optimizer 本地模型與推理 NVIDIA Model Optimizer NVIDIA/Model-Optimizer
English-level-up-tips 通用開發、維運與學習資源 English-level-up-tips byoungd/English-level-up-tips
ai-engineering-from-scratch 通用開發、維運與學習資源 ai-engineering-from-scratch rohitg00/ai-engineering-from-scratch
NGINX 通用開發、維運與學習資源 NGINX nginx/nginx
Trivy 通用開發、維運與學習資源 Trivy aquasecurity/trivy
Go 通用開發、維運與學習資源 Go golang/go
Jimmy 通用開發、維運與學習資源 Jimmy marph91/jimmy
Joplin 通用開發、維運與學習資源 Joplin laurent22/joplin

怎麼使用這張表

如果你是開發者,優先看 AI 程式設計與 Coding AgentAgent 技能與工作流AI 應用開發基礎設施

如果你在做知識庫、私有資料問答或企業 RAG,優先看 RAG、知識庫與記憶,尤其是 OpenKBPageIndexMinerUPaddleOCRturbovec 這一組。

如果你在做內容和互動體驗,優先看 多模態與內容創作。新補入的 Open-LLM-VTuber 很適合研究本地語音角色、Live2D 和 LLM 的組合方式。

记录并分享
使用 Hugo 建立
主題 StackJimmy 設計