Clasificación de proyectos open source de AI en GitHub: de Coding Agents a RAG, personajes de voz locales y automatización

Esta página organiza proyectos de AI en GitHub por dirección de uso: AI Coding y Coding Agents, skills y flujos Agent, RAG y bases de conocimiento, creación multimodal, modelos locales e inferencia, aplicaciones verticales y automatización, e infraestructura para desarrollar aplicaciones de AI. Cuando aparezcan nuevos proyectos, pueden añadirse con la misma estructura.

Resumen por categoría

Categoría	Proyectos	Ideal para
AI Coding y Coding Agents	31	Quienes usan Claude Code, Codex, Cursor, Agents de terminal o automatización de repositorios
Skills y flujos Agent	13	Quienes quieren estandarizar AI Coding, investigación, búsqueda laboral, tendencias o creación
RAG, bases de conocimiento y memoria	13	Quienes necesitan búsqueda documental, knowledge bases, memoria, OCR, parsing e índices vectoriales locales
Multimodal y creación de contenido	11	Quienes trabajan con imagen, vídeo, voz, humanos digitales, personajes Live2D y distribución
Aplicaciones verticales y automatización	12	Quienes exploran finanzas, trading, monitoreo, escritorio, navegador y automatización móvil
Infraestructura para aplicaciones de AI	10	Quienes construyen apps de AI, toolchains Agent, automatización web, frontend AI y API gateways
Modelos locales e inferencia	3	Usuarios centrados en modelos locales, cuantización, motores de inferencia y hardware
Desarrollo general, operaciones y recursos de aprendizaje	11	Quienes quieren reforzar infraestructura, frameworks, operaciones, seguridad y aprendizaje

AI Coding y Coding Agents

Esta categoría se centra en comprensión de código, modificación de código, flujos de ingeniería y agents de terminal. Es el grupo más grande, con 22 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
Ralph	Ralph: convertir Claude Code y Amp en un ciclo autónomo de desarrollo	snarktank/ralph	Guiar Claude Code / Amp por PRD, planificación, ejecución y revisión	Quienes quieren ordenar el flujo de AI Coding
Claude-Mem	Claude-Mem: memoria de largo plazo entre sesiones para Claude Code	thedotmack/claude-mem	Añadir memoria entre sesiones a Claude Code	Usuarios intensivos de Claude Code
Claude Code Hooks Mastery	Claude Code Hooks Mastery: introducción a 13 etapas del ciclo de hooks	disler/claude-code-hooks-mastery	Aprender el ciclo de vida de hooks y control de automatización	Quienes quieren personalizar Claude Code
Compound Engineering Plugin	Compound Engineering Plugin: convertir AI Coding en ciclos de planificación, ejecución y revisión	EveryInc/compound-engineering-plugin	Dividir AI Coding en planificación, ejecución y revisión	Usuarios que buscan ingeniería más disciplinada
free-claude-code	free-claude-code: conectar Claude Code a OpenRouter, DeepSeek y modelos locales	Alishahryar1/free-claude-code	Conectar Claude Code a distintos backends mediante proxy	Usuarios que quieren reducir costes
Hermes Agent	Qué es Hermes Agent: visión general, ventajas, inicio rápido y comparación con OpenClaw	NousResearch/hermes-agent	Framework local de Agent con herramientas y ejecución de tareas	Usuarios que quieren correr Agents locales
OpenHarness	Qué puede hacer OpenHarness como Agent Harness open source	HKUDS/OpenHarness	Agent Harness y ejecución multi-agent	Investigadores de orquestación Agent
CodexBridge	Usar Codex con modelos nacionales: API compatibles con OpenAI y CodexBridge	begonia599/CodexBridge	Conectar Codex a APIs compatibles con OpenAI	Usuarios que quieren usar Codex con modelos nacionales
ccx	Usar CCX para gestionar APIs compatibles con OpenAI para Codex y modelos nacionales	BenedictKing/ccx	Gestionar proxies de API para Claude, Codex, Gemini y más	Usuarios que alternan varios modelos
cc-haha	cc-haha: un escritorio de trabajo para Claude Code	NanmiCoder/cc-haha	Workspace de escritorio y entrada Computer Use para Claude Code	Usuarios de Claude Code que prefieren GUI
DeepSeek-TUI	DeepSeek-TUI: convertir DeepSeek V4 en un agente de programación en terminal	Hmbown/DeepSeek-TUI	Ejecutar un agente de programación DeepSeek en terminal	Usuarios de DeepSeek y línea de comandos
Open Design	Open Design: convertir Claude Code y Codex en herramientas de diseño AI	nexu-io/open-design	Llevar Claude Code / Codex a generación de diseño	Usuarios que quieren agentes para prototipos
agentmemory	agentmemory: memoria persistente para Claude Code, Codex y Cursor	rohitg00/agentmemory	Añadir memoria persistente a coding agents	Desarrolladores con proyectos largos
Graphify	Graphify: convertir una base de código en un grafo consultable por AI	safishamsi/graphify	Convertir código en grafo de conocimiento para reducir lecturas repetidas	Usuarios con bases de código grandes
oh-my-pi	Qué es oh-my-pi: guía de instalación del asistente de AI coding que conecta terminal, IDE y depurador	can1357/oh-my-pi	Conectar terminal, IDE, LSP y depurador como consola local de AI coding	Desarrolladores que quieren unir flujos CLI e IDE
Claude Plugins Official	Claude Code ya tiene directorio de plugins: qué instalar, cómo instalarlo y qué cuidar	anthropics/claude-plugins-official	Directorio oficial de plugins de Claude Code y punto de instalación	Usuarios que quieren ampliar Claude Code
CodeGraph	Qué es CodeGraph: un mapa local de código para Claude Code, Codex y Cursor	colbymchenry/codegraph	Generar índices locales y grafos de relación para ayudar a Coding Agents a entender proyectos	Desarrolladores que mantienen bases de código medianas o grandes
CC Switch	CC Switch: gestionar Claude Code, Codex, Gemini CLI y OpenClaw en una herramienta de escritorio	farion1231/cc-switch	Gestionar varias CLI de AI y cambios de cuenta/configuración	Usuarios de varias CLI
Warp	Warp open source: del terminal al Agentic Development Environment	warpdotdev/warp	Terminal y entorno de desarrollo agentic	Usuarios intensivos de terminal
opencode	opencode vs Claude Code vs Codex: guía de herramientas open source de AI Coding	anomalyco/opencode	Agent open source para AI Coding	Quienes buscan alternativas a Claude Code / Codex
9Router	9Router: conectar Claude Code, Codex y Cursor a un único router de AI	decolua/9router	Ruteo de modelos para AI Coding y control de coste de tokens	Usuarios multi-herramienta y multi-modelo
goose	goose: AI Agent open source para escritorio, CLI y API	aaif-goose/goose	Agent open source en escritorio, CLI y API	Usuarios que quieren un workspace Agent general

Skills y flujos Agent

Esta categoría convierte capacidades de AI en skills, procesos y especificaciones repetibles. Incluye 7 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
mattpocock/skills	Rechazar Vibe Coding: el repo skills de Matt Pocock añade restricciones de ingeniería	mattpocock/skills	Usar skills para controlar flujos de AI Coding	Quienes quieren disciplina de ingeniería para Agents
Superpowers	Superpowers: devolver Coding Agents al flujo de ingeniería	obra/superpowers	Framework de skills agentic y metodología de desarrollo	Quienes quieren flujos sistemáticos con Coding Agents
Prompt-Vault	Prompt-Vault: biblioteca de especificaciones de prompts para probar AI Coding	w512/Prompt-Vault	Reunir prompts de prueba para AI Coding	Evaluadores de modelos y herramientas
web-video-presentation	web-video-presentation: skill Agent para convertir artículos en videos web grabables	ConardLi/garden-skills	Convertir artículos en videos web grabables	Creadores y usuarios de automatización
nuwa-skill	nuwa-skill: convertir “destilar una persona” en un flujo ejecutable	alchaincyf/nuwa-skill	Reproducir estilo expresivo y flujo de pensamiento con skill	Usuarios que construyen Agents de estilo
Scientific Agent Skills	Scientific Agent Skills: entregar flujos científicos a AI Agents	K-Dense-AI/scientific-agent-skills	Colección de skills para investigación científica	Investigadores, analistas y redactores técnicos
easy-vibe	easy-vibe: mapa de aprendizaje para principiantes de Vibe Coding	datawhalechina/easy-vibe	Mapa de aprendizaje de Vibe Coding	Principiantes de AI Coding

RAG, bases de conocimiento y memoria

Esta categoría aborda búsqueda documental, construcción de bases de conocimiento, memoria de largo plazo y extracción estructurada. Incluye 7 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
LangExtract	Google LangExtract: extraer datos estructurados de textos largos con LLM	google/langextract	Extraer información estructurada de textos largos	Usuarios de extracción de información y datos
qmd	qmd: búsqueda local en Markdown para AI Agents	tobi/qmd	Búsqueda local en documentos Markdown	Usuarios que gestionan conocimiento en Markdown
Firecrawl	Firecrawl: búsqueda, crawling e interacción web para AI Agents	firecrawl/firecrawl	Crawling web, búsqueda y entrada de datos estructurados	Usuarios de RAG e ingestión de datos para Agents
RAGFlow	RAGFlow: funciones y uso de un motor RAG open source	infiniflow/ragflow	Motor RAG open source	Bases de conocimiento empresariales y Q&A documental
OpenHuman	OpenHuman: ruta de escritorio para AI Agent personal open source	tinyhumansai/openhuman	Agent personal local-first y capa de memoria	Usuarios que quieren integrar datos personales
OpenKB	OpenKB: compilar documentos en bases de conocimiento LLM actualizables	VectifyAI/OpenKB	Compilar documentos en bases de conocimiento actualizables	Mantenedores de documentación y conocimiento
PageIndex	PageIndex: indexación RAG razonada sin bases vectoriales	VectifyAI/PageIndex	Indexación documental razonada sin bases vectoriales	Usuarios que siguen nuevas rutas de RAG

Multimodal y creación de contenido

Esta categoría cubre imágenes, video, transcripción y distribución de contenido. Incluye 5 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
rembg	rembg: herramienta local para quitar fondos de imágenes	danielgatis/rembg	Eliminación local de fondos	E-commerce, diseño y procesamiento de imágenes
awesome-gpt-image-2-prompts	Biblioteca de prompts GPT-Image 2: e-commerce, pósters, retratos y UI	EvoLinkAI/awesome-gpt-image-2-prompts	Prompts y casos para GPT-Image 2	Usuarios de AI Art y prompts
faster-whisper	faster-whisper: motor Whisper más rápido para transcripción	SYSTRAN/faster-whisper	Speech-to-text de alto rendimiento	Usuarios de subtítulos, transcripción y voz
Pixelle-Video	Pixelle-Video: motor AI open source para generar videos cortos desde un tema	AIDC-AI/Pixelle-Video	Flujo para generar videos cortos desde un tema	Creadores de videos cortos y AIGC
AiToEarn	¿Demasiadas plataformas de contenido? AiToEarn usa Agents para ahorrar trabajo	yikart/AiToEarn	Distribución multicanal y automatización para creadores	Operadores de contenido y creadores

Modelos locales e inferencia

Esta categoría se centra en ejecución local de modelos y experimentos de inferencia. Actualmente tiene menos proyectos, con 1 proyecto.

Proyecto	Artículo	GitHub	Uso principal	Para quién
ds4	Ejecutar DeepSeek 4 localmente: Antirez ds4 en Apple Silicon Mac	antirez/ds4	Experimentar con DeepSeek 4 en Apple Silicon	Usuarios de modelos locales e inferencia

Aplicaciones verticales y automatización

Esta categoría aplica Agents o AI a finanzas, trading, navegadores, escritorio, monitoreo de comercio electrónico y otros escenarios concretos. Incluye 7 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
TradingAgents-CN	TradingAgents-CN: framework multi-agent para investigación de trading financiero en chino	hsliuping/TradingAgents-CN	Framework multi-agent de investigación financiera	Investigadores quant, financieros y de Agents
FinceptTerminal	FinceptTerminal: terminal financiero open source, investigación quant y workspace AI Agent	Fincept-Corporation/FinceptTerminal	Terminal financiero, investigación quant y workspace Agent	Analistas financieros y usuarios quant
Anthropic financial-services	Anthropic financial-services: plantillas reutilizables para escenarios Agent financieros	anthropics/financial-services	Plantillas de Agents para servicios financieros	Usuarios que crean soluciones AI financieras
ai-goofish-monitor	ai-goofish-monitor: sistema open source de monitoreo AI para productos de Xianyu	Usagi-org/ai-goofish-monitor	Monitoreo de productos y automatización de Xianyu	Usuarios de monitoreo de segunda mano
CloakBrowser	CloakBrowser: navegador más humano para Playwright y Puppeteer	CloakHQ/CloakBrowser	Entorno de automatización de navegador más humano	Automatización de navegador y operación Agent
UI-TARS-desktop	¿Dejar que AI use el ordenador? UI-TARS-desktop conecta escritorio, navegador y herramientas	bytedance/UI-TARS-desktop	Agent para operar escritorio, navegador y herramientas	Usuarios que quieren que AI opere el ordenador
AI-Trader	Qué es AI-Trader: plataforma para señales y simulación de trading con Agents	HKUDS/AI-Trader	Señales de trading y simulación con AI Agent	Investigadores de trading y Agents financieros

Infraestructura para aplicaciones de AI

Esta categoría ofrece componentes base para construir aplicaciones de AI y toolchains Agent. Incluye 5 proyectos.

Proyecto	Artículo	GitHub	Uso principal	Para quién
Prompt Optimizer	Prompt Optimizer: optimización, pruebas y herramientas MCP open source	linshenkx/prompt-optimizer	Optimización de prompts, pruebas y MCP	Usuarios de prompt engineering y ajuste de apps
Playwright CLI	Playwright CLI: instalación, skills, sesiones y comandos comunes	microsoft/playwright-cli	CLI de automatización de navegador para coding agents	Usuarios Agent que necesitan operar navegador
Vercel AI SDK	Qué es Vercel AI SDK: toolkit unificado para apps AI en TypeScript	vercel/ai	SDK para aplicaciones AI en TypeScript	Desarrolladores front-end y full-stack
CLIProxyAPI	CLIProxyAPI: envolver Codex, Claude Code y Gemini CLI como APIs unificadas	router-for-me/CLIProxyAPI	Envolver varias CLI de AI y estados OAuth como APIs compatibles	Usuarios que quieren acceso unificado a Codex, Claude Code y Gemini CLI
CLIProxyAPI Management Center	CLIProxyAPI Management Center: una consola visual para administrar CLIProxyAPI	router-for-me/Cli-Proxy-API-Management-Center	Interfaz web para configuración, cuentas, logs y OAuth de CLIProxyAPI	Usuarios que usan CLIProxyAPI como gateway de equipo o pool de cuentas

Últimos proyectos añadidos en el sitio

Estos proyectos se añadieron después del índice traducido anterior y sincronizan esta versión con la fuente china actualizada.

Project	Category	Article	GitHub
OpenAI Symphony	AI Coding y Coding Agents	OpenAI Symphony	openai/symphony
GitHub Spec Kit	AI Coding y Coding Agents	GitHub Spec Kit	github/spec-kit
oh-my-codex	AI Coding y Coding Agents	oh-my-codex	Yeachan-Heo/oh-my-codex
RTK	AI Coding y Coding Agents	RTK	rtk-ai/rtk
Headroom	AI Coding y Coding Agents	Headroom	chopratejas/headroom
DeepSeek-Reasonix	AI Coding y Coding Agents	DeepSeek-Reasonix	esengine/DeepSeek-Reasonix
Understand-Anything	AI Coding y Coding Agents	Understand-Anything	Lum1104/Understand-Anything
Taste Skill	Skills y flujos Agent	Taste Skill	Leonxlnx/taste-skill
academic-research-skills	Skills y flujos Agent	academic-research-skills	Imbad0202/academic-research-skills
last30days-skill	Skills y flujos Agent	last30days-skill	mvanhorn/last30days-skill
Agent-Reach	Skills y flujos Agent	Agent-Reach	Panniantong/Agent-Reach
Personal AI Infrastructure	Skills y flujos Agent	Personal AI Infrastructure	danielmiessler/Personal_AI_Infrastructure
career-ops	Skills y flujos Agent	career-ops	santifer/career-ops
EverOS	RAG, bases de conocimiento y memoria	EverOS	EverMind-AI/EverOS
MemPalace	RAG, bases de conocimiento y memoria	MemPalace	MemPalace/mempalace
open-notebook	RAG, bases de conocimiento y memoria	open-notebook	lfnovo/open-notebook
PaddleOCR	RAG, bases de conocimiento y memoria	PaddleOCR	PaddlePaddle/PaddleOCR
MinerU	RAG, bases de conocimiento y memoria	MinerU	opendatalab/MinerU
turbovec	RAG, bases de conocimiento y memoria	turbovec	RyanCodrai/turbovec
HyperFrames	Multimodal y creación de contenido	HyperFrames	heygen-com/hyperframes
OpenAI Whisper	Multimodal y creación de contenido	OpenAI Whisper	openai/whisper
VibeVoice	Multimodal y creación de contenido	VibeVoice	microsoft/VibeVoice
LongCat-Video	Multimodal y creación de contenido	LongCat-Video	meituan-longcat/LongCat-Video
WavFlow	Multimodal y creación de contenido	WavFlow	facebookresearch/WavFlow
Open-LLM-VTuber	Multimodal y creación de contenido	Open-LLM-VTuber	Open-LLM-VTuber/Open-LLM-VTuber
xianyu-auto-reply	Aplicaciones verticales y automatización	xianyu-auto-reply	zhinianboke/xianyu-auto-reply
MobiAgent	Aplicaciones verticales y automatización	MobiAgent	IPADS-SAI/MobiAgent
Mobile-Agent	Aplicaciones verticales y automatización	Mobile-Agent	X-PLUG/MobileAgent
Mobilerun	Aplicaciones verticales y automatización	Mobilerun	droidrun/mobilerun
mobile-use	Aplicaciones verticales y automatización	mobile-use	minitap-ai/mobile-use
browser-harness	Infraestructura para aplicaciones de AI	browser-harness	browser-use/browser-harness
CopilotKit	Infraestructura para aplicaciones de AI	CopilotKit	CopilotKit/CopilotKit
Vite	Infraestructura para aplicaciones de AI	Vite	vitejs/vite
Svelte	Infraestructura para aplicaciones de AI	Svelte	sveltejs/svelte
Microsoft MXC	Infraestructura para aplicaciones de AI	Microsoft MXC	microsoft/mxc
Remotion	Infraestructura para aplicaciones de AI	Remotion	remotion-dev/remotion
llama.cpp	Modelos locales e inferencia	llama.cpp	ggml-org/llama.cpp
NVIDIA Model Optimizer	Modelos locales e inferencia	NVIDIA Model Optimizer	NVIDIA/Model-Optimizer
English-level-up-tips	Desarrollo general, operaciones y recursos de aprendizaje	English-level-up-tips	byoungd/English-level-up-tips
ai-engineering-from-scratch	Desarrollo general, operaciones y recursos de aprendizaje	ai-engineering-from-scratch	rohitg00/ai-engineering-from-scratch
NGINX	Desarrollo general, operaciones y recursos de aprendizaje	NGINX	nginx/nginx
Trivy	Desarrollo general, operaciones y recursos de aprendizaje	Trivy	aquasecurity/trivy
Go	Desarrollo general, operaciones y recursos de aprendizaje	Go	golang/go
Jimmy	Desarrollo general, operaciones y recursos de aprendizaje	Jimmy	marph91/jimmy
Joplin	Desarrollo general, operaciones y recursos de aprendizaje	Joplin	laurent22/joplin

Cómo usar esta tabla

Si eres desarrollador, empieza por AI Coding y Coding Agents, Skills y flujos Agent e Infraestructura para aplicaciones de AI.

Si construyes bases de conocimiento, QA privado o RAG empresarial, empieza por RAG, bases de conocimiento y memoria, especialmente OpenKB, PageIndex, MinerU, PaddleOCR y turbovec.

Si trabajas en contenido o experiencias de interacción, empieza por Multimodal y creación de contenido. El nuevo Open-LLM-VTuber es especialmente útil para estudiar personajes de voz locales, Live2D e integración con LLM.