Clasificación de proyectos open source de AI en GitHub: de Coding Agents a RAG, personajes de voz locales y automatización

Índice actualizado del sitio con proyectos de AI en GitHub: AI Coding, flujos Agent, bases de conocimiento RAG, contenido multimodal, modelos locales, automatización e infraestructura para aplicaciones de AI.

Esta página organiza proyectos de AI en GitHub por dirección de uso: AI Coding y Coding Agents, skills y flujos Agent, RAG y bases de conocimiento, creación multimodal, modelos locales e inferencia, aplicaciones verticales y automatización, e infraestructura para desarrollar aplicaciones de AI. Cuando aparezcan nuevos proyectos, pueden añadirse con la misma estructura.

Resumen por categoría

Categoría Proyectos Ideal para
AI Coding y Coding Agents 31 Quienes usan Claude Code, Codex, Cursor, Agents de terminal o automatización de repositorios
Skills y flujos Agent 13 Quienes quieren estandarizar AI Coding, investigación, búsqueda laboral, tendencias o creación
RAG, bases de conocimiento y memoria 13 Quienes necesitan búsqueda documental, knowledge bases, memoria, OCR, parsing e índices vectoriales locales
Multimodal y creación de contenido 11 Quienes trabajan con imagen, vídeo, voz, humanos digitales, personajes Live2D y distribución
Aplicaciones verticales y automatización 12 Quienes exploran finanzas, trading, monitoreo, escritorio, navegador y automatización móvil
Infraestructura para aplicaciones de AI 10 Quienes construyen apps de AI, toolchains Agent, automatización web, frontend AI y API gateways
Modelos locales e inferencia 3 Usuarios centrados en modelos locales, cuantización, motores de inferencia y hardware
Desarrollo general, operaciones y recursos de aprendizaje 11 Quienes quieren reforzar infraestructura, frameworks, operaciones, seguridad y aprendizaje

AI Coding y Coding Agents

Esta categoría se centra en comprensión de código, modificación de código, flujos de ingeniería y agents de terminal. Es el grupo más grande, con 22 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
Ralph Ralph: convertir Claude Code y Amp en un ciclo autónomo de desarrollo snarktank/ralph Guiar Claude Code / Amp por PRD, planificación, ejecución y revisión Quienes quieren ordenar el flujo de AI Coding
Claude-Mem Claude-Mem: memoria de largo plazo entre sesiones para Claude Code thedotmack/claude-mem Añadir memoria entre sesiones a Claude Code Usuarios intensivos de Claude Code
Claude Code Hooks Mastery Claude Code Hooks Mastery: introducción a 13 etapas del ciclo de hooks disler/claude-code-hooks-mastery Aprender el ciclo de vida de hooks y control de automatización Quienes quieren personalizar Claude Code
Compound Engineering Plugin Compound Engineering Plugin: convertir AI Coding en ciclos de planificación, ejecución y revisión EveryInc/compound-engineering-plugin Dividir AI Coding en planificación, ejecución y revisión Usuarios que buscan ingeniería más disciplinada
free-claude-code free-claude-code: conectar Claude Code a OpenRouter, DeepSeek y modelos locales Alishahryar1/free-claude-code Conectar Claude Code a distintos backends mediante proxy Usuarios que quieren reducir costes
Hermes Agent Qué es Hermes Agent: visión general, ventajas, inicio rápido y comparación con OpenClaw NousResearch/hermes-agent Framework local de Agent con herramientas y ejecución de tareas Usuarios que quieren correr Agents locales
OpenHarness Qué puede hacer OpenHarness como Agent Harness open source HKUDS/OpenHarness Agent Harness y ejecución multi-agent Investigadores de orquestación Agent
CodexBridge Usar Codex con modelos nacionales: API compatibles con OpenAI y CodexBridge begonia599/CodexBridge Conectar Codex a APIs compatibles con OpenAI Usuarios que quieren usar Codex con modelos nacionales
ccx Usar CCX para gestionar APIs compatibles con OpenAI para Codex y modelos nacionales BenedictKing/ccx Gestionar proxies de API para Claude, Codex, Gemini y más Usuarios que alternan varios modelos
cc-haha cc-haha: un escritorio de trabajo para Claude Code NanmiCoder/cc-haha Workspace de escritorio y entrada Computer Use para Claude Code Usuarios de Claude Code que prefieren GUI
DeepSeek-TUI DeepSeek-TUI: convertir DeepSeek V4 en un agente de programación en terminal Hmbown/DeepSeek-TUI Ejecutar un agente de programación DeepSeek en terminal Usuarios de DeepSeek y línea de comandos
Open Design Open Design: convertir Claude Code y Codex en herramientas de diseño AI nexu-io/open-design Llevar Claude Code / Codex a generación de diseño Usuarios que quieren agentes para prototipos
agentmemory agentmemory: memoria persistente para Claude Code, Codex y Cursor rohitg00/agentmemory Añadir memoria persistente a coding agents Desarrolladores con proyectos largos
Graphify Graphify: convertir una base de código en un grafo consultable por AI safishamsi/graphify Convertir código en grafo de conocimiento para reducir lecturas repetidas Usuarios con bases de código grandes
oh-my-pi Qué es oh-my-pi: un asistente de AI coding que conecta terminal, IDE y depurador can1357/oh-my-pi Conectar terminal, IDE, LSP y depurador como consola local de AI coding Desarrolladores que quieren unir flujos CLI e IDE
Claude Plugins Official Claude Code ya tiene directorio de plugins: qué instalar, cómo instalarlo y qué cuidar anthropics/claude-plugins-official Directorio oficial de plugins de Claude Code y punto de instalación Usuarios que quieren ampliar Claude Code
CodeGraph Qué es CodeGraph: un mapa local de código para Claude Code, Codex y Cursor colbymchenry/codegraph Generar índices locales y grafos de relación para ayudar a Coding Agents a entender proyectos Desarrolladores que mantienen bases de código medianas o grandes
CC Switch CC Switch: gestionar Claude Code, Codex, Gemini CLI y OpenClaw en una herramienta de escritorio farion1231/cc-switch Gestionar varias CLI de AI y cambios de cuenta/configuración Usuarios de varias CLI
Warp Warp open source: del terminal al Agentic Development Environment warpdotdev/warp Terminal y entorno de desarrollo agentic Usuarios intensivos de terminal
opencode opencode vs Claude Code vs Codex: guía de herramientas open source de AI Coding anomalyco/opencode Agent open source para AI Coding Quienes buscan alternativas a Claude Code / Codex
9Router 9Router: conectar Claude Code, Codex y Cursor a un único router de AI decolua/9router Ruteo de modelos para AI Coding y control de coste de tokens Usuarios multi-herramienta y multi-modelo
goose goose: AI Agent open source para escritorio, CLI y API aaif-goose/goose Agent open source en escritorio, CLI y API Usuarios que quieren un workspace Agent general

Skills y flujos Agent

Esta categoría convierte capacidades de AI en skills, procesos y especificaciones repetibles. Incluye 7 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
mattpocock/skills Rechazar Vibe Coding: el repo skills de Matt Pocock añade restricciones de ingeniería mattpocock/skills Usar skills para controlar flujos de AI Coding Quienes quieren disciplina de ingeniería para Agents
Superpowers Superpowers: devolver Coding Agents al flujo de ingeniería obra/superpowers Framework de skills agentic y metodología de desarrollo Quienes quieren flujos sistemáticos con Coding Agents
Prompt-Vault Prompt-Vault: biblioteca de especificaciones de prompts para probar AI Coding w512/Prompt-Vault Reunir prompts de prueba para AI Coding Evaluadores de modelos y herramientas
web-video-presentation web-video-presentation: skill Agent para convertir artículos en videos web grabables ConardLi/garden-skills Convertir artículos en videos web grabables Creadores y usuarios de automatización
nuwa-skill nuwa-skill: convertir “destilar una persona” en un flujo ejecutable alchaincyf/nuwa-skill Reproducir estilo expresivo y flujo de pensamiento con skill Usuarios que construyen Agents de estilo
Scientific Agent Skills Scientific Agent Skills: entregar flujos científicos a AI Agents K-Dense-AI/scientific-agent-skills Colección de skills para investigación científica Investigadores, analistas y redactores técnicos
easy-vibe easy-vibe: mapa de aprendizaje para principiantes de Vibe Coding datawhalechina/easy-vibe Mapa de aprendizaje de Vibe Coding Principiantes de AI Coding

RAG, bases de conocimiento y memoria

Esta categoría aborda búsqueda documental, construcción de bases de conocimiento, memoria de largo plazo y extracción estructurada. Incluye 7 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
LangExtract Google LangExtract: extraer datos estructurados de textos largos con LLM google/langextract Extraer información estructurada de textos largos Usuarios de extracción de información y datos
qmd qmd: búsqueda local en Markdown para AI Agents tobi/qmd Búsqueda local en documentos Markdown Usuarios que gestionan conocimiento en Markdown
Firecrawl Firecrawl: búsqueda, crawling e interacción web para AI Agents firecrawl/firecrawl Crawling web, búsqueda y entrada de datos estructurados Usuarios de RAG e ingestión de datos para Agents
RAGFlow RAGFlow: funciones y uso de un motor RAG open source infiniflow/ragflow Motor RAG open source Bases de conocimiento empresariales y Q&A documental
OpenHuman OpenHuman: ruta de escritorio para AI Agent personal open source tinyhumansai/openhuman Agent personal local-first y capa de memoria Usuarios que quieren integrar datos personales
OpenKB OpenKB: compilar documentos en bases de conocimiento LLM actualizables VectifyAI/OpenKB Compilar documentos en bases de conocimiento actualizables Mantenedores de documentación y conocimiento
PageIndex PageIndex: indexación RAG razonada sin bases vectoriales VectifyAI/PageIndex Indexación documental razonada sin bases vectoriales Usuarios que siguen nuevas rutas de RAG

Multimodal y creación de contenido

Esta categoría cubre imágenes, video, transcripción y distribución de contenido. Incluye 5 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
rembg rembg: herramienta local para quitar fondos de imágenes danielgatis/rembg Eliminación local de fondos E-commerce, diseño y procesamiento de imágenes
awesome-gpt-image-2-prompts Biblioteca de prompts GPT-Image 2: e-commerce, pósters, retratos y UI EvoLinkAI/awesome-gpt-image-2-prompts Prompts y casos para GPT-Image 2 Usuarios de AI Art y prompts
faster-whisper faster-whisper: motor Whisper más rápido para transcripción SYSTRAN/faster-whisper Speech-to-text de alto rendimiento Usuarios de subtítulos, transcripción y voz
Pixelle-Video Pixelle-Video: motor AI open source para generar videos cortos desde un tema AIDC-AI/Pixelle-Video Flujo para generar videos cortos desde un tema Creadores de videos cortos y AIGC
AiToEarn ¿Demasiadas plataformas de contenido? AiToEarn usa Agents para ahorrar trabajo yikart/AiToEarn Distribución multicanal y automatización para creadores Operadores de contenido y creadores

Modelos locales e inferencia

Esta categoría se centra en ejecución local de modelos y experimentos de inferencia. Actualmente tiene menos proyectos, con 1 proyecto.

Proyecto Artículo GitHub Uso principal Para quién
ds4 Ejecutar DeepSeek 4 localmente: Antirez ds4 en Apple Silicon Mac antirez/ds4 Experimentar con DeepSeek 4 en Apple Silicon Usuarios de modelos locales e inferencia

Aplicaciones verticales y automatización

Esta categoría aplica Agents o AI a finanzas, trading, navegadores, escritorio, monitoreo de comercio electrónico y otros escenarios concretos. Incluye 7 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
TradingAgents-CN TradingAgents-CN: framework multi-agent para investigación de trading financiero en chino hsliuping/TradingAgents-CN Framework multi-agent de investigación financiera Investigadores quant, financieros y de Agents
FinceptTerminal FinceptTerminal: terminal financiero open source, investigación quant y workspace AI Agent Fincept-Corporation/FinceptTerminal Terminal financiero, investigación quant y workspace Agent Analistas financieros y usuarios quant
Anthropic financial-services Anthropic financial-services: plantillas reutilizables para escenarios Agent financieros anthropics/financial-services Plantillas de Agents para servicios financieros Usuarios que crean soluciones AI financieras
ai-goofish-monitor ai-goofish-monitor: sistema open source de monitoreo AI para productos de Xianyu Usagi-org/ai-goofish-monitor Monitoreo de productos y automatización de Xianyu Usuarios de monitoreo de segunda mano
CloakBrowser CloakBrowser: navegador más humano para Playwright y Puppeteer CloakHQ/CloakBrowser Entorno de automatización de navegador más humano Automatización de navegador y operación Agent
UI-TARS-desktop ¿Dejar que AI use el ordenador? UI-TARS-desktop conecta escritorio, navegador y herramientas bytedance/UI-TARS-desktop Agent para operar escritorio, navegador y herramientas Usuarios que quieren que AI opere el ordenador
AI-Trader Qué es AI-Trader: plataforma para señales y simulación de trading con Agents HKUDS/AI-Trader Señales de trading y simulación con AI Agent Investigadores de trading y Agents financieros

Infraestructura para aplicaciones de AI

Esta categoría ofrece componentes base para construir aplicaciones de AI y toolchains Agent. Incluye 5 proyectos.

Proyecto Artículo GitHub Uso principal Para quién
Prompt Optimizer Prompt Optimizer: optimización, pruebas y herramientas MCP open source linshenkx/prompt-optimizer Optimización de prompts, pruebas y MCP Usuarios de prompt engineering y ajuste de apps
Playwright CLI Playwright CLI: instalación, skills, sesiones y comandos comunes microsoft/playwright-cli CLI de automatización de navegador para coding agents Usuarios Agent que necesitan operar navegador
Vercel AI SDK Qué es Vercel AI SDK: toolkit unificado para apps AI en TypeScript vercel/ai SDK para aplicaciones AI en TypeScript Desarrolladores front-end y full-stack
CLIProxyAPI CLIProxyAPI: envolver Codex, Claude Code y Gemini CLI como APIs unificadas router-for-me/CLIProxyAPI Envolver varias CLI de AI y estados OAuth como APIs compatibles Usuarios que quieren acceso unificado a Codex, Claude Code y Gemini CLI
CLIProxyAPI Management Center CLIProxyAPI Management Center: una consola visual para administrar CLIProxyAPI router-for-me/Cli-Proxy-API-Management-Center Interfaz web para configuración, cuentas, logs y OAuth de CLIProxyAPI Usuarios que usan CLIProxyAPI como gateway de equipo o pool de cuentas

Últimos proyectos añadidos en el sitio

Estos proyectos se añadieron después del índice traducido anterior y sincronizan esta versión con la fuente china actualizada.

Project Category Article GitHub
OpenAI Symphony AI Coding y Coding Agents OpenAI Symphony openai/symphony
GitHub Spec Kit AI Coding y Coding Agents GitHub Spec Kit github/spec-kit
oh-my-codex AI Coding y Coding Agents oh-my-codex Yeachan-Heo/oh-my-codex
RTK AI Coding y Coding Agents RTK rtk-ai/rtk
Headroom AI Coding y Coding Agents Headroom chopratejas/headroom
DeepSeek-Reasonix AI Coding y Coding Agents DeepSeek-Reasonix esengine/DeepSeek-Reasonix
Understand-Anything AI Coding y Coding Agents Understand-Anything Lum1104/Understand-Anything
Taste Skill Skills y flujos Agent Taste Skill Leonxlnx/taste-skill
academic-research-skills Skills y flujos Agent academic-research-skills Imbad0202/academic-research-skills
last30days-skill Skills y flujos Agent last30days-skill mvanhorn/last30days-skill
Agent-Reach Skills y flujos Agent Agent-Reach Panniantong/Agent-Reach
Personal AI Infrastructure Skills y flujos Agent Personal AI Infrastructure danielmiessler/Personal_AI_Infrastructure
career-ops Skills y flujos Agent career-ops santifer/career-ops
EverOS RAG, bases de conocimiento y memoria EverOS EverMind-AI/EverOS
MemPalace RAG, bases de conocimiento y memoria MemPalace MemPalace/mempalace
open-notebook RAG, bases de conocimiento y memoria open-notebook lfnovo/open-notebook
PaddleOCR RAG, bases de conocimiento y memoria PaddleOCR PaddlePaddle/PaddleOCR
MinerU RAG, bases de conocimiento y memoria MinerU opendatalab/MinerU
turbovec RAG, bases de conocimiento y memoria turbovec RyanCodrai/turbovec
HyperFrames Multimodal y creación de contenido HyperFrames heygen-com/hyperframes
OpenAI Whisper Multimodal y creación de contenido OpenAI Whisper openai/whisper
VibeVoice Multimodal y creación de contenido VibeVoice microsoft/VibeVoice
LongCat-Video Multimodal y creación de contenido LongCat-Video meituan-longcat/LongCat-Video
WavFlow Multimodal y creación de contenido WavFlow facebookresearch/WavFlow
Open-LLM-VTuber Multimodal y creación de contenido Open-LLM-VTuber Open-LLM-VTuber/Open-LLM-VTuber
xianyu-auto-reply Aplicaciones verticales y automatización xianyu-auto-reply zhinianboke/xianyu-auto-reply
MobiAgent Aplicaciones verticales y automatización MobiAgent IPADS-SAI/MobiAgent
Mobile-Agent Aplicaciones verticales y automatización Mobile-Agent X-PLUG/MobileAgent
Mobilerun Aplicaciones verticales y automatización Mobilerun droidrun/mobilerun
mobile-use Aplicaciones verticales y automatización mobile-use minitap-ai/mobile-use
browser-harness Infraestructura para aplicaciones de AI browser-harness browser-use/browser-harness
CopilotKit Infraestructura para aplicaciones de AI CopilotKit CopilotKit/CopilotKit
Vite Infraestructura para aplicaciones de AI Vite vitejs/vite
Svelte Infraestructura para aplicaciones de AI Svelte sveltejs/svelte
Microsoft MXC Infraestructura para aplicaciones de AI Microsoft MXC microsoft/mxc
Remotion Infraestructura para aplicaciones de AI Remotion remotion-dev/remotion
llama.cpp Modelos locales e inferencia llama.cpp ggml-org/llama.cpp
NVIDIA Model Optimizer Modelos locales e inferencia NVIDIA Model Optimizer NVIDIA/Model-Optimizer
English-level-up-tips Desarrollo general, operaciones y recursos de aprendizaje English-level-up-tips byoungd/English-level-up-tips
ai-engineering-from-scratch Desarrollo general, operaciones y recursos de aprendizaje ai-engineering-from-scratch rohitg00/ai-engineering-from-scratch
NGINX Desarrollo general, operaciones y recursos de aprendizaje NGINX nginx/nginx
Trivy Desarrollo general, operaciones y recursos de aprendizaje Trivy aquasecurity/trivy
Go Desarrollo general, operaciones y recursos de aprendizaje Go golang/go
Jimmy Desarrollo general, operaciones y recursos de aprendizaje Jimmy marph91/jimmy
Joplin Desarrollo general, operaciones y recursos de aprendizaje Joplin laurent22/joplin

Cómo usar esta tabla

Si eres desarrollador, empieza por AI Coding y Coding Agents, Skills y flujos Agent e Infraestructura para aplicaciones de AI.

Si construyes bases de conocimiento, QA privado o RAG empresarial, empieza por RAG, bases de conocimiento y memoria, especialmente OpenKB, PageIndex, MinerU, PaddleOCR y turbovec.

Si trabajas en contenido o experiencias de interacción, empieza por Multimodal y creación de contenido. El nuevo Open-LLM-VTuber es especialmente útil para estudiar personajes de voz locales, Live2D e integración con LLM.

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy