Resumen de los principales anuncios de Google I/O 2026: Gemini 3.5 Flash, Gemini Omni, la evolución agentic de Gemini app, Antigravity 2.0, Gemini API Managed Agents, Google AI Studio, Search, Android AppFunctions y el ecosistema de IA multidispositivo de Google.
Introducción a VectifyAI/PageIndex: un proyecto RAG sin base vectorial y basado en razonamiento para documentos largos. Usa un índice en árbol tipo tabla de contenidos y búsqueda con LLM para recuperación sensible al contexto, útil para informes financieros, documentos regulatorios, papers, documentos legales y manuales técnicos.
Resumen práctico de la guía de Microsoft sobre la expiración de certificados de Windows Secure Boot y la actualización de CA 2023: los certificados de 2011 empiezan a expirar en 2026, y los dispositivos deben migrar mediante actualizaciones de Windows, firmware u OEM para seguir recibiendo futuras protecciones de Secure Boot.
Guía de formas gratuitas o de baja fricción para usar Gemini 3.5 Flash y Gemini Omni: Gemini app, Google AI Studio, API key gratuita, Gemini CLI, Google Flow, límites y precauciones.
Una introducción a Gemini Omni de Google DeepMind: un modelo para creación y edición de video que admite cambios en múltiples turnos mediante lenguaje natural, referencias de imagen/texto/video/audio, comprensión física y del mundo, y acceso desde Gemini, Google Flow y YouTube Shorts.
Resumen práctico del impacto de cuatro riesgos locales recientes en Linux: Copy Fail, Dirty Frag, Fragnesia y ssh-keysign-pwn, con foco en servidores, contenedores, CI, entornos multi-tenant y respuesta operativa.
Google lanzó la serie Gemini 3.5, empezando por Gemini 3.5 Flash, con énfasis en flujos de agentes, programación, generación de UI multimodal, automatización empresarial y el agente personal Gemini Spark.
Introducción a bytedance/UI-TARS-desktop, un stack open source de agentes multimodales con Agent TARS y UI-TARS Desktop para terminal, navegador, operaciones GUI de escritorio e integración con herramientas MCP.
Introducción a yikart/AiToEarn, una plataforma de marketing de contenidos con IA para creadores, marcas y empresas unipersonales, con creación, publicación multiplataforma, engagement, monetización, Web, OpenClaw, MCP, Docker y despliegue desde código.
Introducción a rohitg00/agentmemory, un sistema de memoria persistente para AI coding agents compatible con Claude Code, Codex CLI, Cursor, Gemini CLI, MCP, hooks y contexto local compartido.
Introducción a HKUDS/AI-Trader, una plataforma de trading para AI Agents con registro de agentes, señales, discusión, paper trading, copy trading y acceso a varios mercados. Este artículo no es asesoramiento financiero.
Introducción a CloakHQ/CloakBrowser, un proyecto de automatización basado en Chromium personalizado, con flujos para Python, JavaScript, Docker y Profile Manager en pruebas y agentes que necesitan un comportamiento de navegador más realista.
Guía práctica de los binarios precompilados de llama.cpp para Windows: cómo elegir CUDA, Vulkan, HIP y SYCL, arrancar modelos GGUF, usar modelos visuales multimodales y gestionar modelos locales.
Un repaso de Skills populares para generar PPT, organizadas por presentaciones HTML, PPTX nativo, flujos con imágenes de IA, protocolos MCP y plataformas de diseño integradas.
Una introducción a jackwener/wx-cli, una CLI para datos locales de WeChat: cómo su arquitectura con daemon consulta sesiones, historial de chats, contactos, miembros de grupos, Moments, artículos de cuentas oficiales, adjuntos y estadísticas, y cómo ofrece salida estructurada para Claude Code, Cursor, Codex y otros agentes.
Introducción a nexu-io/open-design, un proyecto open source de diseño con IA que conecta Agent CLIs locales como Claude Code, Codex, Cursor y Gemini a un flujo de diseño con Skills, Design Systems, daemon local y vistas previas en sandbox.
Comparación entre la atención comprimida híbrida CSA/HCA de DeepSeek-V4 y los enfoques tradicionales MHA, GQA y MLA, explicando por qué DeepSeek-V4 reduce mucho la memoria de KV Cache en contextos de 1M tokens.
Guía práctica sobre la invalidación de Prompt Cache en Claude Code: cómo cambiar de modelo, modificar MCP, editar CLAUDE.md, instalar Skills o dejar la sesión inactiva afecta la tasa de aciertos y el costo en tokens.
Comparación práctica entre Midjourney y Stable Diffusion en calidad visual, control, costo, requisitos de hardware, flujos comerciales y usuarios ideales.
Anthropic publicó The Founder’s Playbook para startups AI-native, organizado en las etapas Idea, MVP, Launch y Scale, y explicó cómo Claude Code, Claude Cowork y Claude Chat pueden ayudar a reducir trabajo repetitivo.
Figure AI usó una transmisión en YouTube para mostrar robots humanoides F.03 clasificando paquetes de forma continua. Este artículo explica la prueba, el sistema Helix-02, el debate sobre velocidad y precisión, y su significado para la automatización logística.
Sulphur 2 es un modelo open-weights de generación de video con IA ajustado a partir de LTX 2.3. Este artículo explica su posicionamiento técnico, pesos abiertos, respuesta a prompts, requisitos de hardware y el debate sobre límites de contenido y riesgo de abuso.
Cerebras se disparó tras debutar en Nasdaq. Este artículo revisa su IPO, la arquitectura wafer-scale WSE, la colaboración con OpenAI, el riesgo de concentración de clientes y los límites técnicos que enfrenta al competir con Nvidia.
Comparativa práctica de generadores gratuitos de imágenes con IA: herramientas open source locales, plataformas web con créditos gratis y productos de grandes compañías para elegir el free ai image generator adecuado.
Una visión práctica del proyecto vercel/ai: su posicionamiento, funciones clave, arquitectura de providers unificada, generación en streaming, tool calling, integración de UI, AI Gateway y casos de uso adecuados.
Un repaso práctico de la precisión de QuillBot AI Detector, cómo funciona la detección de texto con IA, quién debería usarla y qué riesgos de falsos positivos y cumplimiento deben entender estudiantes, docentes y creadores.
Resumen del Office Hours de Midjourney del 14 de mayo de 2026: mejoras del modo conversacional, desarrollo asistido por IA más rápido, rediseño web, organización de SREF y etiquetas, Omni-reference y cambios en el flujo creativo.
Un resumen del recorrido de Peter Steinberger desde PSPDFKit hasta OpenClaw, y de sus ideas sobre desarrollo de software con IA, vibe coding, validación en bucle cerrado y agentes personales.
Guía práctica de Hugo aliases: para qué sirven, casos de uso comunes, sintaxis de Front Matter y diferencias entre redirecciones HTML predeterminadas y redirecciones del servidor.
Resumen del AI Threat Tracker de Google GTIG de mayo de 2026: zero-days asistidos por IA, validación masiva de PoC por APT45, PROMPTSPY y riesgos de cadena de suministro de IA están cambiando el ritmo de la defensa.
Scientific Agent Skills es una colección open source de Agent Skills mantenida por K-Dense-AI. Está orientada a investigación, ingeniería, análisis de datos, finanzas y escritura, y empaqueta bases de datos científicas, paquetes Python, flujos de análisis y escritura científica como skills que pueden usar los AI Agents.
Bun es una toolchain open source todo en uno para JavaScript / TypeScript creada por oven-sh. Combina runtime, gestor de paquetes, runner de scripts, test runner y bundler en un único comando bun, con el objetivo de mejorar arranque, instalación y experiencia de desarrollo manteniendo compatibilidad amplia con el ecosistema Node.js.
RuView es una plataforma open source de percepción espacial con WiFi CSI creada por ruvnet. Explora cómo extraer presencia, respiración, ritmo cardíaco, actividad, postura y cambios del entorno a partir de señales WiFi con hardware barato como ESP32-S3. El proyecto sigue en beta y encaja mejor en investigación, prototipos y exploración de sensores en el borde.
Resumen de la vulnerabilidad SSRF de alta gravedad CVE-2026-44578 en Next.js. Afecta a aplicaciones Next.js autoalojadas que usan el servidor Node.js integrado; solicitudes WebSocket upgrade especialmente construidas pueden hacer que el servidor actúe como proxy hacia destinos internos o externos. Las versiones corregidas son 15.5.16 y 16.2.5.
ai-goofish-monitor es un sistema open-source de Usagi-org para monitorizar productos en Goofish. Basado en Playwright e IA, ofrece monitoreo multitarea en tiempo real o programado, interfaz web, análisis de productos con IA, rotación de cuentas y proxies, notificaciones y despliegue con Docker.
OpenKB es una herramienta CLI de base de conocimiento LLM de código abierto creada por VectifyAI. Compila PDFs, archivos Word, Markdown, páginas web y otros documentos en una wiki Markdown con resúmenes, páginas de conceptos y enlaces cruzados, usando PageIndex para recuperación en documentos largos y contenido multimodal.
Guía para empezar con Godot desde cero: nodos, escenas, scripts, entrada, física, organización de recursos y una ruta para crear un primer juego 2D con movimiento, colisiones, UI, audio y exportación.
A partir del caso de ENEMY, con 840 millones de reproducciones y unos 2.000 yuanes de reparto, explicamos por qué las vistas no equivalen a vistas monetizables, por qué el tráfico gratuito no es ingreso en efectivo y por qué el short drama depende cada vez más de programas de plataforma, acuerdos comerciales y pagos de usuarios.
Cómo elegir entre FreeRTOS, RT-Thread y Zephyr. Comparación de los tres RTOS desde kernel, modelo de dispositivos, ecosistema de fabricantes, Devicetree, código de aplicación y coste de mantenimiento.
Resumen de la filtración más reciente sobre Google Gemini Spark BETA: podría ser un AI Agent always-on probado dentro de Gemini Web para gestionar correo, tareas online, flujos de varios pasos y contexto del ecosistema Google, aunque todavía no ha sido lanzado oficialmente y requiere confirmación de Google.
Resumen de la filtración de 36Kr / Xinzhiyuan sobre Gemini 3.5 Pro y Gemini Spark: el modelo con nombre en clave Cappuccino aún no ha sido lanzado oficialmente, pero capturas de la comunidad, benchmarks anónimos y fuentes de medios sugieren que Google está reforzando coding, razonamiento, generación multimodal y agentes always-on.
Repaso práctico de ssh-keysign-pwn (CVE-2026-46333): impacto, causa, estado de parches, mitigaciones temporales y recomendaciones operativas para una condición de carrera en las comprobaciones ptrace del kernel de Linux que puede exponer claves privadas de host SSH y /etc/shadow.
Resumen del anuncio de Google de mayo de 2026 sobre Gemini Intelligence on Android: automatización de varios pasos, navegación inteligente en Chrome, Autofill, Rambler, widgets por lenguaje natural y el giro de Android hacia un sistema de IA proactivo.
Análisis de la actualización de Codex del 14 de mayo de 2026: acceso remoto a tareas largas de Codex desde ChatGPT móvil y Codex access tokens para espacios Enterprise.
Resumen del ensayo de Anthropic de mayo de 2026, “2028: Two scenarios for global AI leadership”: cómo plantea la competencia de IA entre Estados Unidos y China, la ventaja en cómputo, los controles de exportación, los ataques de destilación y dos posibles futuros para 2028.
Una revisión para principiantes sobre cómo evolucionó la arquitectura de los LLM entre 2023 y 2026: qué resuelven los tokenizadores, la codificación posicional, la atención, MoE, la normalización y las funciones de activación, y por qué casi todos los cambios giran en torno a eficiencia, contexto largo y coste de inferencia.
Resumen de por qué los usage limits de Codex pueden reiniciarse sin aviso, su historial, cómo interpretarlos y qué fuentes consultar, como publicaciones de Tibo, OpenAI Status, GitHub issues y debates de la comunidad.
datawhalechina/easy-vibe es un proyecto open source de aprendizaje para principiantes de Vibe Coding. Con tutoriales, ejercicios y rutas avanzadas, conecta AI Coding, RAG, herramientas de terminal, Claude Code, MCP, Skills y Agent Teams en un camino más fácil de seguir.
anthropics/financial-services es un proyecto de referencia de Anthropic para la industria de servicios financieros. Ofrece ejemplos de Agents, Plugins, Skills y conectores MCP para banca de inversión, investigación, private equity, wealth management, operaciones de fondos y KYC.
DeepSeek-TUI es un proyecto de agente de programación en terminal para DeepSeek V4. Ofrece TUI, llamadas a herramientas, modo Auto, subagentes, sandbox y cola de tareas persistente para desarrolladores que quieren usar DeepSeek en tareas de código desde la línea de comandos.