Introducción a Strix: usar AI Agents para pruebas de penetración automatizadas y corrección de vulnerabilidades

Strix es una herramienta de prueba de penetración de IA de código abierto. No se posiciona como un escáner estático tradicional, sino como un conjunto de agentes de pentesting de IA que pueden ejecutar código dinámicamente, explorar la superficie de ataque, intentar explotar y verificar vulnerabilidades. El proyecto README lo describe muy directamente: descubrir y corregir vulnerabilidades de aplicaciones de una manera similar a como lo hacen los hackers reales.

Este tipo de herramienta es más adecuada para equipos de desarrollo, equipos de seguridad y procesos DevSecOps: ejecute pruebas en repositorios de código locales, repositorios de GitHub, aplicaciones web o CI/CD para encontrar problemas de alto riesgo de manera temprana y unir reproducciones de vulnerabilidades, corregir recomendaciones e incluso generar parches.

Primero es necesario enfatizar los límites: Strix solo se puede usar con aplicaciones, repositorios y dominios que usted posea o que haya autorizado explícitamente. No lo utilice para objetivos no autorizados. El valor de las herramientas de prueba de penetración es ayudar a defender y remediar, no eludir la autorización.

¿Qué problema resuelve Strix?

Hay dos puntos débiles comunes en la detección de seguridad tradicional: el escaneo estático tiene muchos falsos positivos y las pruebas de penetración manuales tienen un ciclo largo. Lo que Strix quiere hacer es combinar agentes de inteligencia artificial, entornos de ejecución dinámica y cadenas de herramientas de pruebas de penetración para acercar los controles de seguridad a las rutas de ataque reales.

Sus capacidades principales incluyen:

Cadena de herramientas de pruebas de penetración integradas: el reconocimiento, la explotación, la verificación y otros pasos están disponibles de forma inmediata.
Orquestación de múltiples agentes: múltiples agentes de pruebas de penetración de IA pueden trabajar por separado y colaborar.
Verificación de vulnerabilidad real: énfasis en PoC ejecutable en lugar de solo advertencias estáticas.
CLI para desarrolladores: genera hallazgos procesables, pasos de reproducción y recomendaciones de corrección.
Remediación e informes automatizados: genere parches e informes de pruebas de penetración adecuados para escenarios de cumplimiento.

En otras palabras, Strix no solo le dice “puede haber un problema aquí”, sino que intenta responder tres preguntas más críticas: si el problema se puede explotar, cómo reproducirlo y cómo solucionarlo.

Escenarios aplicables

Los escenarios típicos que se dan en el archivo README de Strix incluyen:

Pruebas de seguridad de aplicaciones: Detecta y verifica vulnerabilidades críticas en las aplicaciones.
Pruebas de penetración rápida: comprima los ciclos de pruebas de penetración de semanas a tiempos más cortos y genere informes.
Automatización de recompensas de errores: ayudar en la investigación de recompensas de errores, generar PoC y materiales de reproducción.
Integración de CI/CD: ejecute pruebas de seguridad en solicitudes de extracción o canalizaciones de implementación para evitar que código de alto riesgo entre en producción.

Si el equipo ya cuenta con SAST, escaneo de dependencias y escaneo de contenedores, Strix puede complementarlo como una capa de validación dinámica. Es más adecuado para descubrir rutas “realmente abiertas”, como omisiones de control de acceso, fallas de lógica empresarial, problemas de autenticación de identidad, XSS, SSRF, inyección SQL, abuso de API, etc.

Preparación antes de la instalación

运行 Strix 前需要准备两类东西：

Docker y asegúrese de que Docker se esté ejecutando.
Una clave API para un proveedor de LLM compatible, como OpenAI, Anthropic, Google, etc.

Cuando se ejecuta por primera vez, Strix extraerá automáticamente la imagen de Docker del espacio aislado. Los resultados del escaneo se guardarán en:

1

strix_runs/<run-name>

Esto significa que no simplemente lee el archivo y genera inmediatamente la conclusión, sino que realiza pruebas y verificaciones dinámicas en un entorno sandbox. Antes de usarlo en proyectos de producción, se recomienda ejecutarlo en el almacén de prueba o en el entorno de ensayo para confirmar el alcance, el costo, el consumo de tiempo y el formato de salida.

Instalación y primer escaneo

El método de instalación proporcionado en el archivo README es ejecutar directamente el script de instalación oficial:

1

curl -sSL https://strix.ai/install | bash

Configure el proveedor de IA después de la instalación. Ejemplo usando OpenAI:

1
2


export STRIX_LLM="openai/gpt-5.4"
export LLM_API_KEY="your-api-key"

Luego ejecute la primera evaluación de seguridad en el directorio de la aplicación local:

1

strix --target ./app-directory

Si está más interesado en un repositorio remoto, también puede cambiar el destino a la URL de GitHub:

1

strix --target https://github.com/org/repo

Si desea realizar pruebas de aplicaciones web de caja negra, puede especificar la URL directamente:

1

strix --target https://your-app.com

Estas tres entradas corresponden a la biblioteca de códigos local, el almacén de códigos remoto y la aplicación en línea, respectivamente. En uso real, no amplíe el rango demasiado a la vez. Comenzar con un único servicio, un único repositorio o un dominio provisional facilita el control del ruido y el coste de las pruebas.

Métodos de escaneo avanzados

Strix admite la adición de instrucciones adicionales al Agente, lo cual es adecuado para pruebas de caja gris, pruebas de cuentas, pruebas de lógica empresarial y pruebas de alcance limitado.

Por ejemplo, realice pruebas de caja gris con información de autenticación:

1

strix --target https://your-app.com --instruction "Perform authenticated testing using credentials: user:pass"

Pruebe el código fuente y la aplicación implementada simultáneamente:

1

strix -t https://github.com/org/app -t https://your-app.com

Realice un escaneo de reconocimiento del código fuente del repositorio local:

1

strix --target ./app-directory --scan-mode standard

Centrarse en los defectos de la lógica empresarial y IDOR:

1

strix --target api.your-app.com --instruction "Focus on business logic flaws and IDOR vulnerabilities"

Si el alcance de la prueba, las reglas y las exclusiones son complejas, se pueden colocar en un archivo:

1

strix --target api.your-app.com --instruction-file ./instruction.md

En el escenario PR, puedes forzar a mirar solo el rango de diferencias de una determinada rama base:

1

strix -n --target ./ --scan-mode quick --scope-mode diff --diff-base origin/main

Estos parámetros son importantes. Cuanto más fuerte sea la herramienta de seguridad, más claro debe ser el alcance. Se recomienda escribir claramente en instruction.md los nombres de dominio, rutas, cuentas, comportamientos prohibidos, límites de tarifas, ventanas de prueba y contactos que están permitidos para realizar pruebas.

Modo sin cabeza

Las tareas de servidor, CI/CD y automatización normalmente no requieren una interfaz de usuario interactiva. Strix puede usar -n/--non-interactive para habilitar el modo sin cabeza:

1

strix -n --target https://your-app.com

En este modo, la CLI imprime los hallazgos de vulnerabilidad en tiempo real y genera un informe final antes de salir. Si se encuentra una vulnerabilidad, terminará con un código de salida distinto de cero. Esto es útil para CI/CD porque la canalización puede bloquear fusiones o lanzamientos en consecuencia.

Integración de acciones de GitHub

Strix se puede colocar en GitHub Actions para ejecutar pruebas de seguridad ligeras en solicitudes de extracción. El ejemplo README es aproximadamente el siguiente:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21


name: strix-penetration-test

on:
  pull_request:

jobs:
  security-scan:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v6
        with:
          fetch-depth: 0

      - name: Install Strix
        run: curl -sSL https://strix.ai/install | bash

      - name: Run Strix
        env:
          STRIX_LLM: ${{ secrets.STRIX_LLM }}
          LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
        run: strix -n -t ./ --scan-mode quick

Aquí hay dos detalles:

fetch-depth: 0 es importante, el análisis del rango de diferencias de PR requiere un historial completo.
La clave API debe colocarse en GitHub Secrets y no debe escribirse en el repositorio.

El archivo README también recuerda que cuando se ejecuta la solicitud de extracción de CI, Strix limitará automáticamente el alcance de la revisión rápida a los archivos modificados. Si el alcance de la diferencia no se puede resolver, asegúrese de que el proceso de pago utilice el historial completo o pase --diff-base explícitamente.

Elementos de configuración

Las variables de entorno más utilizadas son las siguientes:

1
2
3
4
5
6
7


export STRIX_LLM="openai/gpt-5.4"
export LLM_API_KEY="your-api-key"

# Optional
export LLM_API_BASE="your-api-base-url"  # if using a local model, e.g. Ollama, LMStudio
export PERPLEXITY_API_KEY="your-api-key"  # for search capabilities
export STRIX_REASONING_EFFORT="high"  # control thinking effort (default: high, quick scan: medium)

Strix guardará la configuración en:

1

~/.strix/cli-config.json

De esta manera no es necesario volver a ingresarlo cada vez que lo ejecuta. Los modelos README recomendados incluyen:

openai/gpt-5.4
anthropic/claude-sonnet-4-6
vertex_ai/gemini-3-pro-preview

Al elegir un modelo, puede elegir según el tipo de tarea: el escaneo rápido presta más atención a la velocidad y el costo; Las pruebas de penetración completas prestan más atención a la capacidad de razonamiento, el procesamiento del contexto y la estabilidad de la invocación de herramientas.

Qué vulnerabilidades se pueden detectar

Strix cubre el Top 10 de OWASP, así como temas más amplios de seguridad de aplicaciones. Los tipos enumerados en el archivo README incluyen:

Control de acceso roto: IDOR, escalada de privilegios, omisión de autenticación.
Ataques de inyección: inyección SQL, inyección NoSQL, inyección de comandos del sistema operativo, SSTI.
Vulnerabilidades del lado del servidor: SSRF, XXE, deserialización insegura, RCE.
Ataques del lado del cliente: almacenamiento/reflectante/DOM XSS, contaminación de prototipos, CSRF.
Defectos de lógica empresarial: condiciones de carrera, manipulación de pagos, elusión de procesos.
Autenticación y sesión: ataque JWT, fijación de sesión, relleno de credenciales.
Infraestructura y nube: configuraciones erróneas, servicios expuestos, problemas de seguridad en la nube.
Seguridad API: destrucción de autenticación, asignación masiva, omisión del límite actual.

Estas categorías ilustran que el objetivo de Strix no es solo verificar el estilo del código, sino también cubrir las pruebas de seguridad desde el código fuente hasta el comportamiento en tiempo de ejecución, desde la API hasta la lógica empresarial.

Herramientas de Pentesting Agentico

Strix Agent viene con un conjunto de herramientas de seguridad ofensivas, similar a la cadena de herramientas que usaría un probador de penetración profesional:

Proxy de intercepción HTTP: Intercepción, modificación y análisis de solicitudes/respuestas a través de Caido.
Explotación del navegador: navegador automatizado para probar XSS, CSRF, clickjacking, omisión de autenticación y otros procesos.
Shell y ejecución de comandos: terminal interactivo utilizado para el desarrollo de exploits y las fases posteriores a la explotación.
Tiempo de ejecución de exploit personalizado: entorno de pruebas de Python para escribir y verificar PoC.
Reconocimiento y OSINT: mapeo automatizado de superficies de ataque, enumeración de subdominios y toma de huellas digitales.
Análisis de código estático y dinámico: combinación de SAST y DAST.
Base de conocimientos sobre vulnerabilidades: descubrimiento estructurado de vulnerabilidades, incluidas clasificaciones CVSS y OWASP.

Esta es también la diferencia entre este y los escáneres comunes: el agente no solo coincide con las reglas, sino que también intenta combinar herramientas, verificar hipótesis y generar rutas de recurrencia.

Plataforma Strix

Además de la CLI de código abierto, Strix también ofrece la plataforma Strix. El README menciona que la versión de la plataforma puede conectar repositorios y nombres de dominio, iniciar el pentest en unos minutos y proporcionar:

Descubrimiento de vulnerabilidad verificado con PoC.
La reparación automática con un solo clic convierte los parches de seguridad generados por IA en PR fusionables.
Pentesting continuo, escaneo continuo después de la implementación.
Integraciones de DevSecOps: GitHub, GitLab, Bitbucket, Slack, Jira, Linear, CI/CD.
Aprendizaje continuo: adapte la base del código en función de los hallazgos históricos para reducir gradualmente los falsos positivos.

Si sólo desea validar la herramienta localmente, la CLI es suficiente; Si su equipo necesita escaneo, colaboración, generación de informes e integración empresarial continuos, la versión de la plataforma es más adecuada.

Capacidades de la versión Enterprise

El archivo README también menciona capacidades de pruebas de penetración a nivel empresarial, que incluyen:

SSO: SAML/OIDC.
Informes de cumplimiento: SOC 2, ISO 27001, PCI DSS y más.
Soporte dedicado y SLA.
Implementación personalizada: VPC/autohospedado.
Compatibilidad con el modelo BYOK.
Agentes de pentesting de IA personalizados para entornos empresariales.

Esta sección es adecuada para equipos con requisitos de cumplimiento, auditoría, procesos de seguridad interna y límites de datos.

Sugerencias de uso

Primero, use Strix en un entorno autorizado y aislado. Primero ejecute el repositorio local o el entorno de preparación y no realice pruebas de alta intensidad directamente en el sistema de producción.

Segundo, escriba un alcance claro para la prueba. Se recomienda mantener un instruction.md para registrar las rutas, cuentas, interfaces excluidas, operaciones destructivas prohibidas y ventanas de prueba que permitan realizar pruebas.

En tercer lugar, utilice primero el escaneo rápido cuando lo conecte a CI/CD. Una vez que el equipo comprenda el resultado, la tasa de falsos positivos y el costo, amplíe gradualmente el alcance de la prueba.

Cuarto, no considere la producción de IA como la conclusión final de seguridad. Incluso si Strix enfatiza una PoC real, aún así debe ser revisada por un ingeniero de seguridad o un líder de desarrollo para confirmar los riesgos, las áreas de impacto y las correcciones.

Quinto, la gestión de claves debe ser cautelosa. Las contraseñas de LLM_API_KEY, PERPLEXITY_API_KEY y de las cuentas de prueba deben colocarse en un sistema de gestión secreto seguro y no deben escribirse en el historial de comandos, registros o repositorios.

Resumen

Strix presenta agentes de IA, cadenas de herramientas de pruebas de penetración, verificación PoC y flujos de trabajo de desarrolladores. Es adecuado para complementar los puntos ciegos de los escáneres tradicionales, especialmente para una rápida retroalimentación de seguridad en las etapas de verificación dinámica, lógica empresarial y CI/CD.

Tampoco es una herramienta que “reemplaza automáticamente a los equipos de seguridad”. Una forma más razonable de utilizar Strix es utilizar Strix como un asistente eficiente de pruebas de seguridad de IA: le ayuda a descubrir problemas verificables más rápido, genera materiales de reproducción y sugerencias de reparación, y luego el equipo completa el juicio de riesgos, la revisión del código y el lanzamiento oficial.