Tutorial de OpenMontage: convertir un asistente de programación con IA en una línea de producción de vídeo

Guía práctica de calesthio/OpenMontage: instalación, dependencia de FFmpeg, configuración de API keys, opciones de GPU local y escenarios adecuados de producción de vídeo con IA.

calesthio/OpenMontage es un sistema open source de producción de vídeo agentic. Divide guion, recursos, voz, música, edición y composición en una línea de producción para que un asistente de programación con IA pueda participar en todo el proceso.

Repositorio del proyecto:

https://github.com/calesthio/OpenMontage

Instala primero las dependencias

El README pide preparar:

  1. Python 3.10+
  2. FFmpeg
  3. Node/npm, porque el proyecto incluye un Remotion composer

Puedes instalar FFmpeg así:

1
2
brew install ffmpeg
sudo apt install ffmpeg

Instalación e inicio

Los comandos oficiales de inicio rápido son:

1
2
3
git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
make setup

Si tu equipo no tiene make, puedes seguir el método manual del README:

1
2
3
4
5
6
pip install -r requirements.txt
cd remotion-composer
npm install
cd ..
pip install piper-tts
cp .env.example .env

En Windows, si npm install informa ERR_INVALID_ARG_TYPE, el README recomienda usar:

1
npx --yes npm install

Configuración de API keys

OpenMontage puede ejecutar parte del flujo sin keys, pero para capacidades más completas de vídeo, imágenes, música y voz, configura los servicios en .env:

1
2
3
4
5
6
7
8
# .env — every key is optional, add what you have
FAL_KEY=your-key
PEXELS_API_KEY=your-key
PIXABAY_API_KEY=your-key
UNSPLASH_ACCESS_KEY=your-key
SUNO_API_KEY=your-key
ELEVENLABS_API_KEY=your-key
OPENAI_API_KEY=your-key

La generación de vídeo con GPU local se puede activar según el README:

1
make install-gpu

Luego añade esto a .env:

1
2
VIDEO_GEN_LOCAL_ENABLED=true
VIDEO_GEN_LOCAL_MODEL=wan2.1-1.3b

Cómo usarlo con un Agent

Conviene no dar a la IA una tarea demasiado abstracta. Puedes escribir algo así:

1
Make a 60-second animated explainer about how neural networks learn

O partir de un vídeo de referencia:

1
Here's a YouTube Short I love. Make me something like this, but about quantum computing.

Su flujo típico es:

1
research -> proposal -> script -> scene_plan -> assets -> edit -> compose

Sugerencias de uso

OpenMontage encaja bien para experimentar con una línea de producción de vídeo. No lo trataría desde el primer día como un sistema de edición comercial estable. Empieza con piezas de 30 a 60 segundos y verifica poco a poco las fuentes de recursos, la voz, la música, la composición y el coste. Cuantas más API keys añadas, más capacidades tendrás, pero también será más complejo depurar.

记录并分享
Creado con Hugo
Tema Stack diseñado por Jimmy