OpenMontage 使用教程:把 AI 编程助手变成视频制作流水线

整理 calesthio/OpenMontage 的安装、FFmpeg 依赖、API Key 配置、本地 GPU 选项和适合的 AI 视频制作场景。

calesthio/OpenMontage 是一个开源的 agentic video production system。它把脚本、素材、配音、音乐、剪辑和合成拆成流水线,让 AI 编程助手可以参与完整视频制作。

项目地址:

https://github.com/calesthio/OpenMontage

先装依赖

README 要求先准备:

  1. Python 3.10+
  2. FFmpeg
  3. Node/npm,因为项目里包含 Remotion composer

FFmpeg 可以这样安装:

1
2
brew install ffmpeg
sudo apt install ffmpeg

安装和启动

官方快速开始命令:

1
2
3
git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
make setup

如果机器没有 make,可以按 README 的手动方式执行:

1
2
3
4
5
6
pip install -r requirements.txt
cd remotion-composer
npm install
cd ..
pip install piper-tts
cp .env.example .env

Windows 下如果 npm installERR_INVALID_ARG_TYPE,README 建议改用:

1
npx --yes npm install

API Key 配置

OpenMontage 可以零 key 跑一部分功能,但想要更完整的视频、图片、音乐、配音能力,就需要在 .env 里配置服务:

1
2
3
4
5
6
7
8
# .env — every key is optional, add what you have
FAL_KEY=your-key
PEXELS_API_KEY=your-key
PIXABAY_API_KEY=your-key
UNSPLASH_ACCESS_KEY=your-key
SUNO_API_KEY=your-key
ELEVENLABS_API_KEY=your-key
OPENAI_API_KEY=your-key

本地 GPU 视频生成可以按 README 开启:

1
make install-gpu

然后在 .env 加:

1
2
VIDEO_GEN_LOCAL_ENABLED=true
VIDEO_GEN_LOCAL_MODEL=wan2.1-1.3b

可以怎么让 Agent 使用

适合给 AI 的任务不要太抽象,可以这样写:

1
Make a 60-second animated explainer about how neural networks learn

或者从参考视频出发:

1
Here's a YouTube Short I love. Make me something like this, but about quantum computing.

它的典型流程是:

1
research -> proposal -> script -> scene_plan -> assets -> edit -> compose

使用建议

OpenMontage 适合做“视频生产流水线实验”,不适合一上来就当稳定商用剪辑系统。建议先用 30 到 60 秒的小片段测试,逐步确认素材来源、配音、音乐、合成效果和成本。API key 越多,能力越完整,但排障也会更复杂。

记录并分享
使用 Hugo 构建
主题 StackJimmy 设计