缘起
最近经历了从官方API切换本地LLM再到中转站的Openclaw体验过程,耽误很多进度。
昨晚夜雨如注,手头拿到了1.3T的网盘素材,想批量产出50-100条短视频发抖音。
一开始我想的是让龙虾控制剪映的工程文件(draft)——
后来发现,想简单了。

核心原理:AI 不是替你”点鼠标”,而是替你”写代码”
这是整个项目里最值得说清楚的一件事。
剪映桌面版没有公开接口(API),这意味着没有任何程序能直接指挥它。就像你家空调遥控器没装电池,AI 喊破喉咙也开不了。

所以真正的方案是换了一条路:
素材模板 + 文案
↓
OpenClaw (AI 大脑) → 自动写 Python 脚本
↓
moviepy / ffmpeg(视频渲染引擎)
↓
批量生成 70 条成品 mp4
↓
人工上传抖音
OpenClaw 做的事: 理解你的需求 → 写 Python 代码 → 自动运行 → 出错了自己修 → 修好了继续跑。
本质上,AI 不是在”操作软件”,而是在写了一个帮你操作的软件。
70 条视频是怎么跑出来的
整个流程分三步。
第一步:准备素材模板
你需要准备好:
- 视频 / 图片素材: 按模板分类放好(比如 10 个不同的背景视频)
- 文案: 每条视频的文字内容(可以是一张表格,每条一行)
- 音频 / 配音: 如果有固定的 BGM 或语音旁白
不需要任何编程基础,素材放文件夹里就行。
第二步:告诉 OpenClaw 你的需求
比如告诉它:
我有一个模板:背景视频 10 秒 + 文案字幕 + 片尾
文案在 Excel 里,70 行,每行是一条视频的文案
批量生成 70 条视频,每条用不同的背景素材
OpenClaw 会自己理解这个需求,然后生成对应的 Python 脚本。
第三步:自动跑完
脚本跑起来,你就看着命令行一条一条地输出视频文件。70 条视频,从写脚本到渲染完成,大概十几分钟到半小时,取决于素材复杂度。
中间如果有报错(比如某个素材文件路径不对),OpenClaw 会自动读错误日志,自己修好代码重跑。
你不需要懂什么
对,这话是真的。
你不需要懂 Python、不需要懂 ffmpeg、不需要懂视频编码。
你只需要知道:
- 你的素材在哪个文件夹
- 你想要每条视频长什么样(大概就行,AI 会追问细节)
- 怎么把视频从电脑上传到抖音
其他都是 OpenClaw 在背后搞定。
需要配置的东西(清单)
如果你也想试,需要做的准备工作很少:
1. 装 OpenClaw
去官网下载安装,就是一个命令行工具,跟着入门教程跑一遍就能对话了。
2. Python 环境
OpenClaw 在生成视频脚本时需要 Python 和 moviepy。如果你电脑上没装,它会提示你装,或者在后台自动帮你处理。
3. 素材和文案(这一步最花时间,也是”人的工作”)
- 把你的素材分类整理到文件夹里
- 把文案写成纯文本或 Excel
素材越规整,出片质量越高。但 AI 也接受”差不多就行”的输入,它会自己调整。
几个你可能想问的问题
为什么不用剪映?
剪映(以及 PR、AE 等所有桌面剪辑软件)没有公开的程序接口。就像你没法用代码指挥 Excel 画图表一样——Excel 有接口才行,剪映没有。强行模拟鼠标去控制桌面版,版本一更新就全崩,不值得。
moviepy / ffmpeg 是什么?
简单说就是视频界的”命令行工具”。剪映是图形界面版的,moviepy 是代码版的。一个用鼠标拖,一个用文字写。写的好处是可以批量、可以重复、不会手抖。
OpenClaw 会犯错误吗?
会。写脚本可能会出错(路径不对、参数写错),但它的好处是会自己 debug——报错了读日志,分析原因,修改脚本,重跑。你只需要在它实在搞不定的时候指一下方向。
批量生成的视频质量怎么样?
取决于你的模板设计。简单的”字幕 + 背景视频 + 音乐”这种,质量和手动做的没区别。复杂特效(抠像、关键帧动画、多种转场)需要更精细的模板,但也都能做。
一些感受
这次做下来最大的感受是:
AI 最好的用法,不是替代人,而是替代”重复操作”这部分。
70 条视频,如果让我手动一条一条在剪映里剪,不说别的,光重复”导入 → 拖时间轴 → 导出”这个动作 70 次,就想放弃了。
但让 AI 去写脚本自动跑,我只用花 10 分钟把素材理清楚,剩下的等它跑完就行。
人和机器各自做自己擅长的事。
这篇文章本身也是用 OpenClaw 协助生成的。