AIGC Visual Works
AIGC 影像创作集
2026.02 – Present
Team Lead & Visual Director
Ongoing

《溶洞回响》主视觉 — AI 生成的溶洞救援场景
两个方向截然不同的 AIGC 影像项目,共同探索 AI 生成影像在叙事和教育中的可能性。《溶洞回响》是一部以溶洞救援为背景的现实主义剧情短片,带领 15 人团队从剧本到成片全流程 AI 生成;《永遇乐·京口北固亭怀古》是一部辛弃疾词作的微课教学影像,将古典诗词的意境转化为 AI 生成的视觉叙事,辅助课堂教学。
挑战
两个项目的挑战完全不同。短片的核心难题是角色一致性——五个主要角色在数十个场景中必须保持面部特征稳定,而 AI 生成天然倾向于"每张都不一样"。微课的难题是意境还原——"金戈铁马,气吞万里如虎"这种诗句,如何转化为具体的、有历史质感的画面,而不是看起来像游戏 CG?此外,15 人团队的协作效率和视觉风格统一也是持续的管理挑战。
方案
短片侧:ComfyUI 搭建文生图、图生图、风格迁移多套工作流。为陈默、周立群、林凯、赵桂芳、老刘五个角色分别训练专属 LoRA,配合 ControlNet 姿态控制实现跨场景一致性。多卡并行 + CUDA 推理调优提升批量生成效率。基于摄影构图经验主导分镜设计,输出包含色调、光影、构图参考的统一视觉规范。微课侧:将词作逐句拆解为六段视觉脚本,每段定义画面内容、色调、镜头运动和时长。使用 ComfyUI + 多平台 AIGC 工具(MidJourney、Runway 等)生成古风场景,通过风格迁移保持全片视觉统一。
技术栈
亮点
- 01
《溶洞回响》:五幕结构现实主义剧本,五个角色各有完整人物弧光,溶洞救援 × 乡村振兴双线叙事
- 02
角色一致性:五角色专属 LoRA 训练 + ControlNet 姿态控制 + SeedVR 多角度参考,跨场景面部稳定
- 03
ComfyUI 工作流矩阵:文生图 / 图生图 / 风格迁移 / 多角度生成,多卡并行推理
- 04
《永遇乐》:辛弃疾词作逐句视觉化,六段古风场景生成,辅助微课教学
- 05
团队管理:统筹 15 人三组并行制作,输出统一视觉规范文档,保障多片同期交付
成果
《溶洞回响》已完成完整剧本(五幕结构,五个角色)、全部角色 LoRA 训练、主要场景生成,三部短片同步推进中。《永遇乐》已完成全部六段视觉脚本和对应画面生成,配合微课教学脚本交付使用。两个项目积累了一套可复用的 AIGC 影像生产方法论。
反思与收获
这两个项目让我从不同角度理解了 AIGC 创作。短片教会我"管理不确定性"——AI 生成的画面永远不会完全符合预期,学会在不完美中找到更好的表达,比追求像素级控制更重要。微课教会我"约束即创造力"——古诗词的意境本身就是最好的 prompt,越是具体的文学描写,AI 越能生成有感染力的画面。LoRA 训练的经验也很宝贵:训练步数、学习率、正则化图片的选择都会显著影响角色一致性,这是一个需要反复实验的手艺活。

五角色 LoRA 一致性 — 陈默、周立群、林凯、赵桂芳、老刘

《永遇乐》古风场景 — "金戈铁马,气吞万里如虎"

ComfyUI 生产工作流 — 文生图 + ControlNet + 风格迁移