AIGC Visual Works

AIGC 影像创作集

// Year

2026.02 – Present

// Role

Team Lead & Visual Director

// Duration

Ongoing

《溶洞回响》主视觉 — AI 生成的溶洞救援场景

// Overview

两个方向截然不同的 AIGC 影像项目，共同探索 AI 生成影像在叙事和教育中的可能性。《溶洞回响》是一部以溶洞救援为背景的现实主义剧情短片，带领 15 人团队从剧本到成片全流程 AI 生成；《永遇乐·京口北固亭怀古》是一部辛弃疾词作的微课教学影像，将古典诗词的意境转化为 AI 生成的视觉叙事，辅助课堂教学。

// Challenge

挑战

两个项目的挑战完全不同。短片的核心难题是角色一致性——五个主要角色在数十个场景中必须保持面部特征稳定，而 AI 生成天然倾向于"每张都不一样"。微课的难题是意境还原——"金戈铁马，气吞万里如虎"这种诗句，如何转化为具体的、有历史质感的画面，而不是看起来像游戏 CG？此外，15 人团队的协作效率和视觉风格统一也是持续的管理挑战。

// Approach

方案

短片侧：ComfyUI 搭建文生图、图生图、风格迁移多套工作流。为陈默、周立群、林凯、赵桂芳、老刘五个角色分别训练专属 LoRA，配合 ControlNet 姿态控制实现跨场景一致性。多卡并行 + CUDA 推理调优提升批量生成效率。基于摄影构图经验主导分镜设计，输出包含色调、光影、构图参考的统一视觉规范。微课侧：将词作逐句拆解为六段视觉脚本，每段定义画面内容、色调、镜头运动和时长。使用 ComfyUI + 多平台 AIGC 工具（MidJourney、Runway 等）生成古风场景，通过风格迁移保持全片视觉统一。

// Tech Stack

技术栈

ComfyUIStable DiffusionControlNetLoRA TrainingCUDAMidJourneyRunwayPrompt EngineeringVideo Editing

// Highlights

亮点

01
《溶洞回响》：五幕结构现实主义剧本，五个角色各有完整人物弧光，溶洞救援 × 乡村振兴双线叙事
02
角色一致性：五角色专属 LoRA 训练 + ControlNet 姿态控制 + SeedVR 多角度参考，跨场景面部稳定
03
ComfyUI 工作流矩阵：文生图 / 图生图 / 风格迁移 / 多角度生成，多卡并行推理
04
《永遇乐》：辛弃疾词作逐句视觉化，六段古风场景生成，辅助微课教学
05
团队管理：统筹 15 人三组并行制作，输出统一视觉规范文档，保障多片同期交付

// Result

成果

《溶洞回响》已完成完整剧本（五幕结构，五个角色）、全部角色 LoRA 训练、主要场景生成，三部短片同步推进中。《永遇乐》已完成全部六段视觉脚本和对应画面生成，配合微课教学脚本交付使用。两个项目积累了一套可复用的 AIGC 影像生产方法论。

// Reflection

反思与收获

这两个项目让我从不同角度理解了 AIGC 创作。短片教会我"管理不确定性"——AI 生成的画面永远不会完全符合预期，学会在不完美中找到更好的表达，比追求像素级控制更重要。微课教会我"约束即创造力"——古诗词的意境本身就是最好的 prompt，越是具体的文学描写，AI 越能生成有感染力的画面。LoRA 训练的经验也很宝贵：训练步数、学习率、正则化图片的选择都会显著影响角色一致性，这是一个需要反复实验的手艺活。

// Gallery

五角色 LoRA 一致性 — 陈默、周立群、林凯、赵桂芳、老刘

《永遇乐》古风场景 — "金戈铁马，气吞万里如虎"

ComfyUI 生产工作流 — 文生图 + ControlNet + 风格迁移

← 上一个VR Solar System

下一个 →AR Pet