空间优先
先拆出房间、人物、道具和空间关系,再让镜头在同一个世界里移动。
About the product
当前版本聚焦第一条生产链路:剧本解析、资产确认、角色/空间/道具主图、分镜图、场次关联和 3D 运镜预览。 后续再把这些结构化资产接入更高阶 Seedance 视频模型、角色语音包和更完整的空间导演能力。
先拆出房间、人物、道具和空间关系,再让镜头在同一个世界里移动。
角色、场景和道具不是一次性提示词,而是带主图、描述和关系的素材,后续分镜图和视频生成都能复用。
把机位、焦段、注视点和运动路径显式化,让短剧生成从黑盒变成可调度流程。
Stack
Features
把短剧文案拆成故事设定、人物关系、冲突、空间、道具和场次结构。
角色、空间、道具都有可编辑提示词,并支持 Agent 自动生成主图、多候选图和手动上传。
资产确认后自动生成角色、空间、道具主图,并为每个场次生成主视觉分镜图和视频任务。
每个场次可以关联角色、空间和道具,为后续 3D 运镜预览提供结构化输入。
根据场次地点、人物、道具、分镜和空间关系生成基础站位与摄像机路径。
支持风格、画幅、模型、单图/四图候选、资产主图选择和图片下载。
Google 登录即注册,用户在 Profile 配置自己的文本、图片、视频模型 API Key 和模型列表,系统不使用作者 Key。
Agent
这个项目不是单次调用大模型的图片生成工具,而是一个工作流型 AI Agent。LLM 负责理解、结构化和生成内容, Next.js 后端负责计划、状态机、工具调度、数据库持久化、人工确认、失败重试和最终资产落地。
用户先选择小说转视频、剧本转视频、资产生成、分镜生成或视频生成,后端把意图归一化为 AgentRunType。
buildInitialAgentPlan 根据意图生成 AgentPlan,再创建 AgentRun 和 AgentStep,把复杂任务拆成可追踪步骤。
每个 Step 调用不同工具:Qwen 文本模型、Doubao 图片模型、Seedance 视频模型、Prisma/MySQL、资产转存和 3D 方案生成。
每一步 output 写入数据库并合并到 ExecutionContext,后续步骤可以复用前面生成的剧本、资产、分镜和图片。
confirm_world_assets 会让 Agent 暂停,用户确认角色、空间、道具后再继续执行,避免无效生成。
失败步骤可以重试,系统从当前 AgentStep 重新排队,保留已成功的中间产物。
Flow
Intent / Tools
5 类意图
小说转视频预视觉、剧本转视频预视觉、资产生成、分镜生成、视频生成。
8 个核心工具
小说精简、小说转剧本、剧本解析、资产确认、资产主图生成、分镜生成、3D 运镜方案、图生视频任务。
外围工程工具
视频同步落地、失败重试、资产本地化、历史任务恢复。
Architecture
Highlights
Highlight 1
不是文本到视频黑盒,而是文本到世界、世界到镜头、镜头到视频。
Highlight 2
参考案例与用户历史隔离,新用户可以直接查看完整样例。
Highlight 3
图片资产、分镜图与场次关系可复用,当前已接入 Seedance 图生视频任务,并为后续更高阶视频模型和 3D 工具预留空间。
Highlight 4
产品信息架构以剧本解析为主入口,运镜和生图作为延伸工具,降低用户选择成本。