InScene 

199 00

InScene 是一个为 Flux.1-Kontext.dev 设计的 LoRA,旨在生成与源图像保持场景一致性的图像。它基于 Flux.1-Kontext.dev 进行训练。主要用途是生成镜头变体,同时保持背景、整体环境、角色和风格不变。

作者
peteromallet
触发词
Make a shot in the same scene of
基础模型
FLUX.1 Kontext dev
InScene 

在图像生成领域,保持场景一致性是一个重要挑战。当你希望在同一背景、风格、角色设定下生成不同镜头角度或构图的图像时,传统模型往往难以维持整体环境的一致性。

InScene 是一个为 Flux.1-Kontext.dev 设计的 LoRA 模型,专为解决这一问题而生。它能够基于原始图像生成新的变体镜头,同时保持场景、背景、角色和风格不变。

什么是 InScene?

InScene 是基于 Flux.1-Kontext.dev 模型训练的 LoRA模型,专注于生成与源图像场景一致的变体图像

它的核心目标是:

  • 保留原始图像的背景、环境和风格
  • 改变镜头角度、构图或局部细节
  • 实现“同一场景下不同镜头”的自然生成

使用方法

为了获得最佳效果,请按照以下方式构造提示词(prompt):

提示词应以“Make a shot in the same scene of(在同一场景中拍摄)”开头,然后描述你希望生成的新图像内容。

示例:

  • “在同一场景中拍摄,汽车非常靠近摄像头,司机狂笑。”
  • “在同一场景中拍摄,阳光从左侧斜射进来,画面更温暖。”
  • “在同一场景中拍摄,镜头拉远,展现更多背景细节。”

通过这种方式,模型能更好地理解你希望在不改变整体场景的前提下生成什么样的图像变体。

✅ 优势与适用场景

模型擅长:

  • 生成与原始图像一致的真实感镜头
  • 保持背景、角色、环境和风格不变
  • 处理多种常见摄影风格和艺术表现(如写实、卡通、水彩等)

典型应用场景:

  • 视觉叙事创作(如漫画分镜、电影概念图)
  • 场景探索与构图调整
  • 图像风格微调,同时保持内容一致性

⚠️ 局限性

尽管 InScene 在保持场景一致性方面表现出色,但仍存在一些限制:

  • 对于动作导向型提示词(如“拳击”、“跑步”),生成效果可能不稳定
  • 高度抽象或非常少见的风格理解能力有限
  • 无法完全重建图像中未出现的元素(如新增人物、大范围背景修改)

🧠 训练数据与原理

InScene 的 LoRA 模块基于 Flux.1-Kontext.dev 主模型进行微调,训练数据来源于 WebVid 数据集

具体训练方式如下:

  • 从 WebVid 中提取视频帧
  • 构建图像对(源图像 + 变体图像)
  • 总共使用 394 对图像进行训练

训练目标是让模型学会在不改变场景本质的前提下,生成新的镜头视角或构图变化。

相关图书

CLAY GPT for flux

CLAY GPT for flux

CLAY GPT for flux 是一个专为 Flux 设计的 LoRA 模型 ,其训练数据完全来自于 GPT-4o 生成的 Clay(黏土)风格图像 。该模型能够帮助用户在文本到图像生成任务中,快速还原出具有手工质感和动画风格的黏土艺术效果。
Blur Background和Unblur Background

Blur Background和Unblur Background

Blur Background 与 Unblur Background 是一次对生成图像“后期控制前移”的有益尝试。它们不追求极致的图像修复能力,而是以轻量 LoRA 的形式,为创作者提供一种在生成过程中直接干预背景清晰度的手段。
Normal Map

Normal Map

Kontext Normal 是一个专注于将常规图像(如AI生成的角色图或纹理图)转换为高质量法线贴图(Normal Map) 的轻量级LoRA,基于 FLUX.1-Kontext-dev 模型训练而成。
Kontext-Emoji-LoRA

Kontext-Emoji-LoRA

Kontext-Emoji-LoRA是一个用于风格迁移的模型,基于FLUX.1-Kontext-dev 训练,适用于人类形象的emoji风格化任务,可在 ComfyUI 中使用。

暂无评论

none
暂无评论...