SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    图像生成

    共 33 篇文章
    排序
    发布更新浏览点赞
    如何兼顾“创意”与“真实”?用 Qwen-Image + Wan 2.2 实现高质量图像生成

    如何兼顾“创意”与“真实”?用 Qwen-Image + Wan 2.2 实现高质量图像生成

    阿里Qwen项目组近期发布的两款模型Qwen-Image和Wan 2.2都具有图像生成功能,但两款模型在生成图片的时候具有局限性: Qwen-Image 擅长创意构图,想象力丰富,但人物细节 AI 感...
    工作流# Qwen-Image# WAN 2.2# 图像生成
    4个月前
    01,2320
    新型图像生成模型Diffusion Mamba(DiM):通过结合Mamba序列模型的效率和扩散模型的表现力,来高效生成高分辨率的图像

    新型图像生成模型Diffusion Mamba(DiM):通过结合Mamba序列模型的效率和扩散模型的表现力,来高效生成高分辨率的图像

    来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图像生成模型Diffusion Mamba(简称DiM),它融合了基于状态空间模型(SSM)的高效序列模型——Mamba,与扩...
    新技术# Diffusion Mamba# DiM# 图像生成
    2年前
    01,2080
    新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真

    新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真

    字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR(Distortion-reduced Multi-Resolution Diffusion Model),此模...
    新技术# DiMR# 图像生成
    1年前
    08600
    新型图像生成模型EMMA:能够接受多模态提示,并生成高质量的图像

    新型图像生成模型EMMA:能够接受多模态提示,并生成高质量的图像

    南洋理工大学和腾讯的研究人员推出新型图像生成模型EMMA,它基于最先进的文本到图像(T2I)扩散模型ELLA,能够接受多模态提示(multi-modal prompts),并生成高质量的图像。简单来说...
    新技术# ELLA# EMMA# 图像生成
    1年前
    08450
    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要...
    新技术# StoryDiffusion# 图像生成# 视频生成
    2年前
    07930
    新算法ViewFusion:解决在多视角图像生成一致性的问题

    新算法ViewFusion:解决在多视角图像生成一致性的问题

    来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion,它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成,用于生成高质量、多样化的图像。 论...
    新技术# ViewFusion# 图像生成
    2年前
    07060
    无需训练、基于轨迹的可控图像生成技术TraDiffusion:允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调

    无需训练、基于轨迹的可控图像生成技术TraDiffusion:允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调

    厦门大学和中国科学院大学深圳先进技术研究院的研究人员推出新型图像生成技术TraDiffusion,这项技术的核心在于它允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调。简单来说,就...
    新技术# TraDiffusion# 图像生成
    1年前
    06880
    新型图像生成模型家族LlamaGen:将大语言模型(Llama)应用到视觉图像生成领域

    新型图像生成模型家族LlamaGen:将大语言模型(Llama)应用到视觉图像生成领域

    香港大学及字节跳动的研究人员推出新型图像生成模型家族LlamaGen,将大语言模型(Llama)中原用于文本生成的“下一个令牌预测”范式应用到了视觉图像生成领域。LlamaGen是对传统自回归模型在图...
    新技术# LlamaGen# 图像生成# 大语言模型
    2年前
    06540
    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散...
    新技术# Edify Image# 图像生成# 英伟达
    1年前
    05870
    智谱AI推出图像生成模型 CogView3 以及  CogView-3Plus

    智谱AI推出图像生成模型 CogView3 以及  CogView-3Plus

    清华和智谱 AI的研究团队开源了图像生成模型 CogView3 以及CogView-3-Plus ,CogView3 是一个基于级联扩散的文本生成图像系统,采用了接力扩散(relay diffusio...
    图像模型# CogView-3Plus# CogView3# 图像生成
    10个月前
    05840
    新型图像生成技术MaskBit:根据一些简单的描述或者标签,自动创造出相对应的图像

    新型图像生成技术MaskBit:根据一些简单的描述或者标签,自动创造出相对应的图像

    字节跳动、慕尼黑工业大学、MCML和卡内基梅隆大学的研究人员推出新型图像生成技术MaskBit,这个技术能够自动创造出新的图像,而且不需要像传统方法那样依赖于大量的预训练数据或者复杂的数学模型。Mas...
    新技术# MaskBit# 图像生成
    1年前
    05160
    黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]: 实现更真实、更自然的图像生成

    黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]: 实现更真实、更自然的图像生成

    黑森林实验室(Black Forest Labs, BFL)与创意 AI 平台 KREA AI 正式宣布推出 FLUX.1 Krea [dev] —— 一个全新的开源文本到图像生成模型,也是 Krea...
    图像模型# FLUX.1 Krea [dev]# 图像生成# 黑森林实验室
    4个月前
    05130
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    查看完整榜单