SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...
    新技术# SPRIGHT T2I# 文生图模型
    2年前
    09230
    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测...
    新技术# Qwen-VL-Max# Qwen-VL-Plus# 视觉理解模型
    2年前
    09230
    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...
    新技术# controlnet# IC-Light# 打光
    2年前
    09210
    双语文本到图像生成模型Taiyi-Diffusion-XL,支持中文提示词

    双语文本到图像生成模型Taiyi-Diffusion-XL,支持中文提示词

    IDEA 研究院是由沈向洋创立,他们在2021年11月22日宣布启动“封神榜”大模型开源体系。“封神榜”是由 IDEA-CCNL 的工程师、研究人员、实习生团队共同维护的一项长期开源计划。项目基于Ap...
    新技术# SDXL# Taiyi-Diffusion-XL# 中文提示词
    2年前
    09170
    采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量

    采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量

    英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps(调整步伐),用于优化采样步骤,从而提高生成图像的细节和质量。这是一种通用且原则性的方法,用于优化扩散模型的采样计划...
    新技术# AlignYouSteps# 英伟达# 采样调节器
    2年前
    09110
    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程

    中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...
    新技术# controlnet# 可控性# 文生图模型
    2年前
    09070
    新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程

    新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程

    来自特拉维夫大学、赖希曼大学的研究人员推出新型图像编辑框架Differential Diffusion,此框架的核心特点是能够让用户对图像的每个像素或区域进行不同程度的编辑,这在以往的图像编辑技术中是...
    新技术# Differential Diffusion# 图像编辑
    2年前
    09060
    新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真

    新型图像生成模型DiMR:通过多分辨率处理和时间依赖的层归一化技术,有效地提高了图像的质量和真实感,减少了失真

    字节跳动、约翰霍普金斯大学和威斯康星大学麦迪逊分校的研究人员推出新的图像生成模型DiMR(Distortion-reduced Multi-Resolution Diffusion Model),此模...
    新技术# DiMR# 图像生成
    2年前
    09050
    视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来

    视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来

    PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们之间的协同工作效果。 论文 它能够有效地将传统的视觉编码器(vision encoders)和大语言模型(LL...
    新技术# PaLM2-VAdapter# 大语言模型# 视觉编码器
    2年前
    08950
    AI视频编辑工具LAVE:利用大语言模型(LLMs)来辅助用户进行视频编辑

    AI视频编辑工具LAVE:利用大语言模型(LLMs)来辅助用户进行视频编辑

    来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered Agent Assistance and Language Augmentation for Vide...
    新技术# AI视频编辑# LAVE
    2年前
    08920
    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2,它能够创建出逼真的4D头部头像。4D头像不仅具有三维的立体形状,还能随着时间变化而展示出不同的面部表情和头部动作,就像活生生的人一样。这项技术的应用前景非常广泛,比...
    新技术# 4D头部头像# Portrait4D-v2
    2年前
    08900
    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    中国科学技术大学和合肥国家科学中心人工智能研究院的研究人员推出新型视频超分辨率(VSR)技术EvTexture,这项技术的核心在于利用事件驱动的信号来增强视频中的纹理细节,从而提高视频的分辨率和质量...
    新技术# EvTexture# VSR# 视频超分辨率
    2年前
    08840
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    360 安全龙虾

    新360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    JVSClaw

    JVSClaw

    里云正式推出基于该框架打造的下一代 AI 助理平台——JVSClaw。目前,该产品已开启内测,主打“开箱即用”与“自进化能力”,让普通用户和开发者都能轻松“快乐养虾”。
    MuleRun

    MuleRun

    Mule Run 是一个专注于 AI 智能体的市场平台,致力于让 AI 技术更易访问和使用。通过即插即用设计和推荐激励,它为用户提供了高效的问题解决途径。
    PaperStudio 

    PaperStudio 

    PaperStudio 是一个基于 Web 的轻量级信笺纸、稿纸设计工具。它允许用户通过简单的拖拽和配置,设计出符合传统书写习惯或现代商务风格的信纸,并支持导出为 PDF 或直接打印。
    查看完整榜单