SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    韩国科学技术院提出超分辨率框架Chain-of-Zoom(CoZ):突破单图像超分辨率模型的放大极限

    韩国科学技术院提出超分辨率框架Chain-of-Zoom(CoZ):突破单图像超分辨率模型的放大极限

    近年来,单图像超分辨率(SISR) 模型在固定缩放因子下已经能够生成接近真实照片质量的图像。然而,一旦尝试超出训练范围进行放大,就会出现模糊、伪影等问题,严重影响视觉效果。 此外,如果想获得更高倍数的...
    新技术# Chain-of-Zoom# CoZ# 超分辨率
    7个月前
    05540
    AutoVFX:基于自然语言指令的自动视觉效果生成

    AutoVFX:基于自然语言指令的自动视觉效果生成

    现代视觉效果(VFX)软件使熟练的艺术家能够创造出几乎任何图像,但创作过程仍然费力、复杂,并且对普通用户来说基本上是不可访问的。为了简化这一过程,伊利诺伊大学厄巴纳-香槟分校的研究人员提出了AutoV...
    新技术# AutoVFX
    1年前
    05540
    基准测试CommonsensenT2I:用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力

    基准测试CommonsensenT2I:用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力

    宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I,用于评估文生图模型(T2I)生成符合现实生活常识的图像的能力。简单来说,就是研究这些模型是否能够根据文字描述...
    新技术# CommonsensenT2I# 基准测试# 文生图模型
    2年前
    05540
    新型视频重建模型Vidu4D:能够从单个生成的视频创建高保真的4D重建

    新型视频重建模型Vidu4D:能够从单个生成的视频创建高保真的4D重建

    清华大学、生数科技和同济大学的研究人员推出新型视频重建模型Vidu4D,它能够从单个生成的视频创建高保真的4D重建(即连续的3D表示)。这项技术的核心是处理非刚性物体的动态变化和视频帧的失真问题,这对...
    新技术# Vidu4D# 视频重建模型
    2年前
    05530
    北大团队推出多模态混合专家模型MoE-LLaVA

    北大团队推出多模态混合专家模型MoE-LLaVA

    来自北大的研究人员推出多模态的混合专家模型MoE-LLaVA,旨在通过一种新颖的训练策略,有效地提高模型在处理视觉和语言任务时的性能,同时保持计算成本的稳定。 GitHub Demo 论文 此模型只有...
    新技术# MoE-LLaVA# 北大# 多模态混合专家模型
    2年前
    05530
    无需训练的新策略FasterCache:加速高质量视频生成的视频生成模型的推理

    无需训练的新策略FasterCache:加速高质量视频生成的视频生成模型的推理

    视频生成是当前 AI 领域的一个热点研究方向,特别是基于扩散模型的方法。然而,这些模型的推理速度通常较慢,限制了它们在实际应用中的效率。香港大学、南洋理工大学 S-Lab 和上海人工智能实验室的研究人...
    新技术# FasterCache# 视频生成
    1年前
    05520
    D-Flow框架:更加精确地控制生成模型的输出

    D-Flow框架:更加精确地控制生成模型的输出

    D-Flow框架是一种用于控制生成过程的方法,通过在流中进行微分来控制生成过程,以优化源(噪声)点。该方法的主要局限是生成时间相对较长(通常需要5-15分钟),这可能会在某些应用中限制其使用。 论文地...
    新技术# D-Flow框架# 生成模型
    2年前
    05520
    谷歌推出首尾帧图生视频新方法Generative Inbetweening:在两个关键帧之间产生连贯的运动

    谷歌推出首尾帧图生视频新方法Generative Inbetweening:在两个关键帧之间产生连贯的运动

    华盛顿大学、谷歌 DeepMind和加州大学伯克利分校的研究人员推出一种用于生成视频序列的方法Generative Inbetweening,能够在两个关键帧之间产生连贯的运动。简单来说,就是给定视频...
    新技术# Generative Inbetweening# 插帧# 视频序列
    1年前
    05510
    新型实时目标检测系统YOLOv9:通过创新的网络设计和梯度信息处理来提高目标检测的准确性和效率

    新型实时目标检测系统YOLOv9:通过创新的网络设计和梯度信息处理来提高目标检测的准确性和效率

    来自中国台湾的研究人员推出新型实时目标检测系统YOLOv9,通过引入可编程梯度信息(Programmable Gradient Information, PGI)和一种新的轻量级网络架构——广义高效层...
    新技术# YOLOv9# 目标检测系统
    2年前
    05510
    基于多模态扩散模型的创新框架CreativeSynth:用于创意融合和合成视觉艺术

    基于多模态扩散模型的创新框架CreativeSynth:用于创意融合和合成视觉艺术

    来自字节跳动、中科院自动化研究所、中国科学院大学人工智能学院等机构的研究人员,提出了一个名为CreativeSynth的创新框架,它基于多模态扩散模型,能够协调多模态输入并在艺术图像生成领域实现多任务...
    新技术# CreativeSynth# 多模态扩散模型
    2年前
    05500
    TGATE:减少不必要的计算来提高效率,同时保持生成图像的质量

    TGATE:减少不必要的计算来提高效率,同时保持生成图像的质量

    来自阿卜杜拉国王科技大学、新加坡国立大学和瑞士人工智能实验室的研究人员推出一种简单且无需训练的方法TGATE,通过减少不必要的计算来提高效率,同时保持生成图像的质量,这对于各种需要快速高质量图像生成的...
    新技术# TGATE
    2年前
    05490
    肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频

    肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频

    蚂蚁集团支付宝终端技术部推出肖像动画新技术EchoMimic,它可以将静态的肖像照片转化为逼真的动态视频。EchoMimic创新性地结合音频与面部标志点进行联合训练,并通过一项新颖的训练策略,使其不仅...
    新技术# EchoMimic# 肖像动画
    1年前
    05480
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    查看完整榜单