SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2218 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    矩形扩散Rectified Diffusion:提高扩散模型的生成速度

    矩形扩散Rectified Diffusion:提高扩散模型的生成速度

    香港中文大学、北京大学和普林斯顿大学的研究人员推出Rectified Diffusion,它用于加速生成扩散模型(diffusion models),这些模型在视觉生成领域取得了显著的进展,比如生成高...
    百科# Rectified Diffusion# 矩形扩散
    1年前
    06100
    DistriFusion:加速高分辨率扩散模型的并行推理算法

    DistriFusion:加速高分辨率扩散模型的并行推理算法

    来自麻省理工学院、普林斯顿大学、Lepton AI 和 英伟达的研究人员推出DistriFusion,这是一种用于加速高分辨率扩散模型(diffusion models)的并行推理算法。 项目主页 G...
    新技术# DistriFusion# 高分辨率扩散模型
    2年前
    06100
    新型图像编辑框架SEELE:图像主体重新定位

    新型图像编辑框架SEELE:图像主体重新定位

    来自复旦大学的研究人员推出了一种新型图像编辑框架SEELE(SEgment-gEnerate-and-bLEnd),它专注于在图像中重新定位指定的对象(即“主体”),同时保持图像的整体质量。 项目主页...
    新技术# SEELE# 图像编辑
    2年前
    06100
    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    香港大学、阿里巴巴集团和蚂蚁集团的研究人员推出图像编辑技术MimicBrush,它通过模仿(imitative editing)的方式,让用户能够更加方便地发挥创造力进行图像编辑。简单来说,Mimic...
    新技术# MimicBrush# 图像编辑
    1年前
    06090
    微软发布复现Sora的开源项目:新型多智能体框架Mora

    微软发布复现Sora的开源项目:新型多智能体框架Mora

    来自理海大学和微软研究院的研究团队推出新型多智能体框架Mora,它是为了实现大规模的通用视频生成而设计的。Mora的设计灵感来自于OpenAI在2024年2月推出的Sora模型,Sora是一个能够将文...
    新技术# Mora# Sora# 微软
    2年前
    06090
    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标...
    新技术# ConsiStory# 英伟达
    1年前
    06090
    剪映推出AI创作助手「小云雀」:一句指令,生成专业级视频与图片

    剪映推出AI创作助手「小云雀」:一句指令,生成专业级视频与图片

    剪映近日正式上线了一款 AI 视频与图像创作助手——小云雀AI,面向普通用户与创作者提供零门槛的智能内容创作体验。无论是短视频制作、数字人播报、图片设计还是背景更换,只需输入简单指令,即可快速生成高质...
    早报# 剪映# 小云雀
    6个月前
    06070
    新型AI模型PT-DiT:针对文本到任意任务(如文本到图像、文本到视频等)的高效能扩散变换器

    新型AI模型PT-DiT:针对文本到任意任务(如文本到图像、文本到视频等)的高效能扩散变换器

    中山大学 & 360人工智能研究院的研究人员推出一种新的人工智能模型PT-DiT,它是一种针对文本到任意任务(如文本到图像、文本到视频等)的高效能扩散变换器。这个模型特别关注于提高计算效率,减...
    新技术# PT-DiT# Qihoo-T2X
    1年前
    06070
    无需额外训练的新型过渡视频生成方法TVG:在不同场景或画面之间流畅过渡的视频效果

    无需额外训练的新型过渡视频生成方法TVG:在不同场景或画面之间流畅过渡的视频效果

    索贝媒体智能实验室、四川大学网络科学与工程学院、数据保护与智能管理教育部重点实验室(四川大学)和中国电子科技大学的研究人员推出一种无需额外训练的新型过渡视频生成方法TVG,它是一种无需训练就能生成平滑...
    新技术# TVG# 视频生成
    1年前
    06070
    针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作

    针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作

    韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该技术能有效抵抗姿态估计错误,并在时间维度上保持连贯。这是一个关于如何让静态图片中的人体动作起来的研究,具体来说,就...
    新技术# TCAN# 人像图像动画
    1年前
    06070
    零样本视频定制框架DreamVideo-2:根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

    零样本视频定制框架DreamVideo-2:根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

    复旦大学、阿里巴巴、南洋理工大学和密歇根州立大学的研究人员推出一个零样本视频定制框架DreamVideo-2,能够根据单一图像和一系列界定框(bounding box)序列生成具有特定主题和运动轨迹的...
    新技术# DreamVideo-2# 视频定制
    1年前
    06060
    新型图像生成模型VAR:基于Transformer的自回归模型

    新型图像生成模型VAR:基于Transformer的自回归模型

    来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR(Visual Autoregressive Modeling,“视觉自回归建模”),VAR模型是一种基于Transformer的自回归(au...
    新技术# VAR模型
    2年前
    06060
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Memori

    Memori

    Memori 让任何大语言模型都能记住对话、从交互中学习,并在多个会话中保持上下文,只需一行代码:memori.enable()。记忆存储在你完全拥有和控制的标准 SQL 数据库(SQLite、PostgreSQL、MySQL)中。
     Fizzy

     Fizzy

    Fizzy是一款开源看板应用,旨在为管理 Bug、问题、想法和小型项目等任务提供现代化体验。Fizzy 被设计为 Trello、Jira 和 Asana 等常见工具的快速、直观替代品,强调简洁性和充满活力的用户界面。
    JoyAgent-JDGenie

    JoyAgent-JDGenie

    JoyAgent-JDGenie是一个通用的多智能体框架,对于用户需要定制的一些新场景功能,只需将相关的子智能体或者工具挂载到JoyAgent-Genie即可。
    查看完整榜单