SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2250 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    基于Transformer架构的新型图像生成模型DART:根据文本描述生成高质量的图像

    基于Transformer架构的新型图像生成模型DART:根据文本描述生成高质量的图像

    苹果和香港中文大学的研究人员推出新型图像生成模型DART,这个模型的目标是让计算机能够根据文本描述生成高质量的图像。DART是一个基于Transformer架构的模型,它在非马尔可夫框架内统一了自回归...
    新技术# DART# Transformer架构# 图像生成模型
    1年前
    06760
    BroadWay:提升文生视频模型的质量,而且不需要额外的训练

    BroadWay:提升文生视频模型的质量,而且不需要额外的训练

    上海交通大学、中国科学技术大学、香港中文大学和上海人工智能实验室的研究人员推出为BroadWay,它能够提升文生视频模型的质量,而且不需要额外的训练。这就像是给视频生成模型安装了一个“涡轮增压器”,让...
    新技术# BroadWay# 文生视频模型
    1年前
    07550
    视频插值方法ViBiDSampler:专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果

    视频插值方法ViBiDSampler:专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果

    韩国科学技术研究院推出视频插值方法ViBiDSampler,这种方法专门用于在两个关键帧之间生成平滑且逼真的中间帧,从而创建流畅的视频过渡效果。ViBiDSampler引入了一种新颖的双向采样策略,以...
    新技术# ViBiDSampler# 视频插值方法
    1年前
    04220
    一种在推理阶段组合定制扩散模型的新方法TweedieMix:用于改进多概念融合在基于扩散的图像和视频生成中的应用

    一种在推理阶段组合定制扩散模型的新方法TweedieMix:用于改进多概念融合在基于扩散的图像和视频生成中的应用

    KRAFTON和韩国科学技术研究院AI研究生院的研究人员推出一种在推理阶段组合定制扩散模型的新方法TweedieMix,它用于改进多概念融合在基于扩散的图像和视频生成中的应用。简单来说,Tweedie...
    新技术# TweedieMix# 扩散模型
    1年前
    04720
    字节推出TextToon:在实时环境中将真人的头像转换成卡通化的形象

    字节推出TextToon:在实时环境中将真人的头像转换成卡通化的形象

    罗切斯特大学和字节跳动的研究人员推出TextToon,它能够在实时环境中将真人的头像转换成卡通化的形象。就像魔法一样,这项技术可以把你从视频中的头像变成你想要的任何卡通风格,比如美国漫画风格、皮克斯动...
    新技术# TextToon# 字节跳动
    1年前
    05720
    新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量

    新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量

    韩国科学技术研究院推出新型框架VideoGuide,它能够改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量。这就意味着,使用VideoGuide,可以让现有的视频生成模型在不...
    新技术# VideoGuide# 视频生成框架
    1年前
    04030
    多模态统一模型UniMuMo:能够处理文本、音乐和动作(运动)数据,并在这三种模式之间生成内容

    多模态统一模型UniMuMo:能够处理文本、音乐和动作(运动)数据,并在这三种模式之间生成内容

    香港中文大学、华盛顿大学、不列颠哥伦比亚大学、麻省大学阿默斯特分校、 MIT-IBM Watson AI 实验室和思科研究院的研究人员推出多模态统一模型UniMuMo,它能够处理文本、音乐和动作(运动...
    新技术# UniMuMo# 多模态统一模型
    1年前
    04900
    图像生成框架OmniBooth:根据用户的多模态指令(如文本提示或图像参考)来生成具有空间控制和实例级定制化的图像

    图像生成框架OmniBooth:根据用户的多模态指令(如文本提示或图像参考)来生成具有空间控制和实例级定制化的图像

    香港科技大学和华为诺亚方舟实验室的研究人员推出图像生成框架OmniBooth,它可以根据用户的多模态指令(如文本提示或图像参考)来生成具有空间控制和实例级定制化的图像。简单来说,用户可以指定多个对象的...
    新技术# OmniBooth# 图像生成框架
    1年前
    05420
    半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好

    半策略偏好优化方法SePPO:用于优化和微调文生图模型,使其更好地符合人类的审美和偏好

    罗切斯特大学、普渡大学、延世大学、腾讯 AI 实验室和华盛顿大学的研究人员推出半策略偏好优化方法SePPO,用于优化和微调扩散模型(如用于生成图像的模型),使其更好地符合人类的审美和偏好,而无需依赖外...
    新技术# SePPO# 半策略偏好优化# 文生图模型
    1年前
    04550
    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性

    香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型,称为帧感知视频扩散模型(Frame-Aware Video Diffusion Model,简称FV...
    新技术# FVDM# 帧感知视频扩散模型
    1年前
    04860
    新型图像生成框架ControlAR:根据空间控制信息生成可控制的高质量图像

    新型图像生成框架ControlAR:根据空间控制信息生成可控制的高质量图像

    华中科技大学信息与通信学院、香港大学计算机科学系和vivo AI 实验室的研究人员推出新型图像生成框架ControlAR,它能够根据空间控制信息生成可控制的高质量图像。简单来说,ControlAR能够...
    新技术# ControlAR# 图像生成框架
    1年前
    05310
    新型端到端模型DnD-Transformer:提高了图像生成任务的质量和效率,为图像生成领域带来了新的可能

    新型端到端模型DnD-Transformer:提高了图像生成任务的质量和效率,为图像生成领域带来了新的可能

    北京大学、阿里巴巴集团、威斯康星大学麦迪逊分校和北京理工大学的研究人员推出新型端到端模型DnD-Transformer,这是一种用于高效细粒度图像生成的二维自回归Transformer。简单来说,这个...
    新技术# DnD-Transformer# 图像生成
    1年前
    04680
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    智川云

    智川云

    智川云 RiverMind 是专为高校科研团队与开发者打造的弹性 GPU 云平台,提供从按量训练到弹性推理在内的 AI 模型全生命周期算力服务。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单