SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...
    新技术# TrackGo# 视频生成
    2年前
    04840
    Meta推出个性化图像生成模型Imagine yourself

    Meta推出个性化图像生成模型Imagine yourself

    Meta推出个性化图像生成模型Imagine yourself,这个模型的特别之处在于,它不需要针对每个用户进行个性化调整或“调优”,就能够为所有用户提供服务。这就像是有一个智能的画家,无论谁来请求画...
    新技术# Imagine yourself# Meta# 个性化图像生成模型
    2年前
    05600
    MegaFusion:将现有的扩散模型扩展到更高分辨率的图像生成,而无需额外的调整或适应

    MegaFusion:将现有的扩散模型扩展到更高分辨率的图像生成,而无需额外的调整或适应

    上海交通大学、上海人工智能实验室和大连理工大学的研究人员推出MegaFusion,它能够将现有的扩散模型(diffusion models)扩展到更高分辨率的图像生成,而无需额外的调整或适应。具体而言...
    新技术# MegaFusion
    2年前
    07290
    多模态模型Transfusion:能够同时处理离散数据(如文本)和连续数据(如图像)

    多模态模型Transfusion:能够同时处理离散数据(如文本)和连续数据(如图像)

    Meta、Waymo和南加州大学的研究人员推出多模态模型Transfusion,它能够同时处理离散数据(如文本)和连续数据(如图像)。Transfusion的核心思想是将语言模型的下一个词预测(nex...
    新技术# Transfusion# 多模态模型
    2年前
    07560
    无需训练、基于轨迹的可控图像生成技术TraDiffusion:允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调

    无需训练、基于轨迹的可控图像生成技术TraDiffusion:允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调

    厦门大学和中国科学院大学深圳先进技术研究院的研究人员推出新型图像生成技术TraDiffusion,这项技术的核心在于它允许用户通过鼠标轨迹来轻松引导图像的生成,而无需进行额外的训练或微调。简单来说,就...
    新技术# TraDiffusion# 图像生成
    2年前
    08280
    DiPIR:将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中

    DiPIR:将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中

    英伟达、多伦多大学和矢量研究所的研究人员推出DiPIR技术,它能够将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中。这项技术的核心在于理解和模拟场景的光照、几何形状和材质,以及图像形成过程,从而...
    新技术# DiPIR
    2年前
    06170
    新型视频生成模型Factorized-Dreamer:用于将文本转换成高质量的视频

    新型视频生成模型Factorized-Dreamer:用于将文本转换成高质量的视频

    字节跳动和香港理工大学的研究人员推出新型视频生成模型Factorized-Dreamer,它专门用于将文本转换成高质量的视频(Text-to-Video, T2V)。Factorized-Dreame...
    新技术# Factorized-Dreamer# 视频生成模型
    2年前
    04280
    Adobe推出全新图像编辑方法TurboEdit:实现基于文本的即时图像编辑

    Adobe推出全新图像编辑方法TurboEdit:实现基于文本的即时图像编辑

    Adobe Research推出了一种全新的图像编辑方法TurboEdit,它能够实现基于文本的即时图像编辑,它利用了所谓的"少步骤扩散模型"(few-step diffusion models),在...
    新技术# TurboEdit# 图像编辑
    2年前
    05440
    新型视频人脸超分辨率技术KEEP:让模糊不清的人脸视频变得清晰

    新型视频人脸超分辨率技术KEEP:让模糊不清的人脸视频变得清晰

    南洋理工大学 S-Lab推出一种新型视频人脸超分辨率技术KEEP,也就是让模糊不清的人脸视频变得清晰。例如,你手里有一些老旧电影的片段,或者监控摄像头拍到的模糊人脸,这项技术能够让这些人脸在视频中变得...
    新技术# KEEP# 视频人脸超分辨率
    2年前
    01,5760
    基于扩散模型的无需反转的人像风格化框架ZePo:在无需任何模型微调的情况下,快速生成具有特定艺术风格的肖像图像

    基于扩散模型的无需反转的人像风格化框架ZePo:在无需任何模型微调的情况下,快速生成具有特定艺术风格的肖像图像

    上海科技大学信息科学技术学院和中国科学院自动化研究所的研究人员推出了一种基于扩散模型的无需反转的人像风格化框架ZePo,它能够在无需任何模型微调的情况下,仅需四个采样步骤就能实现内容和风格特征的融合...
    新技术# ZePo# 人像风格化
    2年前
    05510
    创新框架Generative Photomontage:通过组合多个生成的图像来创建他们所需的图像

    创新框架Generative Photomontage:通过组合多个生成的图像来创建他们所需的图像

    卡内基梅隆大学和赖希曼大学的研究人员推出创新框架Generative Photomontage,它使用户能够通过组合多个生成的图像来创建他们所需的图像,这个过程就像是用不同的图像拼贴出一幅全新的画面...
    新技术# Generative Photomontage
    2年前
    05280
    新型视频生成模型FancyVideo:根据文本提示生成动态丰富且时间上连贯的视频

    新型视频生成模型FancyVideo:根据文本提示生成动态丰富且时间上连贯的视频

    360 AI研究中心和中山大学的研究人员推出新型视频生成模型FancyVideo,它能够根据文本提示生成动态丰富且时间上连贯的视频。FancyVideo通过精心设计的跨帧文本引导模块(CTGM)改进了...
    新技术# FancyVideo
    2年前
    08660
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    360 安全龙虾

    360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    查看完整榜单