SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成

    新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成

    来自马克斯·普朗克智能系统研究所、Adob​​e和加州大学圣地亚哥分校的研究团队推出新型视频生成方法Time Reversal Fusion(时间反转融合,简称TRF),它能够控制视频内容在给定的起始...
    新技术# TRF# 视频生成
    2年前
    05480
    新型视频生成模型Loong:基于自回归大语言模型,能够生成长达一分钟的连贯、内容丰富的视频

    新型视频生成模型Loong:基于自回归大语言模型,能够生成长达一分钟的连贯、内容丰富的视频

    香港大学和字节跳动的研究人员推出新型视频生成模型Loong,它基于自回归大语言模型(LLMs),能够生成长达一分钟的连贯、内容丰富的视频。这在视频生成领域是一个挑战,因为视频通常包含大量的帧,每帧都需...
    新技术# Loong# 自回归大语言模型
    1年前
    05440
    Adobe推出全新图像编辑方法TurboEdit:实现基于文本的即时图像编辑

    Adobe推出全新图像编辑方法TurboEdit:实现基于文本的即时图像编辑

    Adobe Research推出了一种全新的图像编辑方法TurboEdit,它能够实现基于文本的即时图像编辑,它利用了所谓的"少步骤扩散模型"(few-step diffusion models),在...
    新技术# TurboEdit# 图像编辑
    2年前
    05440
    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    清华大学、伊利诺伊大学厄巴纳香槟分校和哥伦比亚大学的研究人员携手推出了一项创新成果—PhysGen3D,将单一图像转化为非模态、以相机为中心的交互式 3D 场景。 项目主页:https://by-lu...
    新技术# 3D场景# PhysGen3D
    12个月前
    05410
    创新框架FeatUp:提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息

    创新框架FeatUp:提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息

    来自麻省理工、微软、Adobe和谷歌的研究团队推出创新框架FeatUp,它能够提高深度学习模型中图像特征的空间分辨率,而不会损失原有的语义信息。在计算机视觉领域,深度学习模型通常会从图像中提取特征,这...
    新技术# FeatUp# 深度模型
    2年前
    05410
    新型图像生成框架ControlAR:根据空间控制信息生成可控制的高质量图像

    新型图像生成框架ControlAR:根据空间控制信息生成可控制的高质量图像

    华中科技大学信息与通信学院、香港大学计算机科学系和vivo AI 实验室的研究人员推出新型图像生成框架ControlAR,它能够根据空间控制信息生成可控制的高质量图像。简单来说,ControlAR能够...
    新技术# ControlAR# 图像生成框架
    1年前
    05390
    3D场景编辑框架TIP-Editor

    3D场景编辑框架TIP-Editor

    来自腾讯人工智能实验室、中山大学的研究人员推出3D场景编辑框架TIP-Editor,它允许用户不仅通过文本提示,还通过图像提示来精确地编辑现有的基于3D高斯散射(GS)的辐射场。TIP-Editor的...
    新技术# 3D场景编辑# TIP-Editor
    2年前
    05390
    用于加速DiT模型的训练和推理过程的方法HarmoniCa

    用于加速DiT模型的训练和推理过程的方法HarmoniCa

    商汤科技研究院、北京航空航天大学、莫纳什大学和香港科技大学推出一种用于加速DiT模型的训练和推理过程的方法HarmoniCa,通过基于Step-Wise去噪训练(SDT)和图像错误代理引导目标(IEP...
    新技术# DiT模型# HarmoniCa
    1年前
    05380
    新型指令式图像编辑框架FireEdit:利用区域感知的视觉语言模型(VLM),实现了对用户指令的细粒度理解和精确图像编辑

    新型指令式图像编辑框架FireEdit:利用区域感知的视觉语言模型(VLM),实现了对用户指令的细粒度理解和精确图像编辑

    中山大学深圳校区、腾讯混元、清华大学和香港科技大学的研究人员推出新型指令式图像编辑框架FireEdit,它通过利用区域感知的视觉语言模型(VLM),实现了对用户指令的细粒度理解和精确图像编辑。Fire...
    新技术# FireEdit# 图像编辑# 视觉语言模型
    11个月前
    05370
    BootPIG:零样本个性化图像生成

    BootPIG:零样本个性化图像生成

    来自Salesforce的研究人员提出了一种新架构BootPIG,旨在实现零样本个性化图像生成。该架构基于预训练的文本到图像模型Stable Diffusion,通过引入参考图像来指导生成的对象外观...
    新技术# BootPIG# Stable Diffusion
    2年前
    05370
    DragAPart:一张图片和加一系列拖动操作作为输入,生成新图片

    DragAPart:一张图片和加一系列拖动操作作为输入,生成新图片

    牛津大学视觉几何小组推出DragAPart,它接收一张图片和一系列拖动操作作为输入,能够生成该物体在新状态下的新图片,且新图片与拖动操作所表达的动作相匹配。与先前主要关注物体重新定位的工作不同,Dra...
    新技术# DragAPart
    2年前
    05330
    AI动画生成框架Keyframer:利用GPT4生成动画

    AI动画生成框架Keyframer:利用GPT4生成动画

    来自苹果的研究人员推出一款利用大语言模型(LLMs)生成动画的框架Keyframer,它利用大语言模型(LLMs)来帮助设计师通过自然语言描述来创建动画。 论文地址 Keyframer的主要功能包括从...
    新技术# AI动画# CSS动画# Keyframer
    2年前
    05330
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    新OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Yihen-Drama

    Yihen-Drama

    Yihen-Drama 是一个专为 AI 短剧创作 打造的全流程一站式平台。它打破了传统视频制作的壁垒,将复杂的影视工业化流程浓缩为一条流畅的自动化流水线。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    查看完整榜单