SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照(relighting)技术UniRelight,通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现。 项目主页...
    新技术# UniRelight# 视频重光照技术
    9个月前
    03800
    字节跳动推出统一优化数据质量与多样性的LLM预训练框架QuaDMix

    字节跳动推出统一优化数据质量与多样性的LLM预训练框架QuaDMix

    大语言模型(LLM)的性能和泛化能力在很大程度上依赖于其预训练数据的质量和多样性。然而,传统的数据整理方法往往将质量和多样性视为独立的目标,先进行质量过滤,再平衡领域分布。这种顺序优化忽略了两者之间的...
    新技术# QuaDMix# 字节跳动
    11个月前
    03790
    DiffusionGS:单阶段3D扩散模型,实现单视图物体和场景生成

    DiffusionGS:单阶段3D扩散模型,实现单视图物体和场景生成

    现有的前馈图像到3D的方法主要依赖于2D多视图扩散模型,这些模型在生成3D内容时存在一些显著的局限性。首先,它们无法保证3D一致性,导致在改变提示视图方向时容易崩溃。其次,这些方法主要处理以物体为中心...
    新技术# 3D模型# DiffusionGS
    1年前
    03790
    角色图像动画化Animate-X:基于潜在扩散模型(LDM)的通用动画框架,让图像上的角色动起来

    角色图像动画化Animate-X:基于潜在扩散模型(LDM)的通用动画框架,让图像上的角色动起来

    近年来,角色图像动画技术取得了显著进展,即从参考图像和目标姿态序列生成高质量视频。然而,大多数现有方法仅适用于人体,对拟人化角色(如卡通角色、游戏角色等)的泛化效果不佳。这种限制主要归因于对运动的建模...
    新技术# Animate-X# 角色图像动画化
    1年前
    03790
    4D 场景纹理化Tex4D:使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

    4D 场景纹理化Tex4D:使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

    来自香港中文大学(深圳)、NVIDIA 和加州大学默塞德分校的研究人员开发了 Tex4D,这是一种零样本方法,使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理。简单来说,如果...
    新技术# 4D 场景# 4D 纹理# Tex4D
    1年前
    03780
    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...
    新技术# Align Your Flow# AYF# 英伟达
    9个月前
    03760
    DEER:让大模型推理更高效,动态提前退出的新方法

    DEER:让大模型推理更高效,动态提前退出的新方法

    近年来,大型推理语言模型(LRLM)如 DeepSeek-R1 和 GPT-O1 的发展显著提升了复杂问题的解决能力。这些模型通过延长推理过程中“思维链”(Chain of Thought, CoT...
    新技术# DEER# 大模型推理
    11个月前
    03750
    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO),用于训练大型语言模型(LLMs)。与以往基于单个标记(token)重要性比率...
    新技术# GSPO# Qwen3
    8个月前
    03740
    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到图像生成系统,它利用了一种称为近似缓存(Approximate Caching)的技术,旨在高效地服务基于扩散...
    新技术# NIRVANA# 文生图
    1年前
    03740
    MagicDriveDiT:提高视频合成的效率和可控性,以更好地服务于自动驾驶应用

    MagicDriveDiT:提高视频合成的效率和可控性,以更好地服务于自动驾驶应用

    随着扩散模型的迅速发展,视频合成技术尤其是可控视频生成领域取得了重大突破,这对自动驾驶等应用具有重要意义。然而,现有的视频生成方法在处理高分辨率和长视频时面临可扩展性和控制条件整合的挑战,限制了它们在...
    新技术# MagicDriveDiT# 自动驾驶
    1年前
    03740
    Imagine360框架:能够将标准透视视频转换为360°全景视频

    Imagine360框架:能够将标准透视视频转换为360°全景视频

    香港中文大学、上海交通大学、南洋理工大学和上海人工智能实验室的研究人员推出Imagine360框架,它能够将标准透视视频转换为360°全景视频,从而为用户提供全方位的沉浸式视频体验。Imagine36...
    新技术# Imagine360# 全景视频
    1年前
    03720
    Textoon:基于文本描述生成Live2D格式2D卡通角色的创新方法

    Textoon:基于文本描述生成Live2D格式2D卡通角色的创新方法

    在数字角色创作领域,2D卡通风格因其独特的魅力而深受年轻观众的喜爱。尽管3D角色研究取得了显著进展,但交互式2D卡通角色的发展却显得相对滞后。为了解决这一问题,阿里巴巴通义实验室推出了Textoon...
    新技术# Live2D# Textoon
    1年前
    03710
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    OpenMAIC

    新OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    BotLearn

    BotLearn

    BotLearn 是全球首家AI智能体,也是第一个专为 AI 智能体打造的社交学习网络。我们正在重新定义人类-智能体学习范式,从静态的本地训练转向通过实时与专家节点互动,让智能体获取专业化、垂直领域的知识。
    Hermes Agent

    Hermes Agent

    Hermes Agent是由 Nous Research 推出的自我进化 AI 智能体。它是唯一内置学习循环的智能体——它能从经验中创造技能,在使用中改进技能,自我提示以持久化知识,搜索自身过去的对话,并在跨会话中构建对你不断加深的认知模型。
    查看完整榜单