SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    PSHuman:利用多视角扩散模型先验的3D人体建模新框架

    PSHuman:利用多视角扩散模型先验的3D人体建模新框架

    真实感3D人体建模在虚拟现实、增强现实、电影制作、游戏开发和医疗等领域具有广泛的应用。尽管单目全身重建方法取得了显著进展,但它们通常依赖于前视图和/或预测的后视图,这导致了由于问题的病态性质和复杂的自...
    新技术# 3D人体建模# PSHuman
    1年前
    03240
    3D高效框架Make-It-Animatable:将任意3D人物模型快速制作成可用于动画的角色

    3D高效框架Make-It-Animatable:将任意3D人物模型快速制作成可用于动画的角色

    中国科学技术大学和腾讯的研究人员推出高效框架Make-It-Animatable,它用于将任意3D人物模型快速制作成可用于动画的角色。这个框架能够在不到一秒钟的时间内,无论3D模型的形状和姿势如何,都...
    新技术# 3D# Make-It-Animatable
    1年前
    03240
    ViewExtrapolator:于在新视角合成领域中进行新视角外推

    ViewExtrapolator:于在新视角合成领域中进行新视角外推

    南洋理工大学和中国科学院大学的研究人员推出一个名为ViewExtrapolator的新方法,它用于在新视角合成(novel view synthesis, NVS)领域中进行新视角外推(novel v...
    新技术# ViewExtrapolator
    1年前
    03240
    文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像

    文生图模型SnapGen:能够在移动平台上生成高分辨率和高品质的图像

    现有的文本到图像(T2I)扩散模型虽然在生成高质量图像方面表现出色,但面临着几个关键挑战: 模型尺寸大:许多先进的T2I模型包含数十亿个参数,导致存储和部署成本高昂。 运行时间慢:生成高分辨率图像通常...
    新技术# SnapGen# 文生图模型
    1年前
    03230
    原生FP4训练框架 Quartet:通过在低精度( FP4)下进行高效的端到端训练,显著提升大语言模型(LLMs)的训练效率和性能

    原生FP4训练框架 Quartet:通过在低精度( FP4)下进行高效的端到端训练,显著提升大语言模型(LLMs)的训练效率和性能

    ISTA和苏黎世联邦理工学院的研究人员推出原生FP4训练框架 Quartet,通过在低精度( FP4)下进行高效的端到端训练,显著提升大语言模型(LLMs)的训练效率和性能,二之前DeepSeek R...
    新技术# FP4训练框架# Quartet
    10个月前
    03210
    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    强化学习(RL)在大语言模型(LLM)的后续训练中已被广泛应用,尤其是在提升模型的推理能力方面。然而,如何在各种领域中为LLM获得准确的奖励信号,仍然是一个关键挑战。 论文:https://arxiv...
    新技术# DeepSeek# 奖励建模# 清华大学
    12个月前
    03210
    Track4Gen:用于视频生成的空间感知视频生成器

    Track4Gen:用于视频生成的空间感知视频生成器

    Adob​​e 研究中心、韩国科学技术院和伦敦大学学院的研究人员推出Track4Gen,这是一个用于视频生成的空间感知视频生成器,它结合了视频扩散损失和跨帧点跟踪,提供了对扩散特征的空间监督,以增强视...
    新技术# Track4Gen
    1年前
    03210
    腾讯推出新型视频分词器Divot:统一视频的理解和生成

    腾讯推出新型视频分词器Divot:统一视频的理解和生成

    近年来,大语言模型(LLMs)在图像理解和生成方面取得了显著进展,尤其是在将图像编码为离散标记并结合LLMs进行多模态任务时。然而,将这一成功扩展到视频领域面临着更大的挑战,因为视频不仅包含空间信息...
    新技术# Divot# 视频分词器
    1年前
    03210
    Motion Prompting框架:通过动轨迹控制视频生成

    Motion Prompting框架:通过动轨迹控制视频生成

    Google DeepMind、密歇根大学和布朗大学的研究人员推出一个名为“Motion Prompting”的框架,它用于控制视频生成中的动作轨迹。该框架通过使用运动轨迹作为条件信号,来生成具有特定...
    新技术# Motion Prompting# 运动轨迹控
    1年前
    03210
    先进跟踪系统TAPTRv3:用于在长视频中跟踪任意点

    先进跟踪系统TAPTRv3:用于在长视频中跟踪任意点

    IDEA Research、华南理工大学、清华大学和香港科技大学的研究人员推出先进跟踪系统TAPTRv3,它专门设计用于在长视频中跟踪任意点。TAPTRv3是建立在TAPTRv2基础上的,主要目标是提...
    新技术# TAPTRv3
    1年前
    03200
    基于图像扩散先验的深度修复模型DepthLab:从单张图像中生成完整的3D场景

    基于图像扩散先验的深度修复模型DepthLab:从单张图像中生成完整的3D场景

    香港大学、香港科技大学、蚂蚁集团、阿尔托大学和通义实验室的研究人员推出DepthLab ,它是一个基于图像扩散先验的深度修复模型,用于从单张图像中生成完整的3D场景。DepthLab旨在解决深度数据中...
    新技术# 3D场景# DepthLab# 深度修复模型
    1年前
    03180
    零一万物推出Presto:专为生成长达15秒的高质量视频而设计的新型扩散模型

    零一万物推出Presto:专为生成长达15秒的高质量视频而设计的新型扩散模型

    零一万物团队隆重推出Presto——一款专为生成长达15秒的高质量视频而设计的新型扩散模型。Presto旨在克服长时间视频生成中保持场景多样性和一致性的挑战,通过引入分段交叉注意力(Segmented...
    新技术# Presto# 零一万物
    1年前
    03170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    Sub2API

    Sub2API

    Sub2API 是一个 AI API 网关平台,用于分发和管理 AI 产品订阅(如 Claude Code $200/月)的 API 配额。用户通过平台生成的 API Key 调用上游 AI 服务,平台负责鉴权、计费、负载均衡和请求转发。
    查看完整榜单