SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    FIND3D模型:在开放世界环境中对3D对象的任何部分进行语义分割

    FIND3D模型:在开放世界环境中对3D对象的任何部分进行语义分割

    加州理工学院的研究人员推出FIND3D模型,它能够在开放世界环境中对3D对象的任何部分进行语义分割。这意味着FIND3D可以基于任何文本查询,对任何对象的任何部分进行分割。这项技术在机器人技术、虚拟现...
    新技术# FIND3D# 语义分割
    1年前
    02980
    新型框架SplatFlow:用于3D高斯绘制(3DGS)的合成和编辑

    新型框架SplatFlow:用于3D高斯绘制(3DGS)的合成和编辑

    Twelvelabs和韩国科学技术研究院的研究人员推出新型框架SplatFlow,它用于3D高斯绘制(3D Gaussian Splatting,简称3DGS)的合成和编辑。SplatFlow通过结合...
    新技术# 3DGS# SplatFlow
    1年前
    02820
    新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型

    新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型

    故事讲述视频生成(SVG)是一项旨在从文本脚本创建长时间、多动作、多场景视频的任务。这种技术在媒体和娱乐领域的内容创作中具有巨大潜力,但同时也面临着诸多挑战,包括但不限于: 物体需要展示一系列精细、复...
    新技术# DreamRunner# 视频生成
    1年前
    03400
    适用于FLUX模型!新型零样本主题驱动图像生成方法Diptych Prompting

    适用于FLUX模型!新型零样本主题驱动图像生成方法Diptych Prompting

    主题驱动的文本到图像生成旨在通过准确捕捉主体的视觉特征和文本提示的语义内容,在期望的上下文中生成新主体的图像。传统方法依赖于耗时耗资源的微调以实现主题对齐,而最近的零样本方法则依赖于即时的图像提示,通...
    新技术# Diptych Prompting# FLUX模型
    1年前
    03520
    整数低秩参数微调量化扩散模型IntLoRA:提升了文生图模型微调的效率

    整数低秩参数微调量化扩散模型IntLoRA:提升了文生图模型微调的效率

    近年来,文生图模型在各种下游任务中取得了显著的成果。然而,微调这些大型模型所需的计算资源非常庞大,限制了其在个性化定制和实际应用中的普及。为了解决这一问题,研究人员开始探索参数高效微调(PEFT)技术...
    新技术# IntLoRA
    1年前
    03480
    DiffusionGS:单阶段3D扩散模型,实现单视图物体和场景生成

    DiffusionGS:单阶段3D扩散模型,实现单视图物体和场景生成

    现有的前馈图像到3D的方法主要依赖于2D多视图扩散模型,这些模型在生成3D内容时存在一些显著的局限性。首先,它们无法保证3D一致性,导致在改变提示视图方向时容易崩溃。其次,这些方法主要处理以物体为中心...
    新技术# 3D模型# DiffusionGS
    1年前
    03790
    MagicDriveDiT:提高视频合成的效率和可控性,以更好地服务于自动驾驶应用

    MagicDriveDiT:提高视频合成的效率和可控性,以更好地服务于自动驾驶应用

    随着扩散模型的迅速发展,视频合成技术尤其是可控视频生成领域取得了重大突破,这对自动驾驶等应用具有重要意义。然而,现有的视频生成方法在处理高分辨率和长视频时面临可扩展性和控制条件整合的挑战,限制了它们在...
    新技术# MagicDriveDiT# 自动驾驶
    1年前
    03740
    无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑

    无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑

    Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow,这是一种无需训练的图像编辑技术,能够执行各种类型的图像编辑操作,包括非刚性编辑...
    新技术# Stable Flow# 图像编辑
    1年前
    04030
    基础世界模型The Matrix:用于生成无限长度和实时的视频

    基础世界模型The Matrix:用于生成无限长度和实时的视频

    在追求高质量、实时视频生成的过程中,研究人员和开发者们面临着一系列挑战。传统的视频生成模型往往因高昂的计算成本、有限的视频时长以及缺乏实时交互性而受到限制。特别是在需要长时间、高分辨率视频生成的应用场...
    新技术# The Matrix# 世界模型
    1年前
    03810
    Reducio-DiT:通过先进压缩技术提升视频生成效率

    Reducio-DiT:通过先进压缩技术提升视频生成效率

    随着技术的进步,视频生成模型已经能够创造出令人惊叹的高质量视频片段。然而,这些模型在实际应用中面临着一些显著的障碍,主要集中在计算资源的需求上。目前市场上的领先模型,例如Sora、Runway Gen...
    新技术# Reducio-DiT# Reducio-VAE
    1年前
    03660
    开源版风格参考StyleCodes:能够将图像风格表达为一个 20 符号的 base64 代码

    开源版风格参考StyleCodes:能够将图像风格表达为一个 20 符号的 base64 代码

    扩散模型在图像生成方面取得了显著的成功,但如何有效地控制生成图像的风格仍然是一个挑战。虽然使用示例图像可以实现风格控制,但这种方法存在一些不便:示例图像体积较大,不易于分享,且可能涉及隐私问题。为此...
    新技术# Midjourney# StyleCodes# 风格参考
    1年前
    05300
    SSAM 2增强版SAMURAI:专门设计用于视觉物体跟踪

    SSAM 2增强版SAMURAI:专门设计用于视觉物体跟踪

    Segment Anything Model 2 (SAM 2) 是一个在物体分割任务中表现出色的模型,但在视觉物体跟踪方面仍面临一些挑战。特别是在处理拥挤场景中快速移动或自我遮挡的物体时,SAM 2...
    新技术# SAMURAI# SSAM 2
    1年前
    06400
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    新OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    查看完整榜单