SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型虚拟试穿技术FitDiT:专为优化DiT模型的虚拟试穿性能而设计

    新型虚拟试穿技术FitDiT:专为优化DiT模型的虚拟试穿性能而设计

    尽管基于图像的虚拟试穿技术已取得显著进展,但在生成高保真度和适应性强的拟合图像上仍面临诸多挑战。尤其在纹理感知维护和尺寸感知拟合等关键领域,现有方法往往难以达到理想效果,这限制了技术的整体实用性。为应...
    新技术# FitDiT# 虚拟试穿
    1年前
    03700
    LMCache:为大语言模型加速的新一代缓存系统

    LMCache:为大语言模型加速的新一代缓存系统

    随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...
    新技术# LMCache# 大语言模型# 缓存
    9个月前
    03690
    腾讯开源用于加速形状生成的通用框架 FlashVDM:加速 Hunyuan3D 2.0 模型生成速度提升30 倍

    腾讯开源用于加速形状生成的通用框架 FlashVDM:加速 Hunyuan3D 2.0 模型生成速度提升30 倍

    腾讯推出一个通用的框架FlashVDM,用于加速形状生成向量集扩散模型(VDM),例如 Hunyuan3D-2、Michelangelo、CraftsMan3D、CLAY、TripoSG、Dora 等...
    新技术# FlashVDM# Hunyuan3D-2.0# 腾讯
    1年前
    03680
    字节推出CausalFusion:基于解码器的变换器,旨在统一自回归(AR)和扩散模型的生成范式

    字节推出CausalFusion:基于解码器的变换器,旨在统一自回归(AR)和扩散模型的生成范式

    字节跳动介绍了一个名为CausalFusion的模型,它是一个基于解码器的变换器(decoder-only transformer),旨在统一自回归(AR)和扩散模型(diffusion models...
    新技术# CausalFusion
    1年前
    03680
    FlowChef:利用矢量场动力学的统一受控图像生成框架

    FlowChef:利用矢量场动力学的统一受控图像生成框架

    扩散模型(DMs)在照片真实感图像生成、图像编辑和逆问题解决方面取得了显著进展,这主要归功于无分类器引导和图像反演技术。然而,校正流模型(RFMs)在这类任务中的潜力尚未得到充分开发。现有的基于DM的...
    新技术# FlowChef# 图像生成框架
    1年前
    03680
    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    文本-图像到视频生成(TI2V) 是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展,但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战,尤其是在指定运动细节方面...
    新技术# MotiF# 图生视频
    1年前
    03670
    多视角视频生成新技术SynCamMaster:能够从不同的视点生成同步的、一致性高的动态场景视频

    多视角视频生成新技术SynCamMaster:能够从不同的视点生成同步的、一致性高的动态场景视频

    浙江大学、快手科技、清华大学和香港中文大学的研究人员推出一种用于多视角视频生成的技术SynCamMaster,能够从不同的视点生成同步的、一致性高的动态场景视频。这项技术特别适用于虚拟拍摄等应用,它通...
    新技术# SynCamMaster# 多视角视频
    1年前
    03670
    Reducio-DiT:通过先进压缩技术提升视频生成效率

    Reducio-DiT:通过先进压缩技术提升视频生成效率

    随着技术的进步,视频生成模型已经能够创造出令人惊叹的高质量视频片段。然而,这些模型在实际应用中面临着一些显著的障碍,主要集中在计算资源的需求上。目前市场上的领先模型,例如Sora、Runway Gen...
    新技术# Reducio-DiT# Reducio-VAE
    1年前
    03660
    VLM-R3:增强多模态链式思考(CoT)的能力

    VLM-R3:增强多模态链式思考(CoT)的能力

    北京大学国家软件工程工程研究中心、阿里巴巴和中科智库的研究人员推出VLM-R3的框架,增强多模态链式思考(CoT)的能力。VLM-R3通过动态和迭代地关注和重新访问图像区域,实现文本推理在视觉证据中的...
    新技术# VLM-R3# 多模态推理
    10个月前
    03650
    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...
    新技术# GS-DiT# 视频生成
    1年前
    03650
    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    AI在视觉理解领域正不断突破边界。从最初的物体检测,到像素级语义分割,再到开放词汇识别,AI 对图像的理解能力持续进化。如今,谷歌 Gemini 2.5 带来了一个更具交互性的能力——对话式图像分割...
    新技术# Gemini 2.5# 图像分割
    8个月前
    03640
    新型测试时扩展框架Evolutionary Search (EvoSearch) :通过在推理阶段分配额外计算资源来提升图像和视频生成模型的性能

    新型测试时扩展框架Evolutionary Search (EvoSearch) :通过在推理阶段分配额外计算资源来提升图像和视频生成模型的性能

    香港科技大学和快手的研究人员推出新型测试时扩展(Test-Time Scaling, TTS)框架Evolutionary Search (EvoSearch) ,通过在推理阶段分配额外计算资源来提升...
    新技术# Evolutionary Search# EvoSearch
    10个月前
    03640
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    OpenMAIC

    新OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    Sub2API

    Sub2API

    Sub2API 是一个 AI API 网关平台,用于分发和管理 AI 产品订阅(如 Claude Code $200/月)的 API 配额。用户通过平台生成的 API Key 调用上游 AI 服务,平台负责鉴权、计费、负载均衡和请求转发。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    查看完整榜单