SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    DreamActor-H1:字节跳动推出高保真人类-产品演示视频生成框架

    DreamActor-H1:字节跳动推出高保真人类-产品演示视频生成框架

    在电商广告、虚拟试穿、交互式媒体等场景中,如何高效生成高质量的人类-产品演示视频,一直是视觉生成领域的重要挑战。 近日,字节跳动 AI 实验室提出了一种全新的视频生成框架——DreamActor-H1...
    新技术# DreamActor-H1# 字节跳动
    7个月前
    02790
    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft,为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发,生成...
    新技术# Hunyuan-GameCraft# 腾讯混元
    7个月前
    03380
    InterActHuman:港中大 & 字节跳动联合推出多概念人类动画生成框架

    InterActHuman:港中大 & 字节跳动联合推出多概念人类动画生成框架

    来自香港中文大学和字节跳动的研究团队联合提出了一种新型视频生成框架 —— InterActHuman,用于生成包含多人物、人-物交互场景的高质量人类中心视频。 项目主页:https://zhenzhi...
    新技术# InterActHuman# 多概念人类动画生成
    7个月前
    02040
    LMCache:为大语言模型加速的新一代缓存系统

    LMCache:为大语言模型加速的新一代缓存系统

    随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...
    新技术# LMCache# 大语言模型# 缓存
    7个月前
    03440
    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...
    新技术# Align Your Flow# AYF# 英伟达
    7个月前
    02910
    基于“幅度感知”的新型缓存机制MagCache:用于加速图像和视频扩散模型的生成过程

    基于“幅度感知”的新型缓存机制MagCache:用于加速图像和视频扩散模型的生成过程

    近年来,视频扩散模型在生成高质量视频方面取得了显著进展,但其计算成本高、推理速度慢的问题始终是落地的一大障碍。 为了解决这一难题,来自北京大学和华为的研究人员在最新论文中提出了 MagCache ...
    新技术# MagCache# 幅度感知# 模型加速
    7个月前
    03250
    香港大学 & 达摩院等联合推出:首个第一人称现实世界模拟器 PlayerOne

    香港大学 & 达摩院等联合推出:首个第一人称现实世界模拟器 PlayerOne

    由香港大学、阿里达摩院、湖畔实验室和华中科技大学联合研发的全新现实世界模拟系统 PlayerOne 正式亮相。这是首个以第一人称(egocentric)视角为核心的现实世界模拟器,标志着AI在沉浸式交...
    新技术# PlayerOne# 现实世界模拟器
    7个月前
    02270
    苹果推出可扩展生成模型STARFlow:基于归一化流(NFs),在高分辨率图像合成方面取得了显著的成果

    苹果推出可扩展生成模型STARFlow:基于归一化流(NFs),在高分辨率图像合成方面取得了显著的成果

    苹果推出了一个名为STARFlow的可扩展生成模型,它基于归一化流(Normalizing Flows,NFs),在高分辨率图像合成方面取得了显著的成果。STARFlow的主要构建块是Transfor...
    新技术# STARFlow# 可扩展生成模型
    7个月前
    01870
    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学、阿里达摩院与湖畔实验室的研究团队近日发布LayerFlow——一款专为层感知视频生成设计的统一框架。不同于传统视频生成方案,LayerFlow通过分层提示机制,可同步生成透明前景、纯净背景及...
    新技术# LayerFlow# 阿里# 香港大学
    7个月前
    01880
    新型单步视频修复(VR)技术SeedVR2:通过扩散模型和对抗性后训练(APT)实现高效、高质量的视频修复和超分辨率

    新型单步视频修复(VR)技术SeedVR2:通过扩散模型和对抗性后训练(APT)实现高效、高质量的视频修复和超分辨率

    南洋理工大学和字节跳动的研究人员推出一种新型单步视频修复(VR)技术SeedVR2,通过扩散模型(Diffusion Model)和对抗性后训练(Adversarial Post-Training, ...
    新技术# SeedVR2# 视频修复
    7个月前
    02730
    VLM-R3:增强多模态链式思考(CoT)的能力

    VLM-R3:增强多模态链式思考(CoT)的能力

    北京大学国家软件工程工程研究中心、阿里巴巴和中科智库的研究人员推出VLM-R3的框架,增强多模态链式思考(CoT)的能力。VLM-R3通过动态和迭代地关注和重新访问图像区域,实现文本推理在视觉证据中的...
    新技术# VLM-R3# 多模态推理
    7个月前
    03180
    韩国科学技术院推出TIC-FT:用时间上下文微调解锁视频扩散模型的精准控制

    韩国科学技术院推出TIC-FT:用时间上下文微调解锁视频扩散模型的精准控制

    在视频生成领域,我们正见证一场静默但深刻的变革。随着文本到视频扩散模型的质量不断提升,其输出已接近专业制作水平。然而,如何实现对视频生成过程的精确控制——例如根据特定图像或短片引导视频风格、动作或构图...
    新技术# TIC-FT# 时间上下文微调
    7个月前
    02670
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    UUP dump

    UUP dump

    UUPDump是一个第三方网站,允许用户直接从微软的 Windows Update 服务器下载统一更新平台 (UUP) 文件,从而创建 Windows 10、11 和 Server 版本的自定义 ISO 镜像。它特别适用于访问最新预览体验版本或功能更新,这些更新可能无法通过官方渠道轻松获取。
    查看完整榜单