SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    LMCache:为大语言模型加速的新一代缓存系统

    LMCache:为大语言模型加速的新一代缓存系统

    随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...
    新技术# LMCache# 大语言模型# 缓存
    6个月前
    03270
    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    英伟达联合团队提出新型连续时间流图(flow map)模型 AYF:统一扩散与流模型的少步生成方案

    由英伟达、多伦多大学及矢量研究所联合提出一种新型的连续时间流图(flow map)模型Align Your Flow(AYF) ,显著提升扩散模型和基于流的生成模型的采样效率。这些模型虽然在图像与文本...
    新技术# Align Your Flow# AYF# 英伟达
    6个月前
    02480
    基于“幅度感知”的新型缓存机制MagCache:用于加速图像和视频扩散模型的生成过程

    基于“幅度感知”的新型缓存机制MagCache:用于加速图像和视频扩散模型的生成过程

    近年来,视频扩散模型在生成高质量视频方面取得了显著进展,但其计算成本高、推理速度慢的问题始终是落地的一大障碍。 为了解决这一难题,来自北京大学和华为的研究人员在最新论文中提出了 MagCache ...
    新技术# MagCache# 幅度感知# 模型加速
    6个月前
    02950
    香港大学 & 达摩院等联合推出:首个第一人称现实世界模拟器 PlayerOne

    香港大学 & 达摩院等联合推出:首个第一人称现实世界模拟器 PlayerOne

    由香港大学、阿里达摩院、湖畔实验室和华中科技大学联合研发的全新现实世界模拟系统 PlayerOne 正式亮相。这是首个以第一人称(egocentric)视角为核心的现实世界模拟器,标志着AI在沉浸式交...
    新技术# PlayerOne# 现实世界模拟器
    6个月前
    02000
    苹果推出可扩展生成模型STARFlow:基于归一化流(NFs),在高分辨率图像合成方面取得了显著的成果

    苹果推出可扩展生成模型STARFlow:基于归一化流(NFs),在高分辨率图像合成方面取得了显著的成果

    苹果推出了一个名为STARFlow的可扩展生成模型,它基于归一化流(Normalizing Flows,NFs),在高分辨率图像合成方面取得了显著的成果。STARFlow的主要构建块是Transfor...
    新技术# STARFlow# 可扩展生成模型
    6个月前
    01850
    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学、阿里达摩院与湖畔实验室的研究团队近日发布LayerFlow——一款专为层感知视频生成设计的统一框架。不同于传统视频生成方案,LayerFlow通过分层提示机制,可同步生成透明前景、纯净背景及...
    新技术# LayerFlow# 阿里# 香港大学
    6个月前
    01870
    新型单步视频修复(VR)技术SeedVR2:通过扩散模型和对抗性后训练(APT)实现高效、高质量的视频修复和超分辨率

    新型单步视频修复(VR)技术SeedVR2:通过扩散模型和对抗性后训练(APT)实现高效、高质量的视频修复和超分辨率

    南洋理工大学和字节跳动的研究人员推出一种新型单步视频修复(VR)技术SeedVR2,通过扩散模型(Diffusion Model)和对抗性后训练(Adversarial Post-Training, ...
    新技术# SeedVR2# 视频修复
    6个月前
    02530
    VLM-R3:增强多模态链式思考(CoT)的能力

    VLM-R3:增强多模态链式思考(CoT)的能力

    北京大学国家软件工程工程研究中心、阿里巴巴和中科智库的研究人员推出VLM-R3的框架,增强多模态链式思考(CoT)的能力。VLM-R3通过动态和迭代地关注和重新访问图像区域,实现文本推理在视觉证据中的...
    新技术# VLM-R3# 多模态推理
    6个月前
    02870
    韩国科学技术院推出TIC-FT:用时间上下文微调解锁视频扩散模型的精准控制

    韩国科学技术院推出TIC-FT:用时间上下文微调解锁视频扩散模型的精准控制

    在视频生成领域,我们正见证一场静默但深刻的变革。随着文本到视频扩散模型的质量不断提升,其输出已接近专业制作水平。然而,如何实现对视频生成过程的精确控制——例如根据特定图像或短片引导视频风格、动作或构图...
    新技术# TIC-FT# 时间上下文微调
    6个月前
    02460
    英伟达联合 MIT 与港大推出 Fast-dLLM:显著提升扩散模型推理效率

    英伟达联合 MIT 与港大推出 Fast-dLLM:显著提升扩散模型推理效率

    近日,英伟达(NVIDIA)联合麻省理工学院(MIT)与香港大学的研究团队,推出了名为 Fast-dLLM 的新型框架,解决当前扩散模型(Diffusion-based LLMs)在推理效率和生成质量...
    新技术# Fast-dLLM# 扩散模型
    6个月前
    01650
    用“Megakernel”打破LLM推理瓶颈:斯坦福Hazy Research实现Llama-1B史上最低延迟

    用“Megakernel”打破LLM推理瓶颈:斯坦福Hazy Research实现Llama-1B史上最低延迟

    在一些对响应速度极为敏感的应用场景中,例如对话式 AI 或人机协同的工作流系统,语言模型的推理延迟不仅影响效率,更直接影响用户体验。 以 Llama-3.2-1B 这类小型开源模型为例,在单序列生成任...
    新技术# Llama-1B# Megakernel
    6个月前
    05270
    Darwin Gödel Machine(DGM):能够自主修改自身代码的 AI智能体

    Darwin Gödel Machine(DGM):能够自主修改自身代码的 AI智能体

    在AI研究领域,一个长期目标是构建能够“无限学习”的系统——不仅在训练中学习,在部署后也能持续自我演化和提升。这一愿景的核心思想源自 哥德尔机器(Gödel Machine),它是一种理论上具备自修改...
    新技术# AI智能体# Darwin Gödel Machine
    6个月前
    02570
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    NOFX

    NOFX

    NOFX是一个基于 DeepSeek/Qwen AI 的加密货币期货自动交易系统,支持 Binance、Hyperliquid和Aster DEX交易所,多AI模型实盘竞赛,具备完整的市场分析、AI决策、自我学习机制和专业的Web监控界面。
    查看完整榜单