SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    阿里云新系统 Aegaeon:用 213 个 GPU 实现 1,192 个的推理能力

    阿里云新系统 Aegaeon:用 213 个 GPU 实现 1,192 个的推理能力

    阿里云在 ACM SOSP 2025(操作系统原理研讨会)上发表了一篇经同行评审的论文,介绍其名为 Aegaeon 的新型 GPU 池化系统。该系统在阿里云 Model Studio 平台的多月生产测...
    新技术# Aegaeon# 阿里云
    2个月前
    0510
    华为开源 SINQ:新型量化技术让大模型在消费级显卡上高效运行

    华为开源 SINQ:新型量化技术让大模型在消费级显卡上高效运行

    随着大语言模型(LLM)参数规模持续增长,部署成本已成为制约其广泛应用的主要瓶颈之一。 华为苏黎世计算系统实验室近日推出一项名为 SINQ(Sinkhorn-Normalized Quantizati...
    新技术# SINQ# 华为# 量化技术
    2个月前
    0770
    Self-Forcing++:一种无需长视频训练即可生成高质量长视频的新方法

    Self-Forcing++:一种无需长视频训练即可生成高质量长视频的新方法

    近年来,扩散模型在图像和短片视频生成方面取得了突破性进展。然而,当扩展到长视频生成(如数十秒甚至数分钟)时,现有方法普遍面临一个核心问题:质量随长度增加而显著下降。 这主要源于两个限制: 计算成本高...
    新技术# Self Forcing# 字节跳动
    2个月前
    01250
    英伟达推出LONGLIVE:单卡实现实时交互式长视频生成

    英伟达推出LONGLIVE:单卡实现实时交互式长视频生成

    AI生成视频正从“几秒特效”迈向“分钟级叙事”。 长期以来,生成高质量、长时间连贯的视频是AI内容创作的一大瓶颈。传统扩散模型虽能产出精美画面,却难以支持实时生成;自回归方法虽具备推理加速潜力,又常因...
    新技术# LONGLIVE# 英伟达
    2个月前
    01300
    用 Wi-Fi 信号生成房间图像?LatentCSI 结合 AI 实现高分辨率空间重建

    用 Wi-Fi 信号生成房间图像?LatentCSI 结合 AI 实现高分辨率空间重建

    东京科学研究所的研究团队近日提出一种新方法——LatentCSI,能够利用日常 Wi-Fi 设备采集的无线信号,结合预训练扩散模型,生成高分辨率的室内布局图像。 论文地址:https://arxiv...
    新技术# LatentCSI
    2个月前
    01170
    Q-Tuning:用“错误-不确定性”框架统一剪枝,提升微调效率

    Q-Tuning:用“错误-不确定性”框架统一剪枝,提升微调效率

    监督微调(SFT)正变得越来越重。 过去,SFT 只是大模型训练流程中的一个轻量级收尾步骤;如今,它已演变为一场计算密集型任务,其数据规模和训练成本常常逼近中期预训练阶段。在有限算力预算下,如何高效利...
    新技术# Q-Tuning
    2个月前
    0620
    Rolling Forcing:一种用于长视频生成的新型自回归扩散方法

    Rolling Forcing:一种用于长视频生成的新型自回归扩散方法

    在构建交互式世界模型、神经游戏引擎和沉浸式 XR 应用的道路上,一个核心挑战始终存在:如何实时生成高质量、时间连贯的长视频流? 当前主流的自回归视频生成方法虽能产出单段短片,但在生成多分钟连续视频时...
    新技术# Rolling Forcing# 长视频生成
    2个月前
    01060
    SageAttention3 发布:FP4 推理加速与 8 位训练新探索

    SageAttention3 发布:FP4 推理加速与 8 位训练新探索

    清华大学研究团队近日推出 SageAttention3,一项聚焦于提升 Transformer 注意力机制效率的新研究成果。该工作在推理阶段引入基于 FP4 的微缩放量化技术,并首次系统性探索了 8 ...
    新技术# SageAttention3# 清华大学
    2个月前
    0690
    Windows ML 现已可用:让 AI 应用更高效运行在你的电脑上

    Windows ML 现已可用:让 AI 应用更高效运行在你的电脑上

    微软宣布,其 Windows ML 平台现已正式进入生产可用状态,面向所有运行 Windows 11 24H2 及以上版本的设备开放。这一进展标志着 Windows 在本地 AI 能力上的关键落地...
    新技术# Windows ML
    2个月前
    0800
    潜在分区网络(LZN):以共享高斯潜在空间,统一生成、表示与分类的机器学习新框架

    潜在分区网络(LZN):以共享高斯潜在空间,统一生成、表示与分类的机器学习新框架

    在机器学习领域,生成模型(如 DALL・E 生成图像、ChatGPT 生成文本)、表示学习(如 CLIP 实现图文表示匹配)、分类模型(如 ResNet 进行图像分类)是三大核心方向,且各自都已取得成...
    新技术# LZN# 潜在分区网络
    2个月前
    0760
    BranchGRPO:树状分支重构,破解GRPO图像视频生成对齐的效率与稳定性难题

    BranchGRPO:树状分支重构,破解GRPO图像视频生成对齐的效率与稳定性难题

    在图像、视频生成领域,“让模型输出与人类偏好对齐”是关键目标——无论是生成符合审美标准的图像,还是帧间连贯的视频,都需要通过算法优化缩小模型输出与人类期望的差距。群体相对策略优化(GRPO)是近年常用...
    新技术# BranchGRPO
    2个月前
    0910
    RPG:一种用于统一且可扩展代码库生成的存储库规划图

    RPG:一种用于统一且可扩展代码库生成的存储库规划图

    微软、清华大学和加州大学圣地亚哥分校的研究人员推出一个名为 Repository Planning Graph (RPG) 的框架,用于从头开始生成完整的软件仓库。它通过将软件的功能规划和实现规划统一...
    新技术# RPG# 代码库生成
    3个月前
    0760
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    Websets

    Websets

    Websets 是一款专为知识工作者设计的工具,能够帮助用户高效地查找符合特定标准的实体列表(如公司、人员、研究论文等)。根据基准测试,Websets 在复杂查询方面的表现远超谷歌,检索到的正确结果数量比谷歌多 20 倍以上。
    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统

    AI 智能盲人眼镜系统是一个面向视障用户的智能辅助工具原型,整合了盲道导航、过马路辅助、物品识别和语音交互等核心功能。通过视频、音频、IMU(惯性测量单元)等多模态输入,系统可提供实时语音引导与环境感知能力,帮助用户更安全地感知周围环境。
    查看完整榜单