SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 947 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...
    新技术# IMM# Luma AI# 图像生成模型
    11个月前
    04150
    全新LoRA训练方法ADDifT(交替直接差分训练)

    全新LoRA训练方法ADDifT(交替直接差分训练)

    背景与动机 LoRA(低秩适应)是一种参数高效的微调技术,广泛用于大语言模型和扩散模型(如Stable Diffusion)的定制化训练。然而,传统LoRA训练方法存在效率低和易学到无关特征(如背景或...
    新技术# ADDifT# Lora# LoRA模型
    12个月前
    05420
    西湖大学推出一款具备自我进化能力的 GUI 代理AppAgentX

    西湖大学推出一款具备自我进化能力的 GUI 代理AppAgentX

    西湖大学 AGI 实验室张驰团队近日推出一款具备自我进化能力的 GUI 代理——AppAgentX,它能够在持续执行任务的过程中不断学习并优化自身行为模式,从而实现更高效的操作,为自动化任务执行带来了...
    新技术# AI智能体# AppAgentX# GUI 代理
    12个月前
    03410
    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...
    新技术# START# 大语言模型# 推理
    12个月前
    02290
    TheoremExplainAgent:用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化

    TheoremExplainAgent:用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化

    滑铁卢大学和Vector 研究所的研究人员推出代理系统TheoremExplainAgent,用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化。 项目主页:https...
    新技术# Manim 动画# TheoremExplainAgent# 定理解释视频
    12个月前
    02400
    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    悉尼科技大学和浙江大学的研究人员推出多粒度视频编辑框架VideoGrain,通过自然语言提示实现对视频内容的精细编辑。多粒度视频编辑包括类别级(class-level)、实例级(instance-le...
    新技术# VideoGrain# 视频编辑
    12个月前
    02990
    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学的研究团队介绍了一种名为 Attention Distillation (AD) 的方法,用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中。该方法通过计算预训练扩散模型中的自注...
    新技术# Attention Distillation# 参考图像# 深圳大学
    12个月前
    05550
    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    新加坡国立大学和微软研究院的研究团队提出了一种全新的扩散采样策略——区域自适应采样 (Region-Adaptive Sampling, RAS)。这是首个允许采样率在图像不同区域间动态变化的扩散采样...
    新技术# RAS# 区域自适应采样# 微软研究院
    12个月前
    04850
    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn,旨在加速大模型的推理过程,同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色,但由于其计算复杂度与序列...
    新技术# SpargeAttn# 加州大学伯克利分校# 清华大学
    12个月前
    05840
    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提...
    新技术# 3FS# DeepSeek# Smallpond
    12个月前
    02610
    Hugging Face 发布开源Python库FastRTC,简化实时 AI 语音和视频应用

    Hugging Face 发布开源Python库FastRTC,简化实时 AI 语音和视频应用

    AI 初创公司 Hugging Face 近日推出了一款名为 FastRTC 的开源 Python 库,旨在简化开发者构建实时音频和视频 AI 应用的复杂性。这一创新工具的发布,标志着实时 AI 应用...
    新技术# AI 语音# FastRTC# Python 库
    12个月前
    02100
    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    今天是 DeepSeek 开源周的第四天。与前三天相比,今天的开源项目公布稍晚一些,让关注者们等待得略显焦急,不过等待的结果总是值得的!DeepSeek 今日公布了两项重要的开源内容:DualPipe...
    新技术# DeepSeek# DualPipe# EPLB
    12个月前
    02270
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    A股智能分析系统

    A股智能分析系统

    A股智能分析系统是基于 AI 大模型的 A 股自选股智能分析系统,每日自动分析并推送「决策仪表盘」到企业微信/飞书/Telegram/邮箱
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    OpenClaw 一键部署工具

    OpenClaw 一键部署工具

    OpenClaw 一键部署工具是一款专为 AI 爱好者和开发者打造的私人 AI 助手一键部署工具,支持多模型、多消息渠道接入,提供图形界面与命令行两种部署方式,无需复杂的手动配置,就能快速搭建属于自己的跨平台 AI 助手,兼具灵活性与实用性。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单