SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    悉尼科技大学和浙江大学的研究人员推出多粒度视频编辑框架VideoGrain,通过自然语言提示实现对视频内容的精细编辑。多粒度视频编辑包括类别级(class-level)、实例级(instance-le...
    新技术# VideoGrain# 视频编辑
    10个月前
    02980
    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学的研究团队介绍了一种名为 Attention Distillation (AD) 的方法,用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中。该方法通过计算预训练扩散模型中的自注...
    新技术# Attention Distillation# 参考图像# 深圳大学
    11个月前
    04840
    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    新加坡国立大学和微软研究院的研究团队提出了一种全新的扩散采样策略——区域自适应采样 (Region-Adaptive Sampling, RAS)。这是首个允许采样率在图像不同区域间动态变化的扩散采样...
    新技术# RAS# 区域自适应采样# 微软研究院
    11个月前
    04660
    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn,旨在加速大模型的推理过程,同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色,但由于其计算复杂度与序列...
    新技术# SpargeAttn# 加州大学伯克利分校# 清华大学
    11个月前
    05540
    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提...
    新技术# 3FS# DeepSeek# Smallpond
    11个月前
    02530
    Hugging Face 发布开源Python库FastRTC,简化实时 AI 语音和视频应用

    Hugging Face 发布开源Python库FastRTC,简化实时 AI 语音和视频应用

    AI 初创公司 Hugging Face 近日推出了一款名为 FastRTC 的开源 Python 库,旨在简化开发者构建实时音频和视频 AI 应用的复杂性。这一创新工具的发布,标志着实时 AI 应用...
    新技术# AI 语音# FastRTC# Python 库
    11个月前
    02070
    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    今天是 DeepSeek 开源周的第四天。与前三天相比,今天的开源项目公布稍晚一些,让关注者们等待得略显焦急,不过等待的结果总是值得的!DeepSeek 今日公布了两项重要的开源内容:DualPipe...
    新技术# DeepSeek# DualPipe# EPLB
    11个月前
    02240
    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    在开源周的第三天,DeepSeek 推出了一个名为 DeepGEMM 的新库,专为高效、简洁的 FP8 通用矩阵乘法(GEMM)而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题,特别...
    新技术# DeepGEMM# DeepSeek# 深度求索
    11个月前
    02780
    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    在大语言模型领域,专家混合(MoE)架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战,传统的全对全通信方法可能成为瓶颈。为此,深度求索开源第二弹Dee...
    新技术# DeepEP# DeepSeek# 深度求索
    11个月前
    02540
    清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型

    清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型

    随着大语言模型(LLMs)在各个领域的广泛应用,其安全性问题日益受到关注。尽管这些模型在性能上表现出色,但在面对恶意查询和越狱攻击时,仍存在一定的风险。为了应对这一挑战,清华大学与瑞莱智慧联合团队推出...
    新技术# DeepSeek-R1# RealSafe-R1# 大语言模型
    11个月前
    04780
    DeepSeek开源高效解码内核FlashMLA:从英伟达Hopper GPU中榨取最大性能

    DeepSeek开源高效解码内核FlashMLA:从英伟达Hopper GPU中榨取最大性能

    随着全球对高性能计算需求的不断增长,AI模型训练和推理对硬件资源的需求也在快速攀升。然而,由于美国出口限制等原因,中国市场更多依赖于英伟达的“缩减版”H800 GPU(相较于H100功能有所削减)。这...
    新技术# DeepSeek# FlashMLA# H800
    11个月前
    02230
    字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成

    字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成

    字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像...
    新技术# Phantom# 字节跳动# 视频生成
    9个月前
    02800
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    StoryTribe

    StoryTribe

    StoryTribe是一款免费的在线故事板制作工具,无需绘画技能,即可轻松创建插图和故事板。与传统的 AI 图像生成工具不同,StoryTribe 采用“以图制图”的方式,避免了文字到图像转换过程中可能出现的沟通误差。
    LiblibAI

    LiblibAI

    LiblibAI 是一家位于中国的 AI 图像生成平台,成立于 2023 年,为用户提供创建、分享和互动 AI 生成图像的工具。它基于开源的SD、Flux等模型,适合设计师、艺术家和内容创作者使用,提供文本到图像生成、图像操作和个性化模型训练等功能。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单