SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    长上下文调优训练范式LCT:通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致性的多镜头视频内容

    长上下文调优训练范式LCT:通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致性的多镜头视频内容

    香港中文大学和字节跳动的研究人员提出了一种名为 Long Context Tuning(LCT,长上下文调优)的训练范式,通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致...
    新技术# LCT# 训练范式# 长上下文调优
    9个月前
    03250
    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,大模型推理引擎“赤兔 Chitu”现已正式开源。该引擎首次实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行...
    新技术# Chitu# DeepSeek# 大模型推理引擎
    9个月前
    03480
    加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成

    加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成

    加州大学伯克利分校、麻省理工学院、英伟达和清华大学的研究人员推出一个用于加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG),通过利用三维全注意力(3D full attent...
    新技术# Sparse VideoGen# SVG# 加速
    9个月前
    03950
    用于复杂任务自动化的分层多智能体协作框架PC-Agent:专门针对个人电脑(PC)场景设计

    用于复杂任务自动化的分层多智能体协作框架PC-Agent:专门针对个人电脑(PC)场景设计

    中国科学院自动化研究所自动化智能系统研究所、中国科学院大学人工智能学院、阿里巴巴集团、北京交通大学和上海科技大学信息科学与技术学院的研究人员推出PC-Agent,这是一个用于复杂任务自动化的分层多智能...
    新技术# PC-Agent# 分层多智能体协作框架
    9个月前
    02020
    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...
    新技术# IMM# Luma AI# 图像生成模型
    9个月前
    03890
    全新LoRA训练方法ADDifT(交替直接差分训练)

    全新LoRA训练方法ADDifT(交替直接差分训练)

    背景与动机 LoRA(低秩适应)是一种参数高效的微调技术,广泛用于大语言模型和扩散模型(如Stable Diffusion)的定制化训练。然而,传统LoRA训练方法存在效率低和易学到无关特征(如背景或...
    新技术# ADDifT# Lora# LoRA模型
    9个月前
    04840
    西湖大学推出一款具备自我进化能力的 GUI 代理AppAgentX

    西湖大学推出一款具备自我进化能力的 GUI 代理AppAgentX

    西湖大学 AGI 实验室张驰团队近日推出一款具备自我进化能力的 GUI 代理——AppAgentX,它能够在持续执行任务的过程中不断学习并优化自身行为模式,从而实现更高效的操作,为自动化任务执行带来了...
    新技术# AI智能体# AppAgentX# GUI 代理
    9个月前
    03360
    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...
    新技术# START# 大语言模型# 推理
    9个月前
    02190
    TheoremExplainAgent:用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化

    TheoremExplainAgent:用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化

    滑铁卢大学和Vector 研究所的研究人员推出代理系统TheoremExplainAgent,用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化。 项目主页:https...
    新技术# Manim 动画# TheoremExplainAgent# 定理解释视频
    10个月前
    02340
    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    多粒度视频编辑框架VideoGrain:通过自然语言提示实现对视频内容的精细编辑

    悉尼科技大学和浙江大学的研究人员推出多粒度视频编辑框架VideoGrain,通过自然语言提示实现对视频内容的精细编辑。多粒度视频编辑包括类别级(class-level)、实例级(instance-le...
    新技术# VideoGrain# 视频编辑
    10个月前
    02950
    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学推出Attention Distillation:用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中

    深圳大学的研究团队介绍了一种名为 Attention Distillation (AD) 的方法,用于将参考图像的视觉特征(如风格、纹理、外观)转移到生成的图像中。该方法通过计算预训练扩散模型中的自注...
    新技术# Attention Distillation# 参考图像# 深圳大学
    10个月前
    04230
    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    微软研究院推出新型采样策略RAS:用于加速DiT架构模型的生成过程

    新加坡国立大学和微软研究院的研究团队提出了一种全新的扩散采样策略——区域自适应采样 (Region-Adaptive Sampling, RAS)。这是首个允许采样率在图像不同区域间动态变化的扩散采样...
    新技术# RAS# 区域自适应采样# 微软研究院
    10个月前
    04580
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    Amazon Bedrock

    Amazon Bedrock

    Amazon Bedrock 是亚马逊AWS推出的一项完全托管的服务,旨在为用户提供一种简单、安全且高效的方式来构建和部署生成式AI应用程序。通过整合来自多家行业领先AI公司的高性能基础模型,Bedrock 提供了一个统一的API接口,使开发者能够轻松试验、评估并定制适合其特定需求的模型。此外,Bedrock 的无服务器架构让用户无需管理底层基础设施,从而专注于应用开发与优化。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单