SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 972 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    纽约大学、英特尔和AMD的研究人员推出一种基于二维高斯分布的图像表示方法Image-GS,它通过自适应地分配和优化一组二维高斯分布来重建图像。这种方法旨在为图像和纹理提供一种高效、灵活且硬件友好的表示...
    新技术# Image-GS# 图像表示方法
    8个月前
    02030
    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    在大语言模型(LLM)领域,扩散型大语言模型(Diffusion Large Language Models, DLLMs)正凭借其并行生成能力与全局上下文建模优势,成为传统自回归模型(AR)的有力竞...
    新技术# DAEDAL# 扩散大模型
    8个月前
    03060
    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    上海交通大学、山东大学、电子科技大学和香港科技大学的研究人员推出加速DiT架构模型推理速度的新方法TaylorSeer,扩散模型在图像和视频生成任务中表现出色,但其计算需求较高,限制了实时应用的可行性...
    新技术# TaylorSeer
    8个月前
    02190
    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    近年来,视频生成模型在质量上取得了显著进步。然而,一个根本性挑战始终存在: 时序维度的引入,使计算成本呈指数级增长。 标准扩散模型中的稠密注意力机制(Dense Attention)在处理长视频时面临...
    新技术# Radial Attention
    8个月前
    02930
    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO),用于训练大型语言模型(LLMs)。与以往基于单个标记(token)重要性比率...
    新技术# GSPO# Qwen3
    9个月前
    03900
    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    在文本到图像生成中,如何让模型“不生成某样东西”——例如“一只没有翅膀的鸟”或“一辆没有轮子的自行车”——始终是一个挑战。尽管正向提示可以引导生成内容,但负提示(negative prompt)的执行...
    新技术# VSF# 负面提示
    9个月前
    01930
    混合递归(MoR):用“动态思考”提升大模型推理效率

    混合递归(MoR):用“动态思考”提升大模型推理效率

    在大模型追求极致规模的浪潮中,一种新的架构正试图从“智能调度”而非“堆叠参数”的角度,重新定义效率。 由 KAIST AI 与 Mila 联合提出的新框架——混合递归(Mixture-of-Recur...
    新技术# MoR# 混合递归
    9个月前
    0990
    Snap Research 推出 Zero-Shot Dynamic Concept:无需微调,即可实现视频级动态个性化

    Snap Research 推出 Zero-Shot Dynamic Concept:无需微调,即可实现视频级动态个性化

    Snap Research 发布了一项名为 Zero-Shot Dynamic Concept 的新方法,为文本到视频生成模型中的动态概念个性化提供了全新的解决方案。该技术基于网格化 LoRA 架构...
    新技术# Snap Research# Zero-Shot Dynamic Concept
    9个月前
    01140
    首尔大学研究团队提出推理加速框架 RALU:无需训练的混合分辨率采样,加速DIT架构模型推理最高达7倍

    首尔大学研究团队提出推理加速框架 RALU:无需训练的混合分辨率采样,加速DIT架构模型推理最高达7倍

    DIT架构模型凭借其卓越的可扩展性,正逐步取代传统的 U-Net 架构,成为高保真图像与视频生成的主流模型。然而,其高昂的计算成本严重制约了在移动端、实时应用和大规模部署中的实用性。 为解决这一瓶颈...
    新技术# DiT架构模型# RALU# 首尔大学
    9个月前
    01150
    索尼与韩国科学技术院联合推出 DesignLab:一种全新的AI驱动幻灯片优化框架

    索尼与韩国科学技术院联合推出 DesignLab:一种全新的AI驱动幻灯片优化框架

    对大多数人而言,制作一份美观、专业、信息清晰的演示文稿是一项令人头疼的任务。 排版混乱、配色突兀、字体不协调——这些问题并非源于内容不足,而是设计决策的复杂性超出了非专业人士的能力范围。 尽管已有不少...
    新技术# DesignLab# PPT
    9个月前
    03320
    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    AI在视觉理解领域正不断突破边界。从最初的物体检测,到像素级语义分割,再到开放词汇识别,AI 对图像的理解能力持续进化。如今,谷歌 Gemini 2.5 带来了一个更具交互性的能力——对话式图像分割...
    新技术# Gemini 2.5# 图像分割
    9个月前
    04100
    CSD-VAR:从一张图中分离内容与风格的新方法

    CSD-VAR:从一张图中分离内容与风格的新方法

    高通AI研究和MovianAI的研究人员推出新方法CSD-VAR,用于从单张图像中分离内容(content)和风格(style),即内容风格分解(Content-Style Decomposition...
    新技术# CSD-VAR
    9个月前
    02550
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    waoo

    waoo

    waoowaoo AI 影视 Studio 是一款基于 AI 技术的短剧/漫画视频制作工具,支持从小说文本自动生成分镜、角色、场景,并制作成完整视频。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    RunningHub

    RunningHub

    RunningHub 是一个云平台,让用户轻松开发和分享 AI 应用。它特别适合那些希望通过浏览器直接操作的创作者,无需复杂的本地设置。平台基于 ComfyUI 工作流,提供强大的 GPU 云计算支持,确保高效任务执行。
    查看完整榜单