SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2231 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Chipmunk:无需训练的动态稀疏性加速DiT模型的推理过程

    Chipmunk:无需训练的动态稀疏性加速DiT模型的推理过程

    扩散模型(Diffusion Models)近年来在图像生成和视频生成领域表现出色,但其计算复杂度也成为了性能瓶颈。特别是基于DiT架构的模型,如FLUX、HunyuanVideo 等,其注意力层和多...
    新技术# Chipmunk# DiT模型# FLUX
    8个月前
    03230
    新型图像编辑框架PixelMan:基于扩散模型,通过像素操作和生成来实现一致性的对象编辑

    新型图像编辑框架PixelMan:基于扩散模型,通过像素操作和生成来实现一致性的对象编辑

    阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型图像编辑框架PixelMan,它基于扩散模型(Diffusion Models, DMs),通过像素操作和生成来实...
    新技术# PixelMan# 图像编辑
    1年前
    03230
    用于组合式文生图新框架GraPE:将复杂的多步生成任务分解为三个独立的步骤

    用于组合式文生图新框架GraPE:将复杂的多步生成任务分解为三个独立的步骤

    文本到图像(T2I)生成任务的目标是从文本提示生成逼真的图像。尽管扩散模型在这一领域取得了显著进展,但现有方法在处理复杂的多步推理和组合性提示时仍面临挑战。特别是,当文本提示包含多个对象及其属性之间的...
    新技术# GraPE# 文生图
    1年前
    03230
    无需训练的视频细化框架VideoRepair:自动识别和修复文生视频模型生成中的细粒度不对齐问题

    无需训练的视频细化框架VideoRepair:自动识别和修复文生视频模型生成中的细粒度不对齐问题

    最近的文生视频模型在生成高质量视频方面取得了显著进展,但这些模型生成的视频往往与文本提示存在不对齐的情况,尤其是在处理包含多个对象和属性的复杂场景时。为了解决这一问题,北卡罗来纳大学教堂山分校的研究人...
    新技术# VideoRepair# 视频生成模型
    1年前
    03230
    新型视觉生成模型RAR:在通过自回归建模提高图像生成任务的性能,同时保持与语言模型框架的完全兼容性

    新型视觉生成模型RAR:在通过自回归建模提高图像生成任务的性能,同时保持与语言模型框架的完全兼容性

    字节跳动推出一种新型视觉生成模型——随机自回归视觉生成(Randomized AutoRegressive Visual Generation,简称RAR)。该模型旨在通过自回归建模提高图像生成任务的...
    新技术# RAR模型# 随机自回归视觉生成
    1年前
    03230
    谷歌自主编码智能体 Jules 正式开放公测:写代码也能“异步执行”

    谷歌自主编码智能体 Jules 正式开放公测:写代码也能“异步执行”

    谷歌正式宣布其自主编码智能体 Jules 进入公开测试阶段,向全球支持 Gemini 模型的地区全面开放。 与传统代码补全工具不同,Jules 不是辅助你写代码,而是代替你写代码。它是一个真正意义上的...
    早报# Jules# 编码智能体# 谷歌
    7个月前
    03220
    Meta强化AI年龄检测,Instagram青少年保护再升级

    Meta强化AI年龄检测,Instagram青少年保护再升级

    Meta正在加大其在Instagram上使用AI检测青少年用户的方式,甚至会覆盖账户设置。这一举措旨在更好地保护青少年用户,确保他们在平台上的安全和隐私。 早在2024年,Instagram就宣布引入...
    早报# Instagram# Meta
    8个月前
    03220
    AMD CEO 苏姿丰加入穆罕默德·本·扎耶德人工智能大学董事会

    AMD CEO 苏姿丰加入穆罕默德·本·扎耶德人工智能大学董事会

    穆罕默德·本·扎耶德人工智能大学(MBZUAI)近日宣布重组其董事会,任命了一批新成员,其中包括 AMD 首席执行官苏姿丰。这一举措不仅标志着该大学与阿联酋经济和技术发展的深度融合,也进一步加强了其在...
    早报# AMD# MBZUAI# 穆罕默德·本·扎耶德人工智能大学
    10个月前
    03220
    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到图像生成系统,它利用了一种称为近似缓存(Approximate Caching)的技术,旨在高效地服务基于扩散...
    新技术# NIRVANA# 文生图
    1年前
    03220
    数据增强方法MaskRIS:用于改进指代表像分割任务的性能

    数据增强方法MaskRIS:用于改进指代表像分割任务的性能

    延世大学、NAVER AI LAB和韩国科学技术研究院的研究人员推出一种新的数据增强方法,名为MaskRIS(Masked Referring Image Segmentation),它用于改进指代表...
    新技术# MaskRIS
    1年前
    03220
    KREA AI 推出实时视频生成模型:让 AI 视频像绘画一样自然

    KREA AI 推出实时视频生成模型:让 AI 视频像绘画一样自然

    KREA AI 宣布开启其首个实时视频生成模型的测试通道。该模型支持 12+ fps 的生成速度,快于常规播放速度,能够在用户调整输入时提供即时反馈,同时保持帧间运动、身份与风格的高度一致性。 这意味...
    早报# Krea AI# 实时视频生成模型
    4个月前
    03210
    英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

    英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

    英伟达(NVIDIA)宣布与 OpenAI 深度合作,将后者最新发布的开放权重模型 gpt-oss-20b 和 gpt-oss-120b 带入消费级与专业级设备端,依托 GeForce RTX 与 R...
    早报# gpt-oss# OpenAI# 英伟达
    5个月前
    03210
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    PDF Craft

    新PDF Craft

    PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单