SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2230 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...
    新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导
    9个月前
    03890
    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像

    Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...
    新技术# IMM# Luma AI# 图像生成模型
    9个月前
    03890
    micro_diffusion :一种低成本训练文生图模型的方法

    micro_diffusion :一种低成本训练文生图模型的方法

    索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe...
    新技术# micro_diffusion# 文生图模型
    11个月前
    03890
    Anthropic CEO:2027 年前打开 AI 模型的“黑箱”,推动行业安全与可解释性发展

    Anthropic CEO:2027 年前打开 AI 模型的“黑箱”,推动行业安全与可解释性发展

    Anthropic 首席执行官达里奥·阿莫迪(Dario Amodei)周四发表了一篇文章,强调了当前对世界领先 AI 模型内部运作方式理解的局限性,并为 Anthropic 设定了一个雄心勃勃的目标...
    早报# Anthropic# Dario Amodei# 达里奥·阿莫迪
    8个月前
    03880
    美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新

    美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新

    美国国家科学基金会(NSF)与英伟达(NVIDIA)近日宣布达成一项重要合作,共同投资 1.52 亿美元,支持由 Allen 人工智能研究所(Ai2) 牵头的“开放多模态 AI 基础设施加速科学”(O...
    早报# Ai2# 美国国家科学基金会# 艾伦AI研究所
    4个月前
    03860
    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(MobileVD),该模型的目标是在保持生成视频的质量和控制力的同时,显著降低计算需求,使得在移动设备...
    新技术# MobileVD# 视频生成模型
    1年前
    03860
    Meta推出创新方案AdaCache(自适应缓存):不进行额外训练的情况下加速视频生成

    Meta推出创新方案AdaCache(自适应缓存):不进行额外训练的情况下加速视频生成

    视频生成是AI研究的一个热点领域,特别是在生成时间上一致、高保真的视频方面。这一领域涉及创建在帧之间保持视觉连贯性并在时间上保留细节的视频序列。近年来,机器学习模型,尤其是扩散变换器(DiTs),已成...
    新技术# AdaCache# Meta AI# 自适应缓存
    1年前
    03860
    新型视频生成模型家族MarDini:通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法

    新型视频生成模型家族MarDini:通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法

    Meta AI与阿卜杜拉国王科技大学的研究人员推出了一种新型视频生成模型家族——MarDini。这一模型家族通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法。Mar...
    新技术# MarDini# 视频生成模型
    1年前
    03860
    NotebookLM 新功能:自定义音频概述长度,满足多样化收听需求

    NotebookLM 新功能:自定义音频概述长度,满足多样化收听需求

    谷歌正在为 NotebookLM 开发一项新功能,允许用户自定义音频概述的长度。这一更新将为用户提供更大的灵活性,使其能够根据不同的使用场景调整音频内容的深度和时长。结合 NotebookLM 的现有...
    早报# NotebookLM
    8个月前
    03850
    Opera 推出 AI 浏览器操作员(Browser Operator),助力高效浏览体验

    Opera 推出 AI 浏览器操作员(Browser Operator),助力高效浏览体验

    Opera推出了一项创新功能——AI 浏览器操作员(Browser Operator)。这款原生 AI 代理通过将 AI 技术直接集成到浏览器中,帮助用户更高效地完成各种在线任务,例如购物、预订航班或...
    早报# Browser Operator# Opera# 浏览器操作员
    10个月前
    03850
    GS^3:从多视角点光源输入图像中实时合成高质量的新光照和视图

    GS^3:从多视角点光源输入图像中实时合成高质量的新光照和视图

    浙江大学CAD与CG国家重点实验室推出一种新技术,用于从多视角点光源输入图像中实时合成高质量的新光照和视图。他们的方法称为 GS^3,使用基于空间和角度的高斯表示,并结合三重 splatting 过程...
    新技术# GS^3# 多视角点光源
    1年前
    03850
    xAI 的 Grok 聊天机器人升级:开启视觉功能,拓展交互体验

    xAI 的 Grok 聊天机器人升级:开启视觉功能,拓展交互体验

    xAI 的 Grok 聊天机器人近日迎来了重大更新,新增的 Grok Vision 功能让机器人能够“看到”并理解用户智能手机摄像头所捕捉到的内容,进一步拓展了其交互能力。 Grok Vision:视...
    早报# Grok# Grok Vision# xAI
    8个月前
    03840
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    OpenSkills

    OpenSkills

    OpenSkills 是 Anthropic的 Claude Skills 系统的开源实现。它让 Cursor、Windsurf、Aider 等主流 AI 编码代理也能使用与 Claude Code 完全兼容的技能系统——相同的提示格式、相同的文件结构、相同的渐进式披露机制,只是调用方式从内置工具变为 CLI 命令。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    查看完整榜单