SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2206 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频生成框架ConFiner:结合多个专家模型的能力,以一种高效且无需训练的方式,生成高质量且连贯的视频内容

    新型视频生成框架ConFiner:结合多个专家模型的能力,以一种高效且无需训练的方式,生成高质量且连贯的视频内容

    悉尼大学、东南大学、中南大学、上海交通大学、商汤科技研究院和香港科技大学的研究人员推出新型视频生成框架ConFiner,它通过一系列现成的扩散模型专家(diffusion model experts...
    新技术# ConFiner# 视频生成
    1年前
    08050
    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    北京大学、南洋理工大学、上海人工智能实验室、浙江大学和上海交通大学的研究人员推出创新框架MotionBooth,它专门用于生成具有定制主体和可控主体及摄像机运动的动画视频。简单来说,MotionBoo...
    新技术# MotionBooth
    1年前
    08030
    xAI 即将推出 Grok 系列重大更新:Grok 3.5、语音视觉功能与更多新特性

    xAI 即将推出 Grok 系列重大更新:Grok 3.5、语音视觉功能与更多新特性

    埃隆·马斯克旗下的 xAI 正在为其 Grok 系列产品准备一系列令人期待的更新,涵盖模型性能提升、新功能开发以及用户体验优化。这些更新不仅展示了 xAI 在人工智能领域的持续投入,也进一步缩小了 G...
    早报# Grok# Grok 3.5# xAI
    8个月前
    08020
    新型图像超分辨率技术S3Diff:让模糊的低分辨率图片变清晰

    新型图像超分辨率技术S3Diff:让模糊的低分辨率图片变清晰

    中山大学深圳校区网络科学与技术学院、南洋理工大学S实验室和华为诺亚方舟实验室的研究人员推出新型图像超分辨率技术S3Diff ,简单来说,这是一种能让模糊的低分辨率图片变清晰的方法。研究团队引入了一种新...
    新技术# S3Diff# 图像超分辨率
    1年前
    08010
    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测...
    新技术# Qwen-VL-Max# Qwen-VL-Plus# 视觉理解模型
    2年前
    08010
    先进的视频深度估计方法ChronoDepth:通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性

    先进的视频深度估计方法ChronoDepth:通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性

    浙江大学、博洛尼亚大学、蚂蚁集团和Rock Universe的研究人员推出一种先进的视频深度估计方法ChronoDepth,它通过结合视频生成模型的先验知识,有效地提高了深度估计的准确性和时间一致性...
    新技术# ChronoDepth# 视频深度
    2年前
    08000
    文生图模型GLIGEN:用于将Stable Diffusion模型扩展为可定制模型

    文生图模型GLIGEN:用于将Stable Diffusion模型扩展为可定制模型

    威斯康星大学麦迪逊分校、哥伦比亚大学和微软的研究人员推出的GLIGEN模型,用于将Stable Diffusion模型扩展为可定制的模型。这个模型的核心目标是让计算机能够根据文本描述生成图像,并且能够...
    新技术# GLIGEN# Stable Diffusion# 文生图模型
    2年前
    08000
    微调模型TCD:提高图像生成的速度和质量

    微调模型TCD:提高图像生成的速度和质量

    来自华南理工、南洋理工、北理工和悉尼大学的研究人员推出TCD(Trajectory Consistency Distillation),这是一种用于加速文生图模型图像生成的微调模型。TCD的目标是提高...
    新技术# TCD# 微调模型
    2年前
    07970
    英伟达推出Autoguidance:改进图像生成扩散模型的性能

    英伟达推出Autoguidance:改进图像生成扩散模型的性能

    英伟达和阿尔托大学的研究人员推出Autoguidance,改进图像生成扩散模型的性能,特别是通过一种新颖的方法来控制图像质量、结果的变化性以及与给定条件(如类别标签或文本提示)的一致性。扩散模型是一种...
    新技术# Autoguidance# 英伟达
    2年前
    07960
    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要...
    新技术# StoryDiffusion# 图像生成# 视频生成
    2年前
    07930
    Meta推出多模态基础模型家族Chameleon:专为理解和生成图像与文本而设计

    Meta推出多模态基础模型家族Chameleon:专为理解和生成图像与文本而设计

    Meta推出多模态基础模型家族Chameleon,它们是专为理解和生成图像与文本而设计,多模态意味着这些模型能够同时处理多种类型的数据,比如图片和文字。例如,你给Chameleon一个描述或者一张图片...
    新技术# Chameleon# Meta# 多模态基础模型
    2年前
    07920
    基于SAM的新型视觉模型Open-Vocabulary SAM:交互式的图像分割和识别

    基于SAM的新型视觉模型Open-Vocabulary SAM:交互式的图像分割和识别

    来自南洋理工大学、上海AI实验室的研究人员推出了一款基于SAM的新型视觉模型Open-Vocabulary SAM,它结合了Segment Anything Model(SAM)和CLIP模型的优势...
    新技术# Open-Vocabulary SAM# SAM# 图像分割
    2年前
    07920
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    DeepAnalyze

    DeepAnalyze

    DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单