SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2252 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...
    新技术# DiffIR2VR-Zero# 视频恢复
    2年前
    09440
    新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务

    新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务

    华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM,EVF-SAM的核心特点是它能够理解文本提示,并根据这些提示对图像中的对象进行精确分割。这项技术对于那些需要根据用户描...
    新技术# EVF-SAM# 图像分割模型
    2年前
    01,1110
    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    北京大学、腾讯PCG ARC实验室、南洋理工大学、 清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor,它是一种用于视频合成的交互式工具,能够让用户对视频内容中的相机运...
    新技术# Image Conductor# 视频合成
    2年前
    07760
    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    南洋理工大学、 香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj,它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之,FreeTraj允许用户在生成视频时精确控制视频中对...
    新技术# FreeTraj# 轨迹控制
    2年前
    04830
    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    北京大学、南洋理工大学、上海人工智能实验室、浙江大学和上海交通大学的研究人员推出创新框架MotionBooth,它专门用于生成具有定制主体和可控主体及摄像机运动的动画视频。简单来说,MotionBoo...
    新技术# MotionBooth
    2年前
    08630
    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO,它用于改善文本到图像的扩散模型(Diffusion Models),使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型,它们通过逐步去...
    新技术# NCPPO# 人类偏好# 文生图模型
    2年前
    05660
    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2,它能够创建出逼真的4D头部头像。4D头像不仅具有三维的立体形状,还能随着时间变化而展示出不同的面部表情和头部动作,就像活生生的人一样。这项技术的应用前景非常广泛,比...
    新技术# 4D头部头像# Portrait4D-v2
    2年前
    08490
    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    来自萨特希尔风险投资公司的研究人员推出新型多模态图像生成系统MUMU,MUMU的核心能力是从文本和图像混合提示(multimodal prompts)生成图像。简单来说,用户可以提供一些文本描述和参考...
    新技术# MUMU# 多模态图像生成
    2年前
    05150
    Stability AI获得新的投资,并任命Prem Akkaraju为新CEO

    Stability AI获得新的投资,并任命Prem Akkaraju为新CEO

    Stability AI已经正式公布了来自一组新投资者的重大资金投入。该公司已任命Prem Akkaraju为首席执行官,并由Sean Parker出任执行主席。这一举措旨在加速Stability A...
    早报# Prem Akkaraju# Stability AI
    2年前
    09970
    分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容

    分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容

    新加坡国立大学的研究人员推出Video-Infinity系统,它是一个分布式的长视频生成框架。简单来说,Video-Infinity能够利用多个GPU(显卡)并行工作,快速生成长时间的视频内容。这对于...
    新技术# Video-Infinity# 长视频生成框架
    2年前
    05450
    图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成

    图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成

    清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++,它是一个与人类偏好对齐的自动化评估系统,专门用于个性化图像生成。简单来说...
    新技术# DREAMBENCH++# 图像生成评估基准
    2年前
    05210
    大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词

    大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词

    弗吉尼亚理工大学、苏黎世联邦理工学院、慕尼黑工业大学、谷歌和Artbreeder的研究人员推出大型文本到图像提示数据集StyleBreeder,它通过使用文本到图像的生成模型,探索和推广了艺术风格的多...
    新技术# StyleBreeder# 文生图提示数据集
    2年前
    05370
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单