SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容

    高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容

    腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion,依据任意运动指令生成高质感、任意长度的视频内容。简单来说,MimicMotion是一个可以制作出逼真人类动作视频的智能...
    新技术# MimicMotion# 视频生成
    2年前
    07730
    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...
    新技术# DiffIR2VR-Zero# 视频恢复
    2年前
    09810
    新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务

    新型图像分割模型EVF-SAM:利用多模态提示(即图像和文本),结合视觉-语言模型来生成指代提示,并借助SAM模型完成分割任务

    华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM,EVF-SAM的核心特点是它能够理解文本提示,并根据这些提示对图像中的对象进行精确分割。这项技术对于那些需要根据用户描...
    新技术# EVF-SAM# 图像分割模型
    2年前
    01,1370
    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    北京大学、腾讯PCG ARC实验室、南洋理工大学、 清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor,它是一种用于视频合成的交互式工具,能够让用户对视频内容中的相机运...
    新技术# Image Conductor# 视频合成
    2年前
    07810
    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    南洋理工大学、 香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj,它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之,FreeTraj允许用户在生成视频时精确控制视频中对...
    新技术# FreeTraj# 轨迹控制
    2年前
    04830
    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    创新框架MotionBooth:生成具有定制主体和可控主体及摄像机运动的动画视频

    北京大学、南洋理工大学、上海人工智能实验室、浙江大学和上海交通大学的研究人员推出创新框架MotionBooth,它专门用于生成具有定制主体和可控主体及摄像机运动的动画视频。简单来说,MotionBoo...
    新技术# MotionBooth
    2年前
    08710
    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO,它用于改善文本到图像的扩散模型(Diffusion Models),使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型,它们通过逐步去...
    新技术# NCPPO# 人类偏好# 文生图模型
    2年前
    05690
    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2:创建出逼真的4D头部头像

    小冰推出Portrait4D-v2,它能够创建出逼真的4D头部头像。4D头像不仅具有三维的立体形状,还能随着时间变化而展示出不同的面部表情和头部动作,就像活生生的人一样。这项技术的应用前景非常广泛,比...
    新技术# 4D头部头像# Portrait4D-v2
    2年前
    08620
    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    来自萨特希尔风险投资公司的研究人员推出新型多模态图像生成系统MUMU,MUMU的核心能力是从文本和图像混合提示(multimodal prompts)生成图像。简单来说,用户可以提供一些文本描述和参考...
    新技术# MUMU# 多模态图像生成
    2年前
    05170
    分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容

    分布式长视频生成框架Video-Infinity:能够利用多个GPU并行工作,快速生成长时间的视频内容

    新加坡国立大学的研究人员推出Video-Infinity系统,它是一个分布式的长视频生成框架。简单来说,Video-Infinity能够利用多个GPU(显卡)并行工作,快速生成长时间的视频内容。这对于...
    新技术# Video-Infinity# 长视频生成框架
    2年前
    05450
    图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成

    图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成

    清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++,它是一个与人类偏好对齐的自动化评估系统,专门用于个性化图像生成。简单来说...
    新技术# DREAMBENCH++# 图像生成评估基准
    2年前
    05210
    大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词

    大型文本到图像提示数据集StyleBreeder:包含680万张图片及180万个提示词

    弗吉尼亚理工大学、苏黎世联邦理工学院、慕尼黑工业大学、谷歌和Artbreeder的研究人员推出大型文本到图像提示数据集StyleBreeder,它通过使用文本到图像的生成模型,探索和推广了艺术风格的多...
    新技术# StyleBreeder# 文生图提示数据集
    2年前
    05380
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    互联网大厂模拟器

    互联网大厂模拟器

    《互联网大厂模拟器》或许不会改变现实,但它提供了一个出口:在虚拟世界里,我们可以安全地体验“另一种职场人生”,然后笑着关掉页面,继续面对明天的站会。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单