SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...
    新技术# E2GAN# 生成对抗网络(GAN)模型
    1年前
    04830
    新型框架Cavia:生成具有相机控制功能的多视角视频

    新型框架Cavia:生成具有相机控制功能的多视角视频

    德克萨斯大学奥斯汀分校、苹果和谷歌的研究人员推出新型框架Cavia,它能够生成具有相机控制功能的多视角视频。简单来说,Cavia可以根据一张图片和一些相机运动的指令,生成一系列从不同角度和时间点观察的...
    新技术# Cavia
    1年前
    04820
    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    新型框架FreeTraj:在视频扩散模型中实现无需调整参数的轨迹控制

    南洋理工大学、 香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj,它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之,FreeTraj允许用户在生成视频时精确控制视频中对...
    新技术# FreeTraj# 轨迹控制
    1年前
    04820
    CleanDIFT:从大规模预训练的扩散模型中提取无噪声、与时间步无关的通用特征表示

    CleanDIFT:从大规模预训练的扩散模型中提取无噪声、与时间步无关的通用特征表示

    慕尼黑大学的研究人员推出一种名为CleanDIFT的新方法,用于从大规模预训练的扩散模型中提取无噪声、与时间步无关的通用特征表示。这种方法特别针对的是,以往在使用扩散模型提取特征时需要向图像添加噪声...
    新技术# CleanDIFT
    1年前
    04810
    多功能图像到图像视觉助手PixWizard:根据自由形式的语言指令执行图像生成、编辑和转换

    多功能图像到图像视觉助手PixWizard:根据自由形式的语言指令执行图像生成、编辑和转换

    香港中文大学MMLab、北京大学和上海人工智能实验室的研究人员推出一种多功能的图像到图像视觉助手 PixWizard,它可以根据自由形式的语言指令执行图像生成、编辑和转换。简单来说,PixWizard...
    新技术# PixWizard
    1年前
    04810
    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...
    新技术# TrackGo# 视频生成
    1年前
    04800
    基于物理的交互式3D对象动态生成方法PhysDreamer:利用视频生成技术实现与3D物体进行物理交互

    基于物理的交互式3D对象动态生成方法PhysDreamer:利用视频生成技术实现与3D物体进行物理交互

    来自麻省理工学院、斯坦福大学、 哥伦比亚大学和康奈尔大学的研究人员推出PhysDreamer系统,这是一个基于物理的交互式3D对象动态生成方法。PhysDreamer能够使静态的3D对象通过视频生成模...
    新技术# 3D对象# PhysDreamer
    2年前
    04780
    微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔

    微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔

    微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具有吸引力的视觉情感技能(VAS)的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...
    新技术# VASA-1
    2年前
    04780
    Grok上线Grok Studio 功能:可编辑创建文档、代码、报告等

    Grok上线Grok Studio 功能:可编辑创建文档、代码、报告等

    今天(4月16日),Grok官方账号宣布推出了全新的Grok Studio功能,这是一款类似于OpenAI的Canvas工具,支持用户编辑和创建文档及基础应用程序。这一新功能为用户提供了更强大的创作能...
    早报# Grok# Grok Studio# xAI
    8个月前
    04760
    FSC-CLIP:提升预训练视觉和语言模型(VLMs)在理解图像和文字组合任务上的能力,同时保持在多模态任务上的性能

    FSC-CLIP:提升预训练视觉和语言模型(VLMs)在理解图像和文字组合任务上的能力,同时保持在多模态任务上的性能

    韩国科学技术院、世宗大学和汉阳大学的研究人员推出FSC-CLIP,提升预训练视觉和语言模型(VLMs)在理解图像和文字组合任务上的能力,同时保持在多模态任务上的性能。简单来说,就是让计算机能够更好地理...
    新技术# FSC-CLIP# 多模态
    1年前
    04760
    无需训练的个性化定制RectifID:根据用户提供的参考图像定制化地生成新图像,同时保留原始图像中的身份特征

    无需训练的个性化定制RectifID:根据用户提供的参考图像定制化地生成新图像,同时保留原始图像中的身份特征

    来自北京大学、快手、电子科技大学和浙江大学的研究人员推出新型图像生成技术RectifID,它能够根据用户提供的参考图像定制化地生成新图像,同时保留原始图像中的身份特征。简单来说,这项技术可以帮助我们在...
    新技术# RectifID# 个性化定制
    2年前
    04750
    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    特拉维夫大学的研究人员推出一种流行的基于文本的编辑框架TurboEdit,它能够使用极少的几步就能基于文本指令编辑真实图片。这种技术利用了所谓的“扩散模型”(diffusion models),这是一...
    新技术# TurboEdit# 图像编辑# 编辑框架
    1年前
    04730
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    微舆(BettaFish)

    新微舆(BettaFish)

    “微舆” 是一个从0实现的创新型 多智能体 舆情分析系统,帮助大家破除信息茧房,还原舆情原貌,预测未来走向,辅助决策。用户只需像聊天一样提出分析需求,智能体开始全自动分析 国内外30+主流社媒 与 数百万条大众评论。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    CyberCut

    CyberCut

    CyberCut 并非追求“一键出爆款”,而是通过 AI 将重复性剪辑工作自动化,让创作者更专注于内容本身。其文本驱动、自动规划、高精度字幕等能力,为短视频生产提供了一条高效、可控、低门槛的新路径。
    查看完整榜单