SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2252 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    字节跳动推出PuLID:用于个性化文本到图像的生成

    字节跳动推出PuLID:用于个性化文本到图像的生成

    字节跳动推出PuLID,它用于个性化文本到图像(Text-to-Image,简称T2I)的生成。PuLID的全称是“Pure and Lightning ID customization”,即纯粹和闪...
    新技术# PuLID# 个性化图像生成# 字节跳动
    2年前
    01,2410
    视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移

    视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移

    来自上海交通大学、腾讯优图实验室和哈尔滨工业大学的研究人员推出一个无需训练的视频运动迁移模型MotionMaster,它能够在不需要训练的情况下,实现视频中相机运动的转移。这意味着你可以将一个视频中的...
    新技术# MotionMaster# 视频运动迁移模型
    2年前
    05450
    图像编辑技术Editable Image Elements:允许用户对输入的图像进行空间编辑,同时保持图像内容的逼真度

    图像编辑技术Editable Image Elements:允许用户对输入的图像进行空间编辑,同时保持图像内容的逼真度

    来自加州大学圣地亚哥分校和Adob​​e 研究中心的研究人员推出新的图像编辑技术Editable Image Elements for Controllable Synthesis,它允许用户对输入的...
    新技术# Editable Image Elements# 图像编辑
    2年前
    06870
    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    来自马里兰大学和Adob​​e的研究人员推出新的图像和视频处理技术MaGGIe(Masked Guided Gradual Human Instance Matting),它用于实现人类图像的精确分割...
    新技术# MaGGIe# 图像分割# 抠图
    2年前
    05900
    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    苹果推出新颖的弱监督方法CatLIP(Categorical Loss for Image-text Pre-training),旨在提高图像和文本数据集上的视觉模型预训练效率,同时保持与现有的对比学...
    新技术# CatLIP# CLIP# 弱监督
    2年前
    07720
    混合数据专家MoDE:通过聚类方法来提升对比语言-图像预训练(CLIP)的性能

    混合数据专家MoDE:通过聚类方法来提升对比语言-图像预训练(CLIP)的性能

    来自Meta、哥伦比亚大学、纽约大学和华盛顿大学的研究人员推出机器学习系统MoDE(Mixture of Data Experts,混合数据专家),它通过聚类方法来提升对比语言-图像预训练(CLIP...
    新技术# CLIP# MoDE# 混合数据专家
    2年前
    06000
    ConsistentID:生成个性化人像图像时保持高度的面部身份(ID)一致性

    ConsistentID:生成个性化人像图像时保持高度的面部身份(ID)一致性

    来自 中山大学深圳校区、中山大学珠海校区、联想研究院和阿联酋起源人工智能研究院推出ConsistentID,它能够在生成个性化人像图像时保持高度的面部身份(ID)一致性。ConsistentID的核心...
    新技术# ConsistentID# 个性化人像
    2年前
    01,0830
    谷歌推出基于问答的自动评估指标Gecko,用于评估文生图模型的性能

    谷歌推出基于问答的自动评估指标Gecko,用于评估文生图模型的性能

    谷歌推出基于问答的自动评估指标Gecko2K,用于评估文生图模型的性能。文生图模型生成的图像并不总是能够完全符合文本中的所有细节。因此,评估这些模型生成的图像与文本描述的匹配程度是一个重要的研究问题...
    新技术# Gecko# Gecko2K# 自动评估
    2年前
    06610
    采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量

    采样调节器AlignYouSteps:优化采样步骤,从而提高生成图像的细节和质量

    英伟达、多伦多大学和矢量研究所的研究人员推出新的采样调节器AlignYouSteps(调整步伐),用于优化采样步骤,从而提高生成图像的细节和质量。这是一种通用且原则性的方法,用于优化扩散模型的采样计划...
    新技术# AlignYouSteps# 英伟达# 采样调节器
    2年前
    08780
    无需调整的高分辨率框架HiDiffusion:只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率

    无需调整的高分辨率框架HiDiffusion:只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率

    旷视科技与字节跳动的研究人员推出新型框架HiDiffusion,只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率。现有的扩散模型在生成超出训练时所...
    新技术# HiDiffusion# Stable Diffusion# 高分辨率框架
    2年前
    07510
    微软推出小型语言模型Phi-3系列:可在手机端运行的大模型

    微软推出小型语言模型Phi-3系列:可在手机端运行的大模型

    微软推出小型语言模型Phi-3系列,它在性能上可以与一些大型模型相媲美,如Mixtral 8x7B和GPT-3.5,但大小却足以部署在手机上。这项技术的创新之处在于其训练数据集,这是phi-2数据集的...
    新技术# Phi-3# 微软
    2年前
    05220
    虚拟服装试穿技术IDM-VTON:根据一个人的图片和一件衣服的图片,生成这个人穿上这件衣服的图像

    虚拟服装试穿技术IDM-VTON:根据一个人的图片和一件衣服的图片,生成这个人穿上这件衣服的图像

    来自韩国科学技术院和OMNIOUS.AI的研究人员推出虚拟服装试穿技术IDM-VTON,该技术能够根据分别描绘人物和服装的图像对,渲染出人物穿着精选服装的视觉效果。虚拟试穿是一种计算机视觉技术,它可以...
    新技术# IDM-VTON# 虚拟服装试穿# 虚拟试穿
    2年前
    07830
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单