SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2252 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    个性化图像生成新方法InstantFamily:在零样本的情况下,根据多个身份标识(Multi-ID)生成个性化的图像

    个性化图像生成新方法InstantFamily:在零样本的情况下,根据多个身份标识(Multi-ID)生成个性化的图像

    韩国SK电信推出个性化图像生成新方法InstantFamily,它能够在零样本(zero-shot)的情况下,根据多个身份标识(Multi-ID)生成个性化的图像。这项技术特别适用于创建包含多个人物的...
    新技术# InstantFamily# 个性化图像生成
    2年前
    06000
    图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩

    图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩

    来自魏茨曼科学研究所和以色列理工学院的研究人员推出一种新颖的图像编辑技术Paint by Inpaint,它能够根据文本指令在图像中添加对象,而无需用户提供输入遮罩(mask)。这项技术的核心在于利用...
    新技术# Paint by Inpaint# 图像编辑
    2年前
    07510
    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    Adob​​e和康奈尔大学的研究人员推出新型3D重建模型GS-LRM(Gaussian Splatting Large Reconstruction Model),这个模型能够从少数几张2D图像中快速...
    新技术# 3D重建模型# GS-LRM
    2年前
    06030
    3D图像渲染技术SAGS:改进现有的3D图像渲染方法,以实现更高质量的图像渲染,同时减少所需的计算资源和存储空间

    3D图像渲染技术SAGS:改进现有的3D图像渲染方法,以实现更高质量的图像渲染,同时减少所需的计算资源和存储空间

    来自伦敦帝国理工学院和华为诺亚方舟实验室的研究人员推出新的3D图像渲染技术SAGS(Structure-Aware 3D Gaussian Splatting),这项技术旨在改进现有的3D图像渲染方法...
    新技术# 3D图像渲染# SAGS
    2年前
    08870
    英伟达推出VFC:用于生成高保真、详细图像和3D对象标题的强大工具

    英伟达推出VFC:用于生成高保真、详细图像和3D对象标题的强大工具

    英伟达推出VFC(Visual Fact Checker),它是一个用于生成高保真、详细图像和3D对象标题的强大工具。简单来说,VFC就像一个能够精确描述图片内容的智能助手,无论是2D的平面图像还是3...
    新技术# VFC
    2年前
    05580
    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    来自中国人民大学、清华大学和快手的研究人员推出新型3D生成算法MicroDreamer,它能够在大约20秒内生成高质量的3D模型,而无需任何3D数据。这项技术基于一种称为“基于分数的迭代重建”(Sco...
    新技术# 3D生成算法# MicroDreamer
    2年前
    07780
    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    牛津大学的研究人员推出一种新的3D场景生成技术Invisible Stitch,这项技术的目标是生成平滑且连贯的3D场景,特别是通过深度修复(depth inpainting)来改善场景的几何一致性...
    新技术# 3D场景生成# Invisible Stitch
    2年前
    05160
    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    来自清华大学和上海人工智能实验室的研究人员推出运动潜在一致性模型MotionLCM,它能够实时控制人体动作的生成。这个框架通过一种称为“潜在一致性模型”(Motion Latent Consisten...
    新技术# MotionLCM# 运动潜在一致性模型
    2年前
    06130
    新型框架Lightplane:用于处理3D神经场的高度可扩展的组件

    新型框架Lightplane:用于处理3D神经场的高度可扩展的组件

    密歇根大学和Meta的研究人员推出新型框架Lightplane,它包含两个高度可扩展的组件:Lightplane Renderer和Lightplane Splatter。这两个组件专门用于处理3D神...
    新技术# 3D场景模型# Lightplane# Lightplane Renderer
    2年前
    06590
    MaPa:根据文本描述为3D模型生成逼真的材质

    MaPa:根据文本描述为3D模型生成逼真的材质

    来自浙江大学、蚂蚁集团和深圳大学的研究人员推出MaPa,它能够根据文本描述为3D模型生成逼真的材质。与传统的纹理贴图不同,MaPa通过生成程序化的材质图(material graphs)来表示3D模型...
    新技术# 3D模型# MaPa
    2年前
    08530
    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先进模型PLLaVA(Pooling LLaVA),此模型的主要功能是能够理解视频中的内容,包括动作、场景、人物穿着等,并能够...
    新技术# PLLaVA# 视觉模型
    2年前
    05000
    通用反馈学习架构ID-Aligner:用于提升文本到图像生成任务中的身份保持性能

    通用反馈学习架构ID-Aligner:用于提升文本到图像生成任务中的身份保持性能

    来自中山大学和字节跳动的研究人员推出通用反馈学习架构ID-Aligner,它用于提升文本到图像生成(Text-to-Image Generation)任务中的身份保持(Identity-Preserv...
    新技术# ID-Aligner# 人物特征# 文生图
    2年前
    07830
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单