SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...
    新技术# controlnet# IC-Light# 打光
    2年前
    09150
    新型图像上采样模型Inf-DiT:高效地对任何分辨率的图像进行上采样,即提高图像的分辨率而不失细节

    新型图像上采样模型Inf-DiT:高效地对任何分辨率的图像进行上采样,即提高图像的分辨率而不失细节

    清华大学与智谱AI的研究人员推出新型图像上采样模型Inf-DiT,它能够高效地对任何分辨率的图像进行上采样,即提高图像的分辨率而不失细节。在图像处理领域,上采样是一个重要的技术,它可以用于放大图像而不...
    新技术# Inf-DiT# 图像上采样模型
    2年前
    01,2240
    谷歌推出新框架ImageInWords(IIW):创建准确且细节丰富的图像描述,以提高视觉-语言模型的训练效果

    谷歌推出新框架ImageInWords(IIW):创建准确且细节丰富的图像描述,以提高视觉-语言模型的训练效果

    Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords(IIW),此框架旨在创建准确且细节丰富的图像描述,以提高视觉-语言模型(VLMs...
    新技术# IIW# ImageInWords# 数据集
    2年前
    06960
    新型视觉模型EfficientViT:专门用于高分辨率的密集预测任务

    新型视觉模型EfficientViT:专门用于高分辨率的密集预测任务

    来自MIT、浙江大学、清华大学、MIT-IBM Watson AI实验室的研究人员推出新型视觉模型EfficientViT,它专门用于高分辨率的密集预测任务。这类任务在计算机视觉领域非常重要,应用范围...
    新技术# EfficientViT# 视觉模型
    2年前
    06480
    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要...
    新技术# StoryDiffusion# 图像生成# 视频生成
    2年前
    07970
    文生图定制模型Pair Customization:从单一图像对中学习风格差异,并随后将习得的风格应用于生成过程中

    文生图定制模型Pair Customization:从单一图像对中学习风格差异,并随后将习得的风格应用于生成过程中

    来自卡内基梅隆大学和东北大学的研究人员推出新定制方法Pair Customization,该方法从单一图像对中学习风格差异,并随后将习得的风格应用于生成过程中。这是一款使用一对图像(一个原始图像和一个...
    新技术# Pair Customization# 文生图定制模型
    2年前
    05850
    3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装

    3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装

    上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode,它能够根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...
    新技术# 3D服装生成# DressCode
    2年前
    09160
    个性化图像生成新方法InstantFamily:在零样本的情况下,根据多个身份标识(Multi-ID)生成个性化的图像

    个性化图像生成新方法InstantFamily:在零样本的情况下,根据多个身份标识(Multi-ID)生成个性化的图像

    韩国SK电信推出个性化图像生成新方法InstantFamily,它能够在零样本(zero-shot)的情况下,根据多个身份标识(Multi-ID)生成个性化的图像。这项技术特别适用于创建包含多个人物的...
    新技术# InstantFamily# 个性化图像生成
    2年前
    06010
    图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩

    图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩

    来自魏茨曼科学研究所和以色列理工学院的研究人员推出一种新颖的图像编辑技术Paint by Inpaint,它能够根据文本指令在图像中添加对象,而无需用户提供输入遮罩(mask)。这项技术的核心在于利用...
    新技术# Paint by Inpaint# 图像编辑
    2年前
    07530
    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    Adob​​e和康奈尔大学的研究人员推出新型3D重建模型GS-LRM(Gaussian Splatting Large Reconstruction Model),这个模型能够从少数几张2D图像中快速...
    新技术# 3D重建模型# GS-LRM
    2年前
    06050
    3D图像渲染技术SAGS:改进现有的3D图像渲染方法,以实现更高质量的图像渲染,同时减少所需的计算资源和存储空间

    3D图像渲染技术SAGS:改进现有的3D图像渲染方法,以实现更高质量的图像渲染,同时减少所需的计算资源和存储空间

    来自伦敦帝国理工学院和华为诺亚方舟实验室的研究人员推出新的3D图像渲染技术SAGS(Structure-Aware 3D Gaussian Splatting),这项技术旨在改进现有的3D图像渲染方法...
    新技术# 3D图像渲染# SAGS
    2年前
    09160
    英伟达推出VFC:用于生成高保真、详细图像和3D对象标题的强大工具

    英伟达推出VFC:用于生成高保真、详细图像和3D对象标题的强大工具

    英伟达推出VFC(Visual Fact Checker),它是一个用于生成高保真、详细图像和3D对象标题的强大工具。简单来说,VFC就像一个能够精确描述图片内容的智能助手,无论是2D的平面图像还是3...
    新技术# VFC
    2年前
    05620
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Zoom Earth

    Zoom Earth

    ZoomEarth是交互式世界天气图。通过雨量,风力,温度,压力等的交互式地图探索当前天气并查看您所在位置的天气预报。通过ZoomEarth,您可以跟踪台风和风暴的发展、监测野火和烟雾,并通过查看近乎实时更新的卫星图像来了解最新情况。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单