SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    来自中国人民大学、清华大学和快手的研究人员推出新型3D生成算法MicroDreamer,它能够在大约20秒内生成高质量的3D模型,而无需任何3D数据。这项技术基于一种称为“基于分数的迭代重建”(Sco...
    新技术# 3D生成算法# MicroDreamer
    2年前
    07830
    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    牛津大学的研究人员推出一种新的3D场景生成技术Invisible Stitch,这项技术的目标是生成平滑且连贯的3D场景,特别是通过深度修复(depth inpainting)来改善场景的几何一致性...
    新技术# 3D场景生成# Invisible Stitch
    2年前
    05180
    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    来自清华大学和上海人工智能实验室的研究人员推出运动潜在一致性模型MotionLCM,它能够实时控制人体动作的生成。这个框架通过一种称为“潜在一致性模型”(Motion Latent Consisten...
    新技术# MotionLCM# 运动潜在一致性模型
    2年前
    06150
    新型框架Lightplane:用于处理3D神经场的高度可扩展的组件

    新型框架Lightplane:用于处理3D神经场的高度可扩展的组件

    密歇根大学和Meta的研究人员推出新型框架Lightplane,它包含两个高度可扩展的组件:Lightplane Renderer和Lightplane Splatter。这两个组件专门用于处理3D神...
    新技术# 3D场景模型# Lightplane# Lightplane Renderer
    2年前
    06610
    MaPa:根据文本描述为3D模型生成逼真的材质

    MaPa:根据文本描述为3D模型生成逼真的材质

    来自浙江大学、蚂蚁集团和深圳大学的研究人员推出MaPa,它能够根据文本描述为3D模型生成逼真的材质。与传统的纹理贴图不同,MaPa通过生成程序化的材质图(material graphs)来表示3D模型...
    新技术# 3D模型# MaPa
    2年前
    08560
    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先进模型PLLaVA(Pooling LLaVA),此模型的主要功能是能够理解视频中的内容,包括动作、场景、人物穿着等,并能够...
    新技术# PLLaVA# 视觉模型
    2年前
    05010
    通用反馈学习架构ID-Aligner:用于提升文本到图像生成任务中的身份保持性能

    通用反馈学习架构ID-Aligner:用于提升文本到图像生成任务中的身份保持性能

    来自中山大学和字节跳动的研究人员推出通用反馈学习架构ID-Aligner,它用于提升文本到图像生成(Text-to-Image Generation)任务中的身份保持(Identity-Preserv...
    新技术# ID-Aligner# 人物特征# 文生图
    2年前
    07970
    字节跳动推出PuLID:用于个性化文本到图像的生成

    字节跳动推出PuLID:用于个性化文本到图像的生成

    字节跳动推出PuLID,它用于个性化文本到图像(Text-to-Image,简称T2I)的生成。PuLID的全称是“Pure and Lightning ID customization”,即纯粹和闪...
    新技术# PuLID# 个性化图像生成# 字节跳动
    2年前
    01,2710
    视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移

    视频运动迁移模型MotionMaster:在不需要训练的情况下,实现视频中相机运动的转移

    来自上海交通大学、腾讯优图实验室和哈尔滨工业大学的研究人员推出一个无需训练的视频运动迁移模型MotionMaster,它能够在不需要训练的情况下,实现视频中相机运动的转移。这意味着你可以将一个视频中的...
    新技术# MotionMaster# 视频运动迁移模型
    2年前
    05450
    图像编辑技术Editable Image Elements:允许用户对输入的图像进行空间编辑,同时保持图像内容的逼真度

    图像编辑技术Editable Image Elements:允许用户对输入的图像进行空间编辑,同时保持图像内容的逼真度

    来自加州大学圣地亚哥分校和Adob​​e 研究中心的研究人员推出新的图像编辑技术Editable Image Elements for Controllable Synthesis,它允许用户对输入的...
    新技术# Editable Image Elements# 图像编辑
    2年前
    06890
    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    来自马里兰大学和Adob​​e的研究人员推出新的图像和视频处理技术MaGGIe(Masked Guided Gradual Human Instance Matting),它用于实现人类图像的精确分割...
    新技术# MaGGIe# 图像分割# 抠图
    2年前
    05920
    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    苹果推出新颖的弱监督方法CatLIP(Categorical Loss for Image-text Pre-training),旨在提高图像和文本数据集上的视觉模型预训练效率,同时保持与现有的对比学...
    新技术# CatLIP# CLIP# 弱监督
    2年前
    07790
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Zoom Earth

    Zoom Earth

    ZoomEarth是交互式世界天气图。通过雨量,风力,温度,压力等的交互式地图探索当前天气并查看您所在位置的天气预报。通过ZoomEarth,您可以跟踪台风和风暴的发展、监测野火和烟雾,并通过查看近乎实时更新的卫星图像来了解最新情况。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    查看完整榜单