SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2604 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型图像到3D框架Unique3D:从单视图图像高效生成高质量的3D网格模型

    新型图像到3D框架Unique3D:从单视图图像高效生成高质量的3D网格模型

    清华大学和AVAR的研究人员推出新型图像到3D框架Unique3D,它能够从单视图图像高效生成高质量的3D网格模型。Unique3D的核心优势在于它能够在短时间内生成高保真度、细节丰富且具有强泛化能力...
    新技术# 3D网格模型# Unique3D
    2年前
    01,1400
    视频编辑方法I2VEdit:利用了图生视频模型,通过用户编辑视频的第一帧来引导整个视频的生成

    视频编辑方法I2VEdit:利用了图生视频模型,通过用户编辑视频的第一帧来引导整个视频的生成

    南洋理工大学、商汤科技和上海人工智能实验室的研究人员推出视频编辑方法I2VEdit,它利用了图像到视频的扩散模型,通过用户编辑视频的第一帧来引导整个视频的生成。这种方法的创新之处在于,它能够根据用户对...
    百科# I2VEdit# 视频编辑
    2年前
    01,1340
    新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置

    新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置

    清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉领域的一个重要任务,它的目的是识别出图像中的对象,并确定它们的位置。例如,你在玩一个视频游戏,需要快速识别并射击屏幕...
    新技术# YOLOv10# 清华大学# 目标检测
    2年前
    01,1340
    NovelAI Diffusion V4.5 完整版发布,图像质量全面提升

    NovelAI Diffusion V4.5 完整版发布,图像质量全面提升

    NovelAI 近日正式发布了NovelAI Diffusion V4.5 完整版模型(Full Version),将此前广受好评的 V4.5 Curated 版本中的增强功能带入完整模型中,进一步提...
    早报# NovelAI# NovelAI Diffusion V4.5
    10个月前
    01,1290
    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat,它能够在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重...
    新技术# 3D场景# InstantSplat
    2年前
    01,1210
    基于大语言模型的框架GenAgent:用于自动生成复杂的工作流程,以构建协作式人工智能系统

    基于大语言模型的框架GenAgent:用于自动生成复杂的工作流程,以构建协作式人工智能系统

    上海人工智能实验室推出一个基于大语言模型的框架GenAgent,用于自动生成复杂的工作流程,以构建协作式人工智能(AI)系统,相比单一的大型模型,GenAgent提供了更大的灵活性和可扩展性。这种系统...
    新技术# GenAgent
    2年前
    01,1070
    实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景

    实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景

    来自上海人工智能实验室、同济大学、中国科学技术大学和香港中文大学的研究团队推出Octree-GS(八叉树-高斯球体),这是一种用于实时渲染三维场景的方法,特别适用于处理大型和复杂场景。 项目主页 Gi...
    新技术# Octree-GS# 三维场景# 实时渲染
    2年前
    01,1050
    影眸科技推出新型大型3D生成模型CLAY:帮助人们将脑海中的创意轻松转化为精细的三维数字结构

    影眸科技推出新型大型3D生成模型CLAY:帮助人们将脑海中的创意轻松转化为精细的三维数字结构

    上海科技大学、影眸科技和华中科技大学的研究人员推出新型大型3D生成模型CLAY,它的主要任务是帮助人们将脑海中的创意轻松转化为精细的三维数字结构。就像孩子们用黏土塑造出各种形状的物体一样,CLAY能够...
    新技术# 3D生成模型# CLAY# 影眸科技
    2年前
    01,0980
    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    attribute-control:对文生图模型生成的图像中的特定属性进行精细控制

    来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...
    新技术# attribute-control# 文生图模型# 精细控制
    2年前
    01,0940
    基于人类与场景互动数据集Trumans开发的动作生成模型

    基于人类与场景互动数据集Trumans开发的动作生成模型

    来自北京大学人工智能研究院、BIGAI通用人工智能国家重点实验室、北京大学CFCS计算机学院和北京理工大学的研究团队创建一个详细的人类与场景互动数据集trumans,并开发出一种先进的动作生成模型,为...
    新技术# Trumans# 动作生成模型
    2年前
    01,0760
    大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力

    大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力

    腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能...
    新技术# DPG-Bench# ELLA# TSC
    2年前
    01,0670
    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...
    新技术# DiffIR2VR-Zero# 视频恢复
    2年前
    01,0650
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    RunningHub

    RunningHub

    RunningHub 是一个云平台,让用户轻松开发和分享 AI 应用。它特别适合那些希望通过浏览器直接操作的创作者,无需复杂的本地设置。平台基于 ComfyUI 工作流,提供强大的 GPU 云计算支持,确保高效任务执行。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    查看完整榜单