SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    图像编辑框架FlexEdit:用于灵活且可控地编辑图像中的物体

    图像编辑框架FlexEdit:用于灵活且可控地编辑图像中的物体

    来自VinAI Research和越南科技大学的研究人员推出图像编辑框架FlexEdit,它是一个基于扩散模型(Stable Diffusion)的图像编辑框架,专门设计用于灵活且可控地编辑图像中的物...
    新技术# FlexEdit# 图像编辑框架
    2年前
    07920
    Garment3DGen:根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

    Garment3DGen:根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

    Meta推出Garment3DGen,它是一种自动化的方法,能够将基础的服装网格模型转换成可以直接用于模拟的资产,无论是通过图像还是文本提示。这个方法使得快速生成资产变得简单快捷,大大降低了原本需要专...
    新技术# 3D服装模型# Garment3DGen
    2年前
    07380
    图像风格化技术B-LoRA:将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理

    图像风格化技术B-LoRA:将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理

    来自特拉维夫大学和赖希曼大学的研究团队推出B-LoRA(Block Low-Rank Adaptation),它能够将单张图片中的风格和内容分离,从而实现高质量的图像风格化处理。图像风格化是指在保持图...
    新技术# B-LoRA# 图像风格化
    2年前
    05740
    轨迹条件文本到4D生成方法TC4D:根据文本描述和一条轨迹生成动态的三维场景

    轨迹条件文本到4D生成方法TC4D:根据文本描述和一条轨迹生成动态的三维场景

    来自多伦多大学、Vector Institute、Snap、香港中文大学、斯坦福大学、香港大学、密歇根大学和 Google DeepMind的研究团队推出轨迹条件文本到4D生成方法TC4D(Traje...
    新技术# 4D# TC4D# 三维场景
    2年前
    07120
    腾讯推出创新框架AniPortrait:根据音频和一张参考肖像图片生成高质量的动画

    腾讯推出创新框架AniPortrait:根据音频和一张参考肖像图片生成高质量的动画

    腾讯推出创新框架AniPortrait,它可以根据音频和一张参考肖像图片生成高质量的动画。这个系统可以捕捉到音频中的微妙表情和唇部动作,并将这些动作应用到一个静态的肖像图片上,从而创建出看起来像是在说...
    新技术# AniPortrait
    2年前
    06420
    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I,它旨在通过优化文本提示(prompt)来提高文本到图像(T2I)生成模型的图像与输入提示的一致性。尽管现有的T2I模型能够生成高质量和逼真的图像,但它们在确保生成的图像...
    新技术# OPT2I# 提示词# 文生图模型
    2年前
    07610
    基于两阶段高斯溅射的3D模型DreamPolisher:基于文本描述生成三维(3D)对象

    基于两阶段高斯溅射的3D模型DreamPolisher:基于文本描述生成三维(3D)对象

    来自牛津大学的研究人员推出DreamPolisher,它是一种基于文本描述生成三维(3D)对象的方法。这是一种基于两阶段高斯溅射的方法,该方法强制各视图之间的几何一致性。首先,通过几何优化对粗略的3D...
    新技术# 3D模型# DreamPolisher
    2年前
    07170
    实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景

    实时渲染技术Octree-GS:用于实时渲染三维场景,特别适用于处理大型和复杂场景

    来自上海人工智能实验室、同济大学、中国科学技术大学和香港中文大学的研究团队推出Octree-GS(八叉树-高斯球体),这是一种用于实时渲染三维场景的方法,特别适用于处理大型和复杂场景。 项目主页 Gi...
    新技术# Octree-GS# 三维场景# 实时渲染
    2年前
    01,0890
    2DGS:从多视角图像重建和渲染三维场景

    2DGS:从多视角图像重建和渲染三维场景

    来自上海科技大学和图宾根大学的研究团队推出2D Gaussian Splatting(2DGS),它是一种用于从多视角图像重建和渲染三维场景的方法。 项目主页 论文 2DGS的核心思想是将3D体积简化...
    新技术# 2DGS# 3D模型# 三维场景
    2年前
    01,6610
    FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片

    FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片

    来自香港大学、阿里和蚂蚁的研究团队推出FlashFace,它允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片。 项目主页:https://jshilong.github.io/fla...
    新技术# FlashFace# 个性化
    2年前
    06010
    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    来自特拉维夫大学和Snap的研究人员推出Bounded Attention,它旨在解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战。这些模型通常难以准确地捕捉到复杂输入提示中的意...
    新技术# Bounded Attention# 多主题# 文生图模型
    2年前
    05820
    新型图像到视频扩散模型TRIP:专注于将静态图像转换为动态视频

    新型图像到视频扩散模型TRIP:专注于将静态图像转换为动态视频

    来自中国科学技术大学和HiDream.ai的研究人员推出新型图像到视频扩散模型TRIP(Temporal Residual Learning with Image noise Prior),它专注于将...
    新技术# TRIP# 图生视频
    2年前
    06120
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单