SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 959 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    SynthLight:基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明

    SynthLight:基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明

    在数字影像处理领域,耶鲁大学和Adobe研究中心联合推出了一项创新技术——SynthLight。这项技术基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明,从而达到令人惊叹的视觉效果。该方法...
    新技术# SynthLight
    1年前
    02290
    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    阿里巴巴通义实验室推出一个用于文本到图像生成的统一单主体和多主体个性化框架AnyStory,旨在生成具有特定主体的高保真个性化图像,无论是单个主体还是多个主体,都能在不牺牲主体保真度的情况下实现个性化...
    新技术# AnyStory
    1年前
    02190
    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    哈尔滨工业大学和华为诺亚方舟实验室的研究人员推出交互式图像编辑工具FramePainter,它利用视频扩散先验(video diffusion priors)来增强图像编辑的能力。FramePaint...
    新技术# FramePainter# 交互式图像编辑
    1年前
    02550
    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    在 AI 生成内容的领域中,音乐创作一直未能跟上视觉和文本内容的步伐。如今,腾讯推出的 XMusic 框架有望改变这一现状,通过情感可控、高质量的音乐创作,为创意应用带来新的可能性。 项目主页:htt...
    新技术# XMusic
    1年前
    02150
    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    厦门大学多媒体可信感知与高效计算教育部重点实验室和腾讯优图实验室的研究人员推出人脸恢复统一框架SVFR,用于解决视频中的人脸恢复问题。人脸恢复(Face Restoration, FR)是图像和视频处...
    新技术# SVFR# 人脸恢复
    1年前
    02480
    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    清华大学和智谱AI的研究人员推出VisionReward,这是一个用于图像和视频生成的细粒度多维度人类偏好学习框架。VisionReward通过构建一个细粒度且多维度的奖励模型,将人类对图像和视频的偏...
    新技术# VisionReward
    1年前
    03550
    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    昆仑万维的研究人员推出一个强大的框架 Ingredients,通过将多个特定身份(ID)的照片与视频扩散变换器(Video Diffusion Transformers)结合,实现定制化的视频创作。该...
    新技术# Ingredients
    1年前
    02580
    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    中国科学技术大学和vivo移动通信有限公司的研究人员推出一种单步扩散模型 DepthMaster,,旨在将扩散模型应用于单目深度估计(Monocular Depth Estimation, MDE...
    新技术# DepthMaster# 单目深度
    1年前
    02580
    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    Meta和耶路撒冷希伯来大学的研究人员推出图生视频框架Through-The-Mask,旨在将静态图像转换为基于文本描述的真实视频序列。该框架通过引入基于掩码的运动轨迹作为中间表示,能够准确地动画化多...
    新技术# Through-The-Mask# 图生视频
    1年前
    03010
    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...
    新技术# GS-DiT# 视频生成
    1年前
    03650
    高保真面部表情编辑框架MagicFace:通过控制面部动作单元的变化来实现对特定人物面部表情的精细编辑

    高保真面部表情编辑框架MagicFace:通过控制面部动作单元的变化来实现对特定人物面部表情的精细编辑

    芬兰奥卢大学信息技术与电气工程学院机器视觉与信号分析中心和东南大学生物科学与医学工程学院儿童发展与学习科学教育部重点实验室的研究人员推出高保真面部表情编辑框架MagicFace,它通过控制面部动作单元...
    新技术# MagicFace# 面部表情编辑
    1年前
    02350
    Magic Mirror框架:生成具有身份保持(ID-Preserved)和动态运动的高质量视频

    Magic Mirror框架:生成具有身份保持(ID-Preserved)和动态运动的高质量视频

    香港中文大学、香港科技大学、思谋科技和卡内基梅隆大学的研究人员推出Magic Mirror框架,旨在生成具有身份保持(ID-Preserved)和动态运动的高质量视频。尽管视频扩散模型在文本到视频生成...
    新技术# Magic Mirror
    1年前
    02670
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    Impeccable

    Impeccable

    由pbakaus推出的 Impeccable 技能升级包,正是为了解决这一痛点而生。它不仅仅是一个简单的提示词集合,而是一套包含 17 条专业指令、7 大领域参考文件 以及 精心策划的“反模式” 的设计系统。它的目标很明确:对抗大模型的通用偏见,助你实现真正“无可挑剔”的前端设计。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单