SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA,即模态不变图像匹配。这项研究旨在解决多模态感知中的图像匹配问题,特别是在跨视图和跨模态的情况下。例如,在自动驾驶中,需要将可见光...
    新技术# MINIMA# 图像匹配框架
    11个月前
    04370
    新型网络架构PIIP:提高视觉感知和多模态理解任务中的计算效率和性能

    新型网络架构PIIP:提高视觉感知和多模态理解任务中的计算效率和性能

    上海交通大学、清华大学、上海人工智能实验室、香港中文大学和商汤科技的研究人员推出新型网络架构PIIP,旨在提高视觉感知和多模态理解任务中的计算效率和性能。PIIP通过将不同分辨率的图像与不同参数规模的...
    新技术# PIIP
    11个月前
    02010
    视频生成框架RepVideo:通过重新思考跨层表示来提高文生视频模型的性能

    视频生成框架RepVideo:通过重新思考跨层表示来提高文生视频模型的性能

    南洋理工大学和上海人工智能实验室的研究人员推出视频生成框架RepVideo,旨在通过重新思考跨层表示来提高文本到视频(Text-to-Video, T2V)扩散模型的性能。该框架通过积累邻近层的特征来...
    新技术# RepVideo# 视频生成框架
    11个月前
    02350
    新型视频去噪框架Ouroboros-Diffusion:提高无调优(tuning-free)长视频生成中的结构和内容(主体)一致性

    新型视频去噪框架Ouroboros-Diffusion:提高无调优(tuning-free)长视频生成中的结构和内容(主体)一致性

    罗切斯特大学和智象未来的研究人员推出新型视频去噪框架Ouroboros-Diffusion,旨在提高无调优(tuning-free)长视频生成中的结构和内容(主体)一致性。该框架通过引入新的潜在采样技...
    新技术# Ouroboros-Diffusion# 视频去噪
    11个月前
    02240
    SynthLight:基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明

    SynthLight:基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明

    在数字影像处理领域,耶鲁大学和Adobe研究中心联合推出了一项创新技术——SynthLight。这项技术基于扩散模型,通过模拟环境光照条件对真实人像照片进行重新照明,从而达到令人惊叹的视觉效果。该方法...
    新技术# SynthLight
    11个月前
    02230
    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    阿里巴巴通义实验室推出一个用于文本到图像生成的统一单主体和多主体个性化框架AnyStory,旨在生成具有特定主体的高保真个性化图像,无论是单个主体还是多个主体,都能在不牺牲主体保真度的情况下实现个性化...
    新技术# AnyStory
    11个月前
    02070
    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    哈尔滨工业大学和华为诺亚方舟实验室的研究人员推出交互式图像编辑工具FramePainter,它利用视频扩散先验(video diffusion priors)来增强图像编辑的能力。FramePaint...
    新技术# FramePainter# 交互式图像编辑
    11个月前
    02370
    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    在 AI 生成内容的领域中,音乐创作一直未能跟上视觉和文本内容的步伐。如今,腾讯推出的 XMusic 框架有望改变这一现状,通过情感可控、高质量的音乐创作,为创意应用带来新的可能性。 项目主页:htt...
    新技术# XMusic
    11个月前
    02070
    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    厦门大学多媒体可信感知与高效计算教育部重点实验室和腾讯优图实验室的研究人员推出人脸恢复统一框架SVFR,用于解决视频中的人脸恢复问题。人脸恢复(Face Restoration, FR)是图像和视频处...
    新技术# SVFR# 人脸恢复
    11个月前
    02340
    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    清华大学和智谱AI的研究人员推出VisionReward,这是一个用于图像和视频生成的细粒度多维度人类偏好学习框架。VisionReward通过构建一个细粒度且多维度的奖励模型,将人类对图像和视频的偏...
    新技术# VisionReward
    11个月前
    03090
    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    昆仑万维的研究人员推出一个强大的框架 Ingredients,通过将多个特定身份(ID)的照片与视频扩散变换器(Video Diffusion Transformers)结合,实现定制化的视频创作。该...
    新技术# Ingredients
    11个月前
    02470
    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    中国科学技术大学和vivo移动通信有限公司的研究人员推出一种单步扩散模型 DepthMaster,,旨在将扩散模型应用于单目深度估计(Monocular Depth Estimation, MDE...
    新技术# DepthMaster# 单目深度
    11个月前
    02510
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    人生 K 线

    新人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单