SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    视频编辑框架AnyV2V:根据文本提示、主题或风格等不同的输入来编辑视频

    视频编辑框架AnyV2V:根据文本提示、主题或风格等不同的输入来编辑视频

    来自滑铁卢大学、Vector研究所和Harmony.AI的研究团队推出新型视频编辑框架AnyV2V,它能够让用户根据文本提示、主题或风格等不同的输入来编辑视频。 项目主页 GitHub Demo 想象...
    新技术# AnyV2V# 视频编辑
    2年前
    07760
    文生视频模型VSTAR:解决现有开源T2V模型难以生成内容动态变化和较长视频的问题

    文生视频模型VSTAR:解决现有开源T2V模型难以生成内容动态变化和较长视频的问题

    来自博世人工智能中心、曼海姆大学、马克斯·普朗克信息学研究所和图宾根大学的研究团队推出VSTAR,这是一种用于生成动态视频的文本到视频(T2V)合成技术。VSTAR的目标是解决现有开源T2V模型难以生...
    新技术# VSTAR# 文生视频模型
    2年前
    07740
    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    来自中国科学院深圳先进技术学院、上海AI实验室、悉尼大学、香港理工大学、,腾讯PCG ARC实验室、香港中文大学的研究人员推出图像高清修复技术SUPIR(Scaling-UP Image Restor...
    新技术# SUPIR# 高清修复
    2年前
    07740
    多概念定制技术MultiBooth:根据用户的文本描述生成包含多个特定元素的图像

    多概念定制技术MultiBooth:根据用户的文本描述生成包含多个特定元素的图像

    清华大学和Meta的研究人员推出新颖且高效的多概念定制技术MultiBooth,此技术用于从文本生成图像时实现多概念定制。简单来说,MultiBooth能够根据用户的文本描述生成包含多个特定元素的图像...
    新技术# MultiBooth# 多概念定制技术
    2年前
    07730
    IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界

    IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界

    IDEA研究院(粤港澳大湾区数字经济研究院)推出先进模型系列Grounding DINO 1.5,旨在推动开放集对象检测技术的边界。开放集对象检测是一种计算机视觉任务,它要求模型能够识别图像中的对象...
    新技术# Grounding DINO 1.5# 开集目标检测模型
    2年前
    07700
    新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量

    新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量

    小米推出新型实时一步潜在扩散模型SDXS,它能够在图像生成任务中显著提高效率,同时保持图像质量。SDXS模型通过模型小型化和减少采样步骤的双重方法,显著降低了模型的延迟,使其能够在低功耗设备上实时生成...
    新技术# SDXS# 一步潜在扩散模型
    1年前
    07700
    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...
    新技术# Noise Calibration# 噪声校准# 视频增强技术
    2年前
    07670
    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    卡内基·梅隆大学的研究人员推出合成语言-视觉数据集StableSemantics,它专注于自然图像中的语义表示。简单来说,这个数据集旨在帮助计算机视觉系统更好地理解图像中的场景和对象的语义含义。它涵盖...
    新技术# StableSemantics# 合成语言-视觉数据集
    2年前
    07670
    文生图风格化工具Artist:无需训练即可实现美学控制的文本驱动风格化

    文生图风格化工具Artist:无需训练即可实现美学控制的文本驱动风格化

    香港理工大学的研究人员推出一种无需训练即可实现美学控制的文本驱动风格化方法Artist。简而言之,Artist能够根据文本描述,将一张静态图片转换成具有特定艺术风格的图像,同时保持图片内容的完整性和细...
    新技术# Artist# 风格化
    2年前
    07640
    Controlnet作者lllyasviel新开源项目Omost:将大语言模型的编程能力转化为图像合成能力

    Controlnet作者lllyasviel新开源项目Omost:将大语言模型的编程能力转化为图像合成能力

    Controlnet作者lllyasviel的新开源项目Omost,这是一个将大语言模型的编程能力转化为图像合成能力的项目。项目名称“Omost”(发音类似于“almost”,意为“几乎”)蕴含双重意...
    新技术# controlnet# lllyasviel# Omost
    2年前
    07620
    谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion

    谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion

    谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(亚秒级)生成高质量的图片。该模型在架构和采样技术方面进行广泛优化,在iPhone 15 Pro上,Mobile...
    新技术# MobileDiffusion# 安卓# 扩散模型
    2年前
    07620
    步态感知偏好优化SPO:改进SD模型的训练过程,使其生成的图像更符合人类的审美偏好

    步态感知偏好优化SPO:改进SD模型的训练过程,使其生成的图像更符合人类的审美偏好

    来自澳大利亚国立大学、利物浦大学、东南大学和微软亚洲研究院的研究人员推出新技术Step-aware Preference Optimization(SPO,步态感知偏好优化),用于改进文本到图像的扩散...
    新技术# SD模型# SPO# 步态感知偏好优化
    2年前
    07600
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    中国科技云数据胶囊

    中国科技云数据胶囊

    中国科学院旗下的 中国科技云数据胶囊(Data Capsule)提供 20GB 免费存储空间,支持 标准 S3 与 WebDAV 协议,无需手机号绑定,支持微信/QQ/GitHub 第三方登录,非常适合注重隐私、追求开源生态兼容性的科研用户或个人知识管理者。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单