SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2604 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频

    来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要...
    新技术# StoryDiffusion# 图像生成# 视频生成
    2年前
    08070
    谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion

    谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion

    谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(亚秒级)生成高质量的图片。该模型在架构和采样技术方面进行广泛优化,在iPhone 15 Pro上,Mobile...
    新技术# MobileDiffusion# 安卓# 扩散模型
    2年前
    08050
    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...
    新技术# Noise Calibration# 噪声校准# 视频增强技术
    2年前
    08020
    Anaconda安装教程

    Anaconda安装教程

    Anaconda是一个跨平台的集成开发环境,可在Windows、Linux和macOS等操作系统上运行。Anaconda提供了一个强大的包管理器,称为conda。conda可以轻松地安装、更新和管理各...
    教程# Anaconda# Python# 虚拟环境
    2年前
    08010
    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    卡内基·梅隆大学的研究人员推出合成语言-视觉数据集StableSemantics,它专注于自然图像中的语义表示。简单来说,这个数据集旨在帮助计算机视觉系统更好地理解图像中的场景和对象的语义含义。它涵盖...
    新技术# StableSemantics# 合成语言-视觉数据集
    2年前
    07990
    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    上海科技大学、忆生科技、深度求索(DeepSeek-AI)和香港大学的研究人员推出一个名为“CAD-MLLM”的系统,它旨在实现一个统一的计算机辅助设计(CAD)模型生成系统。该系统能够根据用户的多种...
    新技术# CAD# CAD-MLLM
    1年前
    07980
    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    华东师范大学和阿里巴巴的研究人员推出新型视频合成模型扩展方法ExVideo,这种方法旨在通过参数高效的方式对现有的视频合成模型(Stable Video Diffusion)进行后期调整(post-t...
    新技术# ExVideo# SVD模型
    2年前
    07980
    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta今日推出V-JEPA(Video Joint-Embedding Predictive Architecture)模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习...
    新技术# Meta# V-JEPA# 世界模型
    2年前
    07980
    图像超分辨率技术StableSR:将低分辨率的图像转换为高分辨率的图像

    图像超分辨率技术StableSR:将低分辨率的图像转换为高分辨率的图像

    StableSR是来自南洋理工大学S实验室的研究人员开发的图像超分辨率技术,它可以将低分辨率的图像转换为高分辨率的图像。简单来说,这项技术可以让你看到的图片变得更加清晰和详细。 我们可以用一个生活中的...
    新技术# StableSR# 超分辨率
    2年前
    07980
    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在...
    新技术# IMUSIC# 影眸科技# 灵秘科技
    2年前
    07970
    步态感知偏好优化SPO:改进SD模型的训练过程,使其生成的图像更符合人类的审美偏好

    步态感知偏好优化SPO:改进SD模型的训练过程,使其生成的图像更符合人类的审美偏好

    来自澳大利亚国立大学、利物浦大学、东南大学和微软亚洲研究院的研究人员推出新技术Step-aware Preference Optimization(SPO,步态感知偏好优化),用于改进文本到图像的扩散...
    新技术# SD模型# SPO# 步态感知偏好优化
    2年前
    07960
    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    来自中国科学院深圳先进技术学院、上海AI实验室、悉尼大学、香港理工大学、,腾讯PCG ARC实验室、香港中文大学的研究人员推出图像高清修复技术SUPIR(Scaling-UP Image Restor...
    新技术# SUPIR# 高清修复
    2年前
    07940
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    查看完整榜单