SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2230 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成

    加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成

    加州大学伯克利分校、麻省理工学院、英伟达和清华大学的研究人员推出一个用于加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG),通过利用三维全注意力(3D full attent...
    新技术# Sparse VideoGen# SVG# 加速
    9个月前
    03960
    通过 Trae 等 AI IDE 配置 MCP一键发布到掘金的完整指南

    通过 Trae 等 AI IDE 配置 MCP一键发布到掘金的完整指南

    在开发过程中,我们常常需要将自己制作的小项目(如 HTML/CSS/JS 小游戏、落地页等)快速展示给他人。如果你是掘金用户,并且使用支持 MCP(Model Calling Protocol) 的 ...
    教程# MCP# Trae# 掘金
    7个月前
    03950
    无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑

    无需训练的图像编辑技术Stable Flow:执行各种类型的图像编辑操作,包括非刚性编辑、物体添加、物体替换和全局场景编辑

    Snap Research、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出图像编辑方法Stable Flow,这是一种无需训练的图像编辑技术,能够执行各种类型的图像编辑操作,包括非刚性编辑...
    新技术# Stable Flow# 图像编辑
    1年前
    03950
    基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片

    基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片

    南京大学、InstantX、Liblib AI、香港科技大学与中国移动的研究团队共同提出了一种名为RAG(Region-Aware Generation)的新方法,它是一种基于区域描述的精确布局组合文...
    新技术# RAG# 区域提示
    1年前
    03950
    CAMI2V:引入物理约束提升文生视频模型中的相机控制精度

    CAMI2V:引入物理约束提升文生视频模型中的相机控制精度

    浙江大学计算机科学与技术学院的研究团队推出一个名为CAMI2V(Camera-Controlled Image-to-Video Diffusion Model)的模型,它是一个基于扩散模型的图像到视...
    新技术# CAMI2V# 文生视频# 相机控制
    1年前
    03950
    人像视频编辑方法PortraitGen:可以根据多模态提示对人像视频进行一致且富有表现力的编辑

    人像视频编辑方法PortraitGen:可以根据多模态提示对人像视频进行一致且富有表现力的编辑

    中国科学技术大学的研究人员推出人像视频编辑方法PortraitGen,该方法可以根据多模态提示对人像视频进行一致且富有表现力的编辑。例如,给定一段人物跳舞的视频,PortraitGen 可以根据文字提...
    新技术# PortraitGen# 人像视频编辑
    1年前
    03930
    视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景

    视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景

    浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster,能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频(t...
    新技术# ReCamMaster# 动态场景# 视频生成
    9个月前
    03910
    Enhance-A-Video:利用时间注意力温度调整提升DiT架构模型的视频生成质量

    Enhance-A-Video:利用时间注意力温度调整提升DiT架构模型的视频生成质量

    尽管基于DiT架构模型的视频生成技术取得了显著进展,现有模型在捕捉关键细节方面仍面临挑战。为了提高视频质量,视频增强成为一种直观的方法,其主要目标是: 保持帧间一致性:确保相邻帧之间的视觉和语义一致性...
    新技术# CogVideoX-2B# DiT架构模型# Enhance-A-Video
    1年前
    03910
    限量版不够玩?自己DIY一个Crybaby哭娃手办,分分钟刷爆朋友圈

    限量版不够玩?自己DIY一个Crybaby哭娃手办,分分钟刷爆朋友圈

    在潮玩文化席卷全球的浪潮中,泡泡玛特(Pop Mart)旗下的 Crybaby 哭娃手办 以其独特的疗愈系形象和可爱情感表达,迅速成为年轻世代和明星圈的时尚新宠。随着数字创作风潮的兴起,Molly F...
    教程# Crybaby# 哭娃# 泡泡玛特
    8个月前
    03900
    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    PhysGen3D:从一张图片创造真实物理世界的交互式3D场景

    清华大学、伊利诺伊大学厄巴纳香槟分校和哥伦比亚大学的研究人员携手推出了一项创新成果—PhysGen3D,将单一图像转化为非模态、以相机为中心的交互式 3D 场景。 项目主页:https://by-lu...
    新技术# 3D场景# PhysGen3D
    9个月前
    03900
    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    扩散模型是一种强大的生成模型,能够生成高质量的图像、视频等内容。然而,传统的扩散模型在采样过程中需要大量的步骤来逐步去除噪声并生成最终结果,这使得采样过程计算成本高昂。例如,在生成一张高质量的图像时...
    新技术# OSS# 扩散模型# 最优步长蒸馏
    9个月前
    03890
    MCP(开源模型上下文协议)迎来重大更新,还获得了行业巨头OpenAI和微软的支持

    MCP(开源模型上下文协议)迎来重大更新,还获得了行业巨头OpenAI和微软的支持

    开源模型上下文协议(MCP)的最新更新标志着AI代理与工具、数据和接口无缝交互的一个重要里程碑。这一更新不仅引入了关键升级,还获得了行业巨头OpenAI和微软的支持,显示出其在AI领域的巨大潜力和影响...
    百科# MCP# OpenAI# 开源模型上下文协议
    9个月前
    03890
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    NaturalReader

    NaturalReader

    NaturalReader 是一款功能强大、易于使用的文本转语音工具,适合各种场景下的阅读需求。无论您是希望节省时间的学生、需要无障碍支持的读者,还是寻求高质量语音内容的创作者,NaturalReader 都能为您提供卓越的体验。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单