SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2250 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片

    基于区域描述的精确布局组合文生图方法RAG:将复杂的场景分解为单独的区域,并为每个区域提供相应的文本描述,然后生成一张精确布局的图片

    南京大学、InstantX、Liblib AI、香港科技大学与中国移动的研究团队共同提出了一种名为RAG(Region-Aware Generation)的新方法,它是一种基于区域描述的精确布局组合文...
    新技术# RAG# 区域提示
    1年前
    03970
    MVideo:用于生成具有精确、流畅动作的长时视频

    MVideo:用于生成具有精确、流畅动作的长时视频

    无限光年、上海交通大学和复旦大学的研究人员推出新型框架MVideo,它专门设计用于生成具有精确、流畅动作的长时视频。MVideo通过结合文本提示和掩码序列(mask sequences)作为额外的运动...
    新技术# MVideo# 文生视频
    1年前
    05350
    专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画

    专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画

    武汉大学、阶跃星辰和字节跳动的研究人员推出MikuDance,它是一个基于扩散的动画制作流程,用于为风格化的角色艺术作品添加混合运动动力学,使其动起来。MikuDance的核心在于它能够处理复杂的角色...
    新技术# MikuDance# 二次元
    1年前
    06750
    大规模视频动作数据集EgoVid-5M:专为第一人称视角(egocentric)视频生成而设计

    大规模视频动作数据集EgoVid-5M:专为第一人称视角(egocentric)视频生成而设计

    阿里巴巴集团智能计算研究院、中国科学院自动化研究所、清华大学和中国科学院大学的研究人员推出大规模视频动作数据集EgoVid-5M,专为第一人称视角(egocentric)视频生成而设计。该数据集包含了...
    新技术# EgoVid-5M# 视频动作数据集
    1年前
    03640
    BLIP3-KALE:包含2.18亿个图像-文本对的数据集

    BLIP3-KALE:包含2.18亿个图像-文本对的数据集

    华盛顿大学、Salesforce Research、斯坦福大学和加州大学伯克利分校推出一个包含2.18亿个图像-文本对的数据集BLIP3-KALE,它弥合了描述性合成字幕和网络规模的事实性替代文本之间...
    新技术# BLIP3-KALE# 数据集
    1年前
    04200
    ParaAttention:通过上下文并行注意力机制,使用多个GPU加速FLUX和Mochi模型的推理

    ParaAttention:通过上下文并行注意力机制,使用多个GPU加速FLUX和Mochi模型的推理

    ParaAttention是一种创新的上下文并行注意力机制,旨在通过多个GPU加速FLUX和Mochi模型的推理。通过支持torch.compile和多种并行策略,ParaAttention提供了高效...
    新技术# ParaAttention# 推理加速
    1年前
    03760
    Autodesk推出新型3D生成模型WaLa:基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型

    Autodesk推出新型3D生成模型WaLa:基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型

    Autodesk推出新型3D生成模型“Wavelet Latent Diffusion (WaLa)”,它能够基于多种输入条件(如文本描述、图像、点云等)生成参数化的3D CAD模型。WaLa模型的核...
    新技术# 3D生成模型# Autodesk# WaLa
    1年前
    03970
    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    上海科技大学、忆生科技、深度求索(DeepSeek-AI)和香港大学的研究人员推出一个名为“CAD-MLLM”的系统,它旨在实现一个统一的计算机辅助设计(CAD)模型生成系统。该系统能够根据用户的多种...
    新技术# CAD# CAD-MLLM
    1年前
    07400
    Meta推出局部图像水印的深度学习模型WAM

    Meta推出局部图像水印的深度学习模型WAM

    图像水印技术在保护数字内容的版权和完整性方面发挥着重要作用。然而,传统的图像水印方法并未针对处理小面积水印区域进行优化,这限制了其在实际应用中的使用,例如图像的部分可能来自不同来源或已被编辑。Meta...
    新技术# WAM# 图像水印
    1年前
    06750
    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散...
    新技术# Edify Image# 图像生成# 英伟达
    1年前
    05950
    英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法

    英伟达推出Add-it:基于文本指令在图像中添加对象的创新方法

    英伟达、特拉维夫大学和巴伊兰大学的研究人员推出一个名为Add-it的系统,它是一种无需训练的方法,可以在图像中根据文本提示添加对象。这种方法扩展了预训练扩散模型的注意力机制,以整合来自三个关键来源的信...
    新技术# Add-it# 英伟达
    1年前
    03390
    SAMPart3D:可扩展的零样本3D部件分割框架

    SAMPart3D:可扩展的零样本3D部件分割框架

    3D部件分割是3D感知中的一项关键任务,在机器人、3D生成和3D编辑等应用中发挥着重要作用。最近的方法利用强大的视觉语言模型(VLMs)进行2D到3D的知识蒸馏,实现了零样本的3D部件分割。然而,这些...
    新技术# 3D部件分割框架# SAMPart3D
    1年前
    03920
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    Kagi

    Kagi

    Kagi是一个以用户隐私和搜索质量为核心的搜索引擎。它致力于提供无广告、无追踪的优质搜索体验,让用户能够专注于获取最佳信息,而不是被广告和追踪器干扰。Kagi 的目标是成为一个真正的搜索伙伴,帮助用户发现能够扩展他们知识的内容。
    LiblibAI

    LiblibAI

    LiblibAI 是一家位于中国的 AI 图像生成平台,成立于 2023 年,为用户提供创建、分享和互动 AI 生成图像的工具。它基于开源的SD、Flux等模型,适合设计师、艺术家和内容创作者使用,提供文本到图像生成、图像操作和个性化模型训练等功能。
    Helping AI

    Helping AI

    Helping AI 是一家创新型科技公司,专注于构建能够理解人类情感的AI。他们的目标是通过技术让AI不仅能处理信息,还能以同理心和细腻的方式回应用户情感。这使得他们的AI在交互中更具人性化,特别适合需要情感支持的场景。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单