SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2255 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    基于人类与场景互动数据集Trumans开发的动作生成模型

    基于人类与场景互动数据集Trumans开发的动作生成模型

    来自北京大学人工智能研究院、BIGAI通用人工智能国家重点实验室、北京大学CFCS计算机学院和北京理工大学的研究团队创建一个详细的人类与场景互动数据集trumans,并开发出一种先进的动作生成模型,为...
    新技术# Trumans# 动作生成模型
    2年前
    09440
    基于文本的视频编辑模型Emu Video Edit (EVE)

    基于文本的视频编辑模型Emu Video Edit (EVE)

    Meta推出基于文本的视频编辑模型Emu Video Edit (EVE),它能够在没有监督视频编辑数据的情况下,实现先进的视频编辑功能。 论文 EVE模型通过结合图像编辑适配器和视频生成适配器,并使...
    新技术# EVE# 视频编辑模型
    2年前
    05610
    文本编码器Glyph-ByT5:为提高视觉文本渲染的准确性而设计

    文本编码器Glyph-ByT5:为提高视觉文本渲染的准确性而设计

    来自微软亚洲研究院、清华大学、北京大学和澳大利亚国立大学的研究团队推出文本编码器Glyph-ByT5,它是为了提高视觉文本渲染的准确性而设计的。Glyph-ByT5通过微调一个字符感知的ByT5编码器...
    新技术# Glyph-ByT5# 文本编码器
    2年前
    05940
    StreamMultiDiffusion:实时交互式图像生成和编辑的工具

    StreamMultiDiffusion:实时交互式图像生成和编辑的工具

    来自韩国首尔国立大学的团队发布新应用StreamMultiDiffusion,这是一种用于实时交互式图像生成和编辑的工具,这是将之前已发布的技术 MultiDiffusion + StreamDiff...
    新技术# StreamMultiDiffusion# 实时生图
    2年前
    09390
    Follow-Your-Click:通过用户简单的点击和简短的动作提示来实现图像的局部动画化

    Follow-Your-Click:通过用户简单的点击和简短的动作提示来实现图像的局部动画化

    来自香港科大、腾讯浑源和清华大学的团队推出新颖框架Follow-Your-Click,它能够通过用户简单的点击和简短的动作提示来实现图像的局部动画化。 项目主页 GitHub 想象一下,你有一张静态图...
    新技术# Follow-Your-Click# 局部动画化
    2年前
    06510
    视觉风格提示(Visual Style Prompting):不需要对模型进行微调的情况下,通过参考图像来生成具有特定风格的图像

    视觉风格提示(Visual Style Prompting):不需要对模型进行微调的情况下,通过参考图像来生成具有特定风格的图像

    来自韩国延世大学和NAVER AI 实验室的研究团队推出“视觉风格提示(Visual Style Prompting)”,它能够在不需要对预训练模型进行微调的情况下,通过参考图像来生成具有特定风格的图...
    新技术# Visual Style Prompting# 视觉风格提示
    2年前
    06490
    谷歌推出创新框架VLOGGER:只需要提供一张静态照片和一段语音,就能生成口型匹配的视频

    谷歌推出创新框架VLOGGER:只需要提供一张静态照片和一段语音,就能生成口型匹配的视频

    谷歌推出创新框架VLOGGER,它能够根据一段音频和一张人物的单张照片生成这个人说话和动作的逼真视频。想象一下,你只需提供一张你的照片和你的语音记录,VLOGGER就能制作出一个视频,在视频中你可以看...
    新技术# VLOGGER# 谷歌
    2年前
    05660
    DragAnything:视频生成中任意对象的运动控制

    DragAnything:视频生成中任意对象的运动控制

    来自快手、浙江大学和新加坡国立大学的研究团队推出DragAnything,它是一种用于视频生成和控制的方法,它利用实体表示法来实现对视频生成中任意对象的运动控制。 项目主页 GitHub 论文 例如...
    新技术# DragAnything# 视频生成# 运动控制
    2年前
    06560
    实时生图平台Krea AI如何使用?

    实时生图平台Krea AI如何使用?

    在AI绘画领域,Midjourney、DALL·E 3和Stable Diffusion无疑是三款备受瞩目的产品。其中,由于Stable Diffusion的开源特性,许多AI绘画网站都基于其相关模型...
    教程# Krea AI# 实时生图
    11个月前
    01,7870
    FaceChain-SuDe:提高个性化图像生成的属性相关性

    FaceChain-SuDe:提高个性化图像生成的属性相关性

    来自北京大学、阿里巴巴、清华大学和鹏程实验室的研究团队推出FaceChain-SuDe,这是一种用于个性化文本到图像生成的方法,旨在提高个性化图像生成(subject-driven generatio...
    新技术# FaceChain-SuDe# 个性化图像生成
    2年前
    05640
    新型3D生成模型V3D:利用视频扩散模型的能力来创建高质量的三维对象和场景

    新型3D生成模型V3D:利用视频扩散模型的能力来创建高质量的三维对象和场景

    来自清华和生数科技的研究推出新型3D生成模型V3D,它利用视频扩散模型的能力来创建高质量的三维对象和场景。V3D的核心思想是将连续的多视角图像视为视频,从而利用预训练的视频扩散模型来生成围绕物体的36...
    新技术# 3D生成模型# V3D
    2年前
    05590
    谷歌发布“多步一致性模型”(Multistep Consistency Models)

    谷歌发布“多步一致性模型”(Multistep Consistency Models)

    谷歌发布新型生成模型“多步一致性模型”(Multistep Consistency Models),它在图像、视频和音频生成领域具有潜在的应用价值。这个模型是介于传统的“一致性模型”(Consiste...
    新技术# 多步一致性模型# 谷歌
    2年前
    05620
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Eigent AI

    Eigent AI

    Eigent 是全球首个 多智能体工作流 桌面应用程序,帮助您构建、管理和部署定制化的 AI 工作团队,将最复杂的工作流程转化为自动化任务。基于 CAMEL-AI 广受赞誉的开源项目,我们的系统引入了 多智能体工作流,通过并行执行、定制化和隐私保护 提升生产力。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    查看完整榜单