SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2618 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    英伟达开源ConsiStory:免训练保持角色和物品一致性的文生图方法

    来自特拉维夫大学和英伟达的研究人员提出了一种创新方法ConsiStory,它允许用户通过自然语言描述生成一系列图像,这些图像不仅能够保持一致的主题,而且能够遵循文本提示。ConsiStory的核心目标...
    新技术# ConsiStory# 英伟达
    1年前
    06280
    通过 Trae 等 AI IDE 配置 MCP一键发布到掘金的完整指南

    通过 Trae 等 AI IDE 配置 MCP一键发布到掘金的完整指南

    在开发过程中,我们常常需要将自己制作的小项目(如 HTML/CSS/JS 小游戏、落地页等)快速展示给他人。如果你是掘金用户,并且使用支持 MCP(Model Calling Protocol) 的 ...
    教程# MCP# Trae# 掘金
    11个月前
    06270
    用ChatGPT生成个性化微信表情包,简单几步教你玩转创意表达

    用ChatGPT生成个性化微信表情包,简单几步教你玩转创意表达

    GPT4o的原生图像生成功能,让ChatGPT再次成为网络热点,它允许用户通过简单的文本提示创建高质量图像。从吉卜力风格的壁纸到复杂的图像编辑,这一功能为创意表达带来了无限可能。 目前,ChatGPT...
    教程# ChatGPT# 微信表情包
    1年前
    06270
    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体

    Adob​​e和康奈尔大学的研究人员推出新型3D重建模型GS-LRM(Gaussian Splatting Large Reconstruction Model),这个模型能够从少数几张2D图像中快速...
    新技术# 3D重建模型# GS-LRM
    2年前
    06270
    动态排版Dynamic Typography:将文字通过动画效果生动呈现的技术

    动态排版Dynamic Typography:将文字通过动画效果生动呈现的技术

    来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography(动态排版),它是一种将文字通过动画效果生动呈现的技术。简单来说,就是让文字动起来,通过变形和运动来表达文字的含义,从而...
    新技术# Dynamic Typography# 动态排版
    2年前
    06270
    新型视觉模型训练方法SynCLR:完全从生成模型中学习,不需要任何真实数据

    新型视觉模型训练方法SynCLR:完全从生成模型中学习,不需要任何真实数据

    来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR,它完全从生成模型中学习,而不需要任何真实数据。 GitHub 论文 SynCLR的核心思想是利用大语言模型(LLMs)生成大量的图像...
    新技术# SynCLR# 大模型# 大语言模型
    2年前
    06270
    条件对比对齐CCA:提升自回归(AR)视觉生成模型的样本质量

    条件对比对齐CCA:提升自回归(AR)视觉生成模型的样本质量

    无分类器引导(CFG)是提高视觉生成模型样本质量的关键技术。然而,在自回归(AR)多模态生成中,CFG 在语言和视觉内容之间引入了设计不一致性,这与统一不同模态的视觉 AR 设计理念相矛盾。受语言模型...
    新技术# CCA# 条件对比对齐# 视觉生成模型
    1年前
    06260
    高度一致且可控制运动的图像动画生成方法Cinemo:将一张静态图片转换成一段视频,并且在转换过程中保持图片原有的细节信息

    高度一致且可控制运动的图像动画生成方法Cinemo:将一张静态图片转换成一段视频,并且在转换过程中保持图片原有的细节信息

    莫纳什大学、上海人工智能实验室和南京邮电大学的研究人员推出Cinemo,它是一种用于图像动画化(也称为图像到视频生成,I2V)的新型方法。简单来说,Cinemo能够将一张静态图片转换成一段视频,并且在...
    新技术# Cinemo# 图像动画
    2年前
    06250
    DiPIR:将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中

    DiPIR:将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中

    英伟达、多伦多大学和矢量研究所的研究人员推出DiPIR技术,它能够将虚拟对象以逼真的方式插入到真实世界场景的图片或视频中。这项技术的核心在于理解和模拟场景的光照、几何形状和材质,以及图像形成过程,从而...
    新技术# DiPIR
    2年前
    06240
    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    SDXL-Lightning是由字节跳动发布的一款速度极快的文生图模型,它采用新型扩散模型蒸馏方法,优化扩散模型,能在短时间内高效生成分辨率为1024像素的高品质图像。 模型地址:https://hu...
    新技术# SDXL-Lightning# SDXL1.0# 字节跳动
    2年前
    06240
    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    来自清华大学和上海人工智能实验室的研究人员推出运动潜在一致性模型MotionLCM,它能够实时控制人体动作的生成。这个框架通过一种称为“潜在一致性模型”(Motion Latent Consisten...
    新技术# MotionLCM# 运动潜在一致性模型
    2年前
    06230
    微软发布复现Sora的开源项目:新型多智能体框架Mora

    微软发布复现Sora的开源项目:新型多智能体框架Mora

    来自理海大学和微软研究院的研究团队推出新型多智能体框架Mora,它是为了实现大规模的通用视频生成而设计的。Mora的设计灵感来自于OpenAI在2024年2月推出的Sora模型,Sora是一个能够将文...
    新技术# Mora# Sora# 微软
    2年前
    06230
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    waoo

    waoo

    waoowaoo AI 影视 Studio 是一款基于 AI 技术的短剧/漫画视频制作工具,支持从小说文本自动生成分镜、角色、场景,并制作成完整视频。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    Flova

    Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    查看完整榜单