SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2605 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    商汤研究院推出文本嵌入模型Piccolo2

    商汤研究院推出文本嵌入模型Piccolo2

    商汤研究院推出文本嵌入模型Piccolo2,它在多个任务上的表现超越了其他模型,并在CMTEB基准测试中创下了新的最高标准。文本嵌入是一种将文本转换成数值向量的技术,这些向量能够捕捉单词、短语或整篇文...
    新技术# Piccolo2# 商汤研究院# 文本嵌入模型
    2年前
    07740
    新型视频生成模型HPDM:通过分层处理和上下文融合技术,生成高分辨率视频

    新型视频生成模型HPDM:通过分层处理和上下文融合技术,生成高分辨率视频

    Snap、阿卜杜拉国王科技大学和特伦托大学的研究人员推出新型视频生成模型Hierarchical Patch Diffusion Models(HPDM,分层补丁扩散模型),这个模型专门设计用于高分辨...
    新技术# HPDM# 分层补丁扩散模型# 视频生成
    2年前
    07720
    Adobe推出图像生成模型Firefly Image 3:逼真度、造型能力、细节和精确度方面均取得了显著进步

    Adobe推出图像生成模型Firefly Image 3:逼真度、造型能力、细节和精确度方面均取得了显著进步

    Adobe在昨天的Adobe Max大会上正式发布了图像生成模型Firefly Image 3。这款模型在逼真度、造型能力、细节和精确度方面均取得了显著进步,同时提供了更加丰富的多样性,为创意人士带来...
    早报# Adobe# Firefly Image 3
    2年前
    07720
    无需调整的高分辨率框架HiDiffusion:只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率

    无需调整的高分辨率框架HiDiffusion:只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率

    旷视科技与字节跳动的研究人员推出新型框架HiDiffusion,只需添加一行代码即可提高扩散模型(Stable Diffusion)在生成高分辨率图像方面的能力和效率。现有的扩散模型在生成超出训练时所...
    新技术# HiDiffusion# Stable Diffusion# 高分辨率框架
    2年前
    07700
    专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画

    专注于二次元角色的动画方法MikuDance:将二次元角色根据 Open Pose 姿势生成对应动画

    武汉大学、阶跃星辰和字节跳动的研究人员推出MikuDance,它是一个基于扩散的动画制作流程,用于为风格化的角色艺术作品添加混合运动动力学,使其动起来。MikuDance的核心在于它能够处理复杂的角色...
    新技术# MikuDance# 二次元
    1年前
    07670
    多模态模型Transfusion:能够同时处理离散数据(如文本)和连续数据(如图像)

    多模态模型Transfusion:能够同时处理离散数据(如文本)和连续数据(如图像)

    Meta、Waymo和南加州大学的研究人员推出多模态模型Transfusion,它能够同时处理离散数据(如文本)和连续数据(如图像)。Transfusion的核心思想是将语言模型的下一个词预测(nex...
    新技术# Transfusion# 多模态模型
    2年前
    07660
    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I:通过优化文本提示(prompt)来提高文生图模型的图像与输入提示的一致性

    Meta推出新型框架OPT2I,它旨在通过优化文本提示(prompt)来提高文本到图像(T2I)生成模型的图像与输入提示的一致性。尽管现有的T2I模型能够生成高质量和逼真的图像,但它们在确保生成的图像...
    新技术# OPT2I# 提示词# 文生图模型
    2年前
    07650
    3D场景生成技术BlockFusion:基于扩散模型的方法来创建和扩展3D场景

    3D场景生成技术BlockFusion:基于扩散模型的方法来创建和扩展3D场景

    来自腾讯、东京大学、澳大利亚国立大学、上海交通大学的研究人员推出新型3D场景生成技术BlockFusion,它使用基于扩散模型的方法来创建和扩展3D场景。 论文 BlockFusion的核心思想是将3...
    新技术# 3D场景生成# BlockFusion
    2年前
    07650
    新型图像编辑框架3DitScene:通过语言引导的解耦高斯散射来实现对任何场景图像的编辑

    新型图像编辑框架3DitScene:通过语言引导的解耦高斯散射来实现对任何场景图像的编辑

    香港中文大学、斯坦福大学、Snap、加州大学洛杉矶分校和字节跳动的研究人员推出新型图像编辑框架3DitScene,它能够通过语言引导的解耦高斯散射(Language-guided Disentangl...
    新技术# 3DitScene# 图像编辑框架
    2年前
    07630
    首个针对 GPT-4o 图像生成能力进行定量和定性评估的基准测试GPT-ImgEval

    首个针对 GPT-4o 图像生成能力进行定量和定性评估的基准测试GPT-ImgEval

    北京大学深圳研究生院、中山大学、Rabbitpre AI、上海人工智能实验室、深圳大学和香港科技大学(广州)的研究人员发布首个针对 GPT-4o 图像生成能力进行定量和定性评估的基准测试GPT-Img...
    新技术# GPT-4o# GPT-ImgEval
    1年前
    07620
    新型框架PhysAvatar:将物理模拟和逆向渲染技术相结合,创建逼真的3D虚拟人物

    新型框架PhysAvatar:将物理模拟和逆向渲染技术相结合,创建逼真的3D虚拟人物

    来自斯坦福大学、卡内基梅隆大学、谷歌和慕尼黑工业大学的研究人员推出新型框架PhysAvatar,它将物理模拟和逆向渲染技术相结合,能够自动从多视角视频数据中估计人体的形状和外观,以及衣物面料的物理参数...
    新技术# 3D虚拟人物# PhysAvatar
    2年前
    07620
    无需训练的概率并行解码算法SJD:用于加速自动回归文本到图像的生成模型

    无需训练的概率并行解码算法SJD:用于加速自动回归文本到图像的生成模型

    香港大学、华为诺亚方舟实验室、香港中文大学、清华大学、上海交通大学和无问芯穹的研究人员推出一种无需训练的概率并行解码算法SJD(猜测性雅可比解码),用于加速自动回归文本到图像的生成模型。自动回归模型在...
    新技术# SJD# 解码算法
    2年前
    07610
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Manus

    Manus

    Manus AI 正式公布的「Manus」Agent 产品正是这一领域的重大突破。作为全球首款通用 Agent 产品,Manus 能够独立思考、规划并执行复杂任务,直接交付完整成果,展现了强大的通用性和实用性。
    Happy

    Happy

    Happy Coder 是 Codex 和 Claude Code 的安全移动伴侣,让您可以随时随地继续您的 AI 编程会话(与 Anthropic 或 OpenAI 无关)。这款应用由需要在咖啡休息时间查看 AI 助手进度的开发者打造,采用军用级加密技术,将完整的 Codex 和 Claude Code 体验带到您的手机上。
    Riffusion

    Riffusion

    Riffusion 是一款新的生成式音乐模型,它赋予我们所有人创造力,你只需用一个想法、一个短语或一段旋律来提示模型,就可以生成完整的、录音室质量的歌曲。使用 Riffusion 不仅仅是用 AI 创作一首歌,它还关乎创造行为的终生旅程。
    查看完整榜单