SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2620 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像

    个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像

    来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像,这在内容创作领域具有革命性的意义。 项目主页 论文地址 想象一下,你想要...
    新技术# RealCustom# 个性化图像生成
    2年前
    05860
    新型神经网络渲染技术Joint-TensoRF:使用2D图像作为监督,实现相机姿态和场景几何的精细调整

    新型神经网络渲染技术Joint-TensoRF:使用2D图像作为监督,实现相机姿态和场景几何的精细调整

    来自中国台湾阳明交通大学的研究人员推出新型神经网络渲染技术Joint-TensoRF,提高神经渲染中相机姿态和场景几何表示的联合优化性能,特别是在处理复杂场景时的鲁棒性,这对于许多3D视觉和图形应用领...
    新技术# Joint-TensoRF# 神经网络渲染
    2年前
    05860
    Media2Face:集成多种媒体输入(音频、图像和文本)生成同步的面部动画和头部姿势

    Media2Face:集成多种媒体输入(音频、图像和文本)生成同步的面部动画和头部姿势

    来自上海科技大学、影眸科技、香港大学和叠境数字科技的研究人员提出一个基于扩散的生成模型Media2Face,它能够根据语音信号和多模态条件(如文本、图像)生成同步的面部动画和头部姿势。 项目主页 Me...
    新技术# Media2Face
    2年前
    05860
    Liblib AI推出基于 ControlNet 框架RepText:实现中文文本的准确生成

    Liblib AI推出基于 ControlNet 框架RepText:实现中文文本的准确生成

    在当今的文本到图像生成领域,尽管模型在生成视觉上吸引人的图像方面取得了显著进步,但在处理精确且灵活的排版元素时,尤其是对于非拉丁字母,仍然存在明显的局限性。这种局限性主要源于文本编码器在处理多语言输入...
    新技术# controlnet# Liblib AI# RepText
    11个月前
    05850
    3D内容生成框架DreamGaussian:提高基于图像和文本生成3D模型的效率和质量

    3D内容生成框架DreamGaussian:提高基于图像和文本生成3D模型的效率和质量

    来自南洋理工大学、百度和北京大学的研究人员推出3D内容生成框架DreamGaussian,专门设计用于提高基于优化方法创建三维(3D)模型的效率和质量。该框架旨在解决当前从图像或文本快速生成高质量3D...
    新技术# 3D内容生成框架# DreamGaussian
    2年前
    05840
    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    Bounded Attention:解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战

    来自特拉维夫大学和Snap的研究人员推出Bounded Attention,它旨在解决文生图模型在生成包含多个主题(subjects)的图像时遇到的挑战。这些模型通常难以准确地捕捉到复杂输入提示中的意...
    新技术# Bounded Attention# 多主题# 文生图模型
    2年前
    05830
    LightIt:实现图像生成过程中的显式光照控制

    LightIt:实现图像生成过程中的显式光照控制

    来自慕尼黑大学和Adobe Research的研究人员推出LightIt,它能够对由扩散模型生成的图像进行明确的照明控制。研究人员提出了将生成过程与阴影和法线图相结合的新思路。在光照建模方面,采用了单...
    新技术# LightIt# 光照控制
    2年前
    05830
    3D重建技术MVD2:针对多视角扩散图像进行高效的三维形状重建

    3D重建技术MVD2:针对多视角扩散图像进行高效的三维形状重建

    来自清华大学和微软亚洲研究院的研究人员推出新型3D重建技术MVD2,它专门针对多视角扩散(Multiview Diffusion,简称MVD)图像进行高效的三维形状重建。 论文地址 MVD是一种新兴的...
    新技术# 3D重建技术# MVD2
    2年前
    05820
    动态视频模型DynamiCrafter:为静态图片添加动画效果

    动态视频模型DynamiCrafter:为静态图片添加动画效果

    来自香港中文大学、腾讯人工智能实验室、北京大学的研究人员推出动态视频模型DynamiCrafter,它是一个利用视频扩散模型(Video Diffusion Models)来为静态图片添加动画效果的工...
    新技术# DynamiCrafter# 视频模型
    2年前
    05820
    Ollama v0.7.0发布:添加新多模态模型引擎,多模态模型支持全面升级

    Ollama v0.7.0发布:添加新多模态模型引擎,多模态模型支持全面升级

    Ollama 最新发布的 v0.7.0 版本带来了对多模态模型的支持,标志着其在本地推理和模型集成能力上的重要突破。此次更新不仅扩展了视觉多模态模型的支持范围,还通过全新的多模态引擎提升了性能、准确性...
    早报# Ollama# 多模态模型# 多模态模型引擎
    11个月前
    05810
    腾讯推出多模态基础模型SEED-X:结合视觉和语言理解的能力,可以处理和生成各种类型的数据,包括图像和文本

    腾讯推出多模态基础模型SEED-X:结合视觉和语言理解的能力,可以处理和生成各种类型的数据,包括图像和文本

    腾讯AI实验室和ARC实验室共同开发的多模态基础模型SEED-X,这是一个先进的人工智能系统,它结合了视觉和语言理解的能力,可以处理和生成各种类型的数据,包括图像和文本。简单来说,SEED-X就像一个...
    新技术# SEED-X# 多模态基础模型
    2年前
    05810
    CameraCtrl:为文生视频模型提供精确的摄像机控制能力

    CameraCtrl:为文生视频模型提供精确的摄像机控制能力

    来自香港中文大学、上海人工智能实验室和斯坦福大学的研究人员推出CameraCtrl,它能够为文本到视频(Text-to-Video, T2V)生成模型提供精确的摄像机控制能力。在视频创作中,摄像机的移...
    新技术# CameraCtrl# 文生视频模型
    2年前
    05810
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Claude Managed Agents

    新Claude Managed Agents

    Claude Managed Agents是一组可用于大规模构建和部署智能体程序的API。它预先配置好了所需的各项功能:原生MCP接口、各种工具集成方案、内存资源等。无论您是要创建单任务处理程序,还是构建复杂的多智能体系统,都能轻松实现快速开发与部署。
    诗一

    诗一

    诗一收录超过 34 万首中国古诗词,涵盖唐诗、宋词、诗经、楚辞、古文观止等经典合集。所有内容均可在线免费阅读、搜索与赏析。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单