SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2252 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型图像编辑框架DesignEdit:实现精确的空间感知图像编辑

    新型图像编辑框架DesignEdit:实现精确的空间感知图像编辑

    微软亚洲研究院和北京大学的研究人员推出新型图像编辑框架DesignEdit,它能够实现精确的空间感知图像编辑。开发团队借鉴了设计领域的图层概念,通过灵活应用多种操作来操控图像中的对象。我们的核心思想是...
    新技术# DesignEdit# 图像编辑
    2年前
    06090
    新型文本到图像生成框架InstantStyle:在生成图像时保持一致的风格

    新型文本到图像生成框架InstantStyle:在生成图像时保持一致的风格

    InstantX团队推出新型文本到图像生成框架InstantStyle,它专注于在生成图像时保持一致的风格。它通过简化风格迁移的过程,使得普通用户和专业人士都能够轻松地创造具有一致风格的图像。 项目主...
    新技术# InstantStyle# 风格
    2年前
    06410
    新型图像生成模型VAR:基于Transformer的自回归模型

    新型图像生成模型VAR:基于Transformer的自回归模型

    来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR(Visual Autoregressive Modeling,“视觉自回归建模”),VAR模型是一种基于Transformer的自回归(au...
    新技术# VAR模型
    2年前
    06090
    TGATE:减少不必要的计算来提高效率,同时保持生成图像的质量

    TGATE:减少不必要的计算来提高效率,同时保持生成图像的质量

    来自阿卜杜拉国王科技大学、新加坡国立大学和瑞士人工智能实验室的研究人员推出一种简单且无需训练的方法TGATE,通过减少不必要的计算来提高效率,同时保持生成图像的质量,这对于各种需要快速高质量图像生成的...
    新技术# TGATE
    2年前
    05510
    新型框架CSD:理解和从图像中提取风格描述符,可以实现对图像风格的检索、归因和匹配

    新型框架CSD:理解和从图像中提取风格描述符,可以实现对图像风格的检索、归因和匹配

    来自纽约大学、埃利斯研究所、马里兰大学帕克分校的研究人员推出新型框架CSD,旨在理解和从图像中提取风格描述符,可以实现对图像风格的检索、归因和匹配,特别适用于Stable Diffusion模型。 G...
    新技术# CSD# 图像风格
    2年前
    06260
    CameraCtrl:为文生视频模型提供精确的摄像机控制能力

    CameraCtrl:为文生视频模型提供精确的摄像机控制能力

    来自香港中文大学、上海人工智能实验室和斯坦福大学的研究人员推出CameraCtrl,它能够为文本到视频(Text-to-Video, T2V)生成模型提供精确的摄像机控制能力。在视频创作中,摄像机的移...
    新技术# CameraCtrl# 文生视频模型
    2年前
    05740
    3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合

    3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合

    来自斯坦福大学、谷歌研究、图宾根大学和Stability AI的研究人员推出3D Congealing,这是一种新颖的3D感知图像对齐技术,用于处理捕捉语义相似对象的2D图像集合。 项目主页 论文 简...
    新技术# 3D Congealing
    2年前
    04470
    条件感知神经网络CAN:用于在图像生成模型中添加控制

    条件感知神经网络CAN:用于在图像生成模型中添加控制

    来自麻省理工学院、清华大学和英伟达的研究人员推出一种条件感知神经网络(CAN),用于在图像生成模型中添加控制,它通过动态调整神经网络的权重来实现对生成图像的控制。 论文 GitHub 与之前的条件控制...
    新技术# CAN# 条件感知神经网络
    2年前
    06780
    FlexiDreamer:从单张图片生成三维(3D)模型

    FlexiDreamer:从单张图片生成三维(3D)模型

    来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer,它能够从单张图片生成三维(3D)模型。 项目主页 GitHub 例如,你有一张你喜欢的动漫角色的照片,F...
    新技术# 3D生成模型# FlexiDreamer
    2年前
    05780
    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    SPRIGHT T2I:改进文生图模型在生成图像时保持空间一致性的能力

    来自亚利桑那州立大学、英特尔实验室、Hugging Face和华盛顿大学的研究人员推出SPRIGHT T2I,探讨如何改进文生图(Text-to-Image,简称T2I)模型在生成图像时保持空间一致性...
    新技术# SPRIGHT T2I# 文生图模型
    2年前
    09150
    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    新型视图合成技术InstantSplat:在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重建和渲染出新视角的3D场景

    来自德克萨斯大学奥斯汀分校、英伟达、厦门大学、佐治亚理工学院、斯坦福大学和南加州大学推出新型视图合成技术InstantSplat,它能够在极短的时间内(大约40秒)从稀疏的、没有相机姿态信息的图像中重...
    新技术# 3D场景# InstantSplat
    2年前
    01,0030
    【AI周报】openAI取消GPT 4使用时3 小时 40条的限制

    【AI周报】openAI取消GPT 4使用时3 小时 40条的限制

    1、openAI取消GPT 4使用时3 小时 40条的限制 GPT 4取消了3 小时 40条的限制,可以无限量使用,这是因为竞争加剧还是因为GPT 5要来了呢? 2、OpenAI首推语音引擎 用15秒...
    早报# DBRX# Jamba# OpenAI
    2年前
    07150
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单