SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2230 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    北京大学和加州大学洛杉矶分校的研究人员推出MineStudio,这是一个用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包。它通过整合七个关键工程组件(模拟器、数据、模型、离线预训练...
    新技术# MineStudio# 我的世界
    9个月前
    03830
    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack

    韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...
    新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院
    9个月前
    03820
    新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制

    新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制

    韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用DiT实现了无需训练的空间定位能力,用于在文本到图像生成中实现更精细的用户控制。这项技术特别关注于在图像生成...
    新技术# GrounDiT# 文生图模型
    1年前
    03810
    ReCapture:从单个用户视频生成具有新颖摄像机轨迹的新视频

    ReCapture:从单个用户视频生成具有新颖摄像机轨迹的新视频

    最近的视频建模技术取得了显著进展,使得在生成的视频中可以控制摄像机轨迹。然而,这些方法通常不能直接应用于用户提供的视频,因为这些视频不是由视频模型生成的。为了解决这一问题,谷歌和新加坡国立大学的研究人...
    新技术# ReCapture# 摄像机轨迹
    1年前
    03790
    Golden Noise:将随机的高斯噪声转换成能够生成更高质量、与文本提示更匹配的图像的“黄金噪声”

    Golden Noise:将随机的高斯噪声转换成能够生成更高质量、与文本提示更匹配的图像的“黄金噪声”

    香港科技大学(广州)、穆罕默德·本·扎耶德人工智能大学和香港浸会大学的研究人员推出一种名为“Golden Noise for Diffusion Models”的学习框架,旨在提高文生图模型的性能。这...
    新技术# Golden Noise# 黄金噪声
    1年前
    03780
    SAMPart3D:可扩展的零样本3D部件分割框架

    SAMPart3D:可扩展的零样本3D部件分割框架

    3D部件分割是3D感知中的一项关键任务,在机器人、3D生成和3D编辑等应用中发挥着重要作用。最近的方法利用强大的视觉语言模型(VLMs)进行2D到3D的知识蒸馏,实现了零样本的3D部件分割。然而,这些...
    新技术# 3D部件分割框架# SAMPart3D
    1年前
    03780
    ITACLIP:通过图像、文本和架构增强提升无需训练的语义分割

    ITACLIP:通过图像、文本和架构增强提升无需训练的语义分割

    近年来,基础视觉语言模型(VLMs)的发展彻底改变了计算机视觉领域的研究方向。这些模型,尤其是 CLIP,不仅推动了开放词汇计算机视觉任务的研究,还在多个领域取得了显著成果。然而,尽管 VLMs 在开...
    新技术# ITACLIP# 语义分割
    1年前
    03770
    Visual SKETCHPAD 框架:为多模态语言模型提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理

    Visual SKETCHPAD 框架:为多模态语言模型提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理

    华盛顿大学、艾伦人工智能研究所和宾夕法尼亚大学的研究人员推出Visual SKETCHPAD 框架,为多模态语言模型(LMs)提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理。这...
    新技术# Visual SKETCHPAD# 多模态语言模型# 草图板
    8个月前
    03760
    OpenAI调整路线图:推迟GPT-5,推出o3和o4-mini

    OpenAI调整路线图:推迟GPT-5,推出o3和o4-mini

    OpenAI在AI模型开发领域的每一步都备受关注。今年2月,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)曾透露了其AI模型的未来路线图,引发了广泛讨论。然而,最近萨姆·奥尔特曼宣布了计...
    早报# GPT-4.5# o3# o4-mini
    9个月前
    03750
    华为仓颉智能体开发框架Cangjie Magic正式开源

    华为仓颉智能体开发框架Cangjie Magic正式开源

    3月14日,华为仓颉社区正式发布了 Cangjie Magic,一款基于仓颉编程语言原生构建的 LLM(大语言模型)智能体(Agent)开发框架。这一框架通过三大核心技术突破,重新定义了智能体开发的范...
    早报# Cangjie Magic# 仓颉智能体# 华为
    9个月前
    03750
    字节跳动推出人像动画技术X-Portrait 2:创建富有表现力和逼真的角色动画和视频素材

    字节跳动推出人像动画技术X-Portrait 2:创建富有表现力和逼真的角色动画和视频素材

    人像动画技术提供了一种超低成本且高效的方式,用于创建富有表现力和逼真的角色动画和视频素材。用户只需提供一个静态人像图像和一个驱动表演视频,模型就可以使用这些输入生成视频,通过将驱动表情转移到人像中的主...
    新技术# X-Portrait 2# 人像动画# 字节跳动
    1年前
    03750
    Pony系列模型V7版本,将带来诸多令人期待的改进和新功能

    Pony系列模型V7版本,将带来诸多令人期待的改进和新功能

    Pony系列模型一直以来都是基于SDXL微调的热门绘画模型,尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今,V7版本的消息传来,带来了诸多令人期待的改进和新...
    早报# Pony
    9个月前
    03740
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    OpenSkills

    OpenSkills

    OpenSkills 是 Anthropic的 Claude Skills 系统的开源实现。它让 Cursor、Windsurf、Aider 等主流 AI 编码代理也能使用与 Claude Code 完全兼容的技能系统——相同的提示格式、相同的文件结构、相同的渐进式披露机制,只是调用方式从内置工具变为 CLI 命令。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    查看完整榜单