SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2625 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型文生图模型CountGen:根据文本提示准确地生成指定数量的对象

    新型文生图模型CountGen:根据文本提示准确地生成指定数量的对象

    巴伊兰大学、英伟达和特拉维夫大学的研究人员推出新型文生图模型CountGen,它能够根据文本提示准确地生成指定数量的对象。在以往的技术中,尽管文本到图像的扩散模型取得了巨大成功,但它们在控制生成图像中...
    新技术# CountGen# 文生图模型
    2年前
    05300
    埃隆·马斯克的Grok推出AI伴侣:可爱哥特风动漫女孩Ani和红色3D卡通狐狸Bad Rudy

    埃隆·马斯克的Grok推出AI伴侣:可爱哥特风动漫女孩Ani和红色3D卡通狐狸Bad Rudy

    埃隆·马斯克旗下的 AI 聊天机器人 Grok 迎来了新的功能更新 —— AI 伴侣角色。 这一新功能现已对 Grok 的订阅用户(SuperGrok,每月30美元)开放,首批角色包括: Ani:一位...
    早报# AI伴侣# Grok
    9个月前
    05290
    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    3D场景生成技术Invisible Stitch:生成平滑且连贯的3D场景,通过深度修复来改善场景的几何一致性

    牛津大学的研究人员推出一种新的3D场景生成技术Invisible Stitch,这项技术的目标是生成平滑且连贯的3D场景,特别是通过深度修复(depth inpainting)来改善场景的几何一致性...
    新技术# 3D场景生成# Invisible Stitch
    2年前
    05280
    图像修复模型InstructIR:按照人类指令进行高质量图像修复

    图像修复模型InstructIR:按照人类指令进行高质量图像修复

    来自维尔茨堡大学计算机视觉实验室、索尼PlayStation旗下FTG团队的研究人员推出一款图像修复模型InstructIR,它能够根据人类编写的指令来修复和增强图像。简单来说,一张因为雨滴而模糊的招...
    新技术# InstructIR# 图像修复模型
    2年前
    05280
    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    图像匹配框架MINIMA:解决跨视图和跨模态的情况下,多模态感知中的图像匹配问题

    华中科技大学和武汉大学的研究人员推出一个统一的图像匹配框架MINIMA,即模态不变图像匹配。这项研究旨在解决多模态感知中的图像匹配问题,特别是在跨视图和跨模态的情况下。例如,在自动驾驶中,需要将可见光...
    新技术# MINIMA# 图像匹配框架
    1年前
    05270
    一种无需额外训练和条件约束的新方法SEG:利用了自我注意力机制的能量视角来改进图像生成

    一种无需额外训练和条件约束的新方法SEG:利用了自我注意力机制的能量视角来改进图像生成

    高丽大学的研究人员推出一种无需额外训练和条件约束的新方法SEG(Smoothed Energy Guidance,平滑能量指导),它利用了自我注意力机制的能量视角来改进图像生成。例如,你有一个魔法画笔...
    新技术# SEG# 平滑能量指导
    2年前
    05260
    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...
    新技术# WikiAutoGen# 多模态# 维基百科
    1年前
    05250
    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    新型多模态图像生成系统MUMU:从文本和图像混合提示生成图像

    来自萨特希尔风险投资公司的研究人员推出新型多模态图像生成系统MUMU,MUMU的核心能力是从文本和图像混合提示(multimodal prompts)生成图像。简单来说,用户可以提供一些文本描述和参考...
    新技术# MUMU# 多模态图像生成
    2年前
    05250
    阿里推出高清长视频生成方法EasyAnimate:基于Transformer架构,能够高效地制作出高质量的视频内容

    阿里推出高清长视频生成方法EasyAnimate:基于Transformer架构,能够高效地制作出高质量的视频内容

    阿里推出先进视频生成方法EasyAnimate,它基于Transformer架构,能够高效地制作出高质量的视频内容,目前EasyAnimate已能展现出生成包含144帧视频的能力。例如,你想要制作一段...
    新技术# EasyAnimate# 长视频生成
    1年前
    05250
    controllable text-to-3D generation:根据文本提示和条件图像生成高质量、可控制的3D模型

    controllable text-to-3D generation:根据文本提示和条件图像生成高质量、可控制的3D模型

    来自浙江大学、西湖大学和同济大学的研究团队推出controllable text-to-3D generation,它能够根据文本提示和条件图像生成高质量、可控制的3D模型。这种方法的核心在于使用一种...
    新技术# 3D模型# controllable text-to-3D generation
    2年前
    05250
    新型3D生成模型VFusion3D:利用预训练的视频扩散模型来创建可扩展的3D生成模型

    新型3D生成模型VFusion3D:利用预训练的视频扩散模型来创建可扩展的3D生成模型

    来自Meta和牛津大学的研究团队推出新型3D生成模型VFusion3D,它利用预训练的视频扩散模型来创建可扩展的3D生成模型。这项技术的核心在于解决3D数据稀缺的问题,因为3D数据不像图片、文本或视频...
    新技术# 3D生成模型# VFusion3D
    2年前
    05250
    Gemini 全面升级:你的 AI 助手现在更懂你、更主动、更强

    Gemini 全面升级:你的 AI 助手现在更懂你、更主动、更强

    谷歌在 Google I/O 上正式宣布了 Gemini 应用的一系列重磅更新 ,从视觉交互、内容创作到深度研究、学习辅助全面升级。现在的 Gemini 不再只是一个被动回答问题的 AI 工具,而是一...
    早报# Gemini# 谷歌
    11个月前
    05230
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    MaxClaw

    MaxClaw

    Minimax 正式宣布对其 AI 智能体平台进行重大升级,推出 探索专家(Expert) 2.0 与 MaxClaw 两大核心功能。此次更新不仅大幅降低了专业智能体的创建门槛,更通过云端化部署解决了 OpenClaw 长期存在的“落地难”问题,标志着 AI 智能体从“极客玩具”向“大众生产力工具”的跨越。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单