SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2628 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    近年来,文本到3D生成器和3D扫描仪技术取得了显著进展,能够生成高质量的3D资产。然而,这些资产通常由单一的融合表示组成,例如隐式神经场、高斯混合或网格,缺乏任何有用的结构。这种单一表示方式使得资产难...
    新技术# 3D对象# PartGen
    1年前
    04770
    文本到纹理方法RoCoTex:用于生成高质量、一致性强的3D模型纹理

    文本到纹理方法RoCoTex:用于生成高质量、一致性强的3D模型纹理

    NCSOFT 图形 AI 实验室、韩国大学计算机科学与工程系和韩国中央大学图像系的研究人员推出一种稳健的文本到纹理方法RoCoTex,它是一种用于生成高质量、一致性强的3D模型纹理的方法。简单来说,R...
    新技术# 3D模型纹理# RoCoTex
    2年前
    04770
    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个...
    新技术# MotionClone# 视频生成
    2年前
    04770
    谷歌确认将在Windows 11的Chrome浏览器中集成Gemini,并预告重大AI升级

    谷歌确认将在Windows 11的Chrome浏览器中集成Gemini,并预告重大AI升级

    谷歌近日在反垄断诉讼中的一份幻灯片意外曝光了其在Windows平台上的AI战略蓝图。谷歌计划将 Gemini Live 集成到 Windows 11 和 Windows 10 的 Chrome 浏览器...
    百科# Gemini# Windows 11# 谷歌
    11个月前
    04750
    SAMPart3D:可扩展的零样本3D部件分割框架

    SAMPart3D:可扩展的零样本3D部件分割框架

    3D部件分割是3D感知中的一项关键任务,在机器人、3D生成和3D编辑等应用中发挥着重要作用。最近的方法利用强大的视觉语言模型(VLMs)进行2D到3D的知识蒸馏,实现了零样本的3D部件分割。然而,这些...
    新技术# 3D部件分割框架# SAMPart3D
    1年前
    04750
    新型视觉基础模型Lotus:使用扩散模型来生成高质量的密集预测结果

    新型视觉基础模型Lotus:使用扩散模型来生成高质量的密集预测结果

    香港科技大学(广州)、阿德莱德大学、诺亚方舟实验室和香港科技大学的研究人员推出新型视觉基础模型Lotus,它使用扩散模型来生成高质量的密集预测结果。简单来说,Lotus就像一个超级聪明的图像处理专家...
    新技术# Lotus# 视觉基础模型
    2年前
    04750
    月之暗面发布多模态思考模型 Kimi k1.5 ,实现 SOTA 级多模态推理能力

    月之暗面发布多模态思考模型 Kimi k1.5 ,实现 SOTA 级多模态推理能力

    月之暗面宣布推出 Kimi 的全新模型——k1.5 多模态思考模型。这款模型在多模态推理和通用推理能力上达到了 state-of-the-art(SOTA) 级别,标志着 AI 领域的又一次重大进步...
    早报# Kimi k1.5# 月之暗面
    1年前
    04740
    一步式文本到图像扩散模型SwiftBrush v2:通过优化训练方法和引入新的损失函数,来提高图像质量和文本图像对齐度

    一步式文本到图像扩散模型SwiftBrush v2:通过优化训练方法和引入新的损失函数,来提高图像质量和文本图像对齐度

    越南VinAI 研究和胡志明邮电技术学院的研究人员推出SwiftBrush v2,这是一个先进的文本到图像扩散模型,它通过优化训练方法和引入新的损失函数,比如“clamped CLIP loss”,来...
    新技术# SwiftBrush v2
    2年前
    04740
    数据生成管道Gen4Gen:创建高质量的个性化图像和文本描述

    数据生成管道Gen4Gen:创建高质量的个性化图像和文本描述

    来自加州大学伯克利分校、牛津大学、哈佛大学、卡耐基梅隆大学、香港大学、加州大学戴维斯分校的研究人员推出数据生成管道Gen4Gen,它用于创建一个名为MyCanvas的数据集,旨在提高文本到图像扩散模型...
    新技术# Gen4Gen# 数据生成管道
    2年前
    04730
    新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频

    新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频

    浙江大学、腾讯人工智能实验室和腾讯 PCG ARC 实验室的研究人员推出新型视频生成框架CustomCrafter,它可以根据文本提示和主题参考图像生成高质量视频。这项技术的目标是让用户能够自定义视频...
    新技术# CustomCrafter# 视频生成
    2年前
    04720
    警惕!谷歌 Gemini CLI 存在高危漏洞,可能被用于静默窃取敏感信息

    警惕!谷歌 Gemini CLI 存在高危漏洞,可能被用于静默窃取敏感信息

    一款旨在提升开发效率的 AI 编码工具,也可能成为攻击者入侵系统的跳板。 谷歌于 2025 年 6 月推出的 Gemini CLI——一款集成其最先进 Gemini 2.5 Pro 模型的命令行代码助...
    早报# Gemini CLI# 谷歌
    8个月前
    04710
    Ollama v0.10.0 发布:图形界面来了,还能“看”图了

    Ollama v0.10.0 发布:图形界面来了,还能“看”图了

    Ollama 正式发布 v0.10.0 版本,带来多项关键更新,显著提升了本地大模型的使用体验。最引人注目的是,此次更新首次引入了图形用户界面(GUI),不再局限于命令行操作,让非技术用户也能轻松上手...
    早报# Ollama# 图形界面
    8个月前
    04710
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    查看完整榜单