SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2607 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Follow-Your-Click:通过用户简单的点击和简短的动作提示来实现图像的局部动画化

    Follow-Your-Click:通过用户简单的点击和简短的动作提示来实现图像的局部动画化

    来自香港科大、腾讯浑源和清华大学的团队推出新颖框架Follow-Your-Click,它能够通过用户简单的点击和简短的动作提示来实现图像的局部动画化。 项目主页 GitHub 想象一下,你有一张静态图...
    新技术# Follow-Your-Click# 局部动画化
    2年前
    06740
    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    Gempix现身Whisk!谷歌测试基于Imagen 4的精准图像编辑功能

    据最新代码线索显示,谷歌正在为其AI图像工具 Whisk 测试一项名为 Gempix 的新功能,该功能可能代表基于 Imagen 4 的新一代图像编辑模型。 这一发现来自 Google Labs 实验...
    早报# Gempix# Imagen 4# Whisk
    8个月前
    06730
    零样本视频定制框架DreamVideo-2:根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

    零样本视频定制框架DreamVideo-2:根据单一图像和一系列界定框序列生成具有特定主题和运动轨迹的视频

    复旦大学、阿里巴巴、南洋理工大学和密歇根州立大学的研究人员推出一个零样本视频定制框架DreamVideo-2,能够根据单一图像和一系列界定框(bounding box)序列生成具有特定主题和运动轨迹的...
    新技术# DreamVideo-2# 视频定制
    1年前
    06730
    新型知识蒸馏方法DisBack:加速扩散模型的生成模型的采样速度

    新型知识蒸馏方法DisBack:加速扩散模型的生成模型的采样速度

    浙江大学、北京大学和阿里巴巴的研究人员推出新型知识蒸馏方法DisBack,它用于加速一类称为扩散模型(diffusion models)的生成模型的采样速度。扩散模型是当前非常热门的生成模型,能够生成...
    新技术# DisBack# 蒸馏方法
    2年前
    06720
    ProCreate:改善基于扩散的图像生成模型的样本多样性和创造性,并防止对训练数据的直接复制

    ProCreate:改善基于扩散的图像生成模型的样本多样性和创造性,并防止对训练数据的直接复制

    纽约大学的研究人员推出创新方法ProCreate,旨在改善基于扩散的图像生成模型的样本多样性和创造性,并防止对训练数据的直接复制。简而言之,ProCreate能够在生成图像的过程中,确保新生成的图像既...
    新技术# ProCreate
    2年前
    06720
    3D到3D生成方法ThemeStation:根据少量的示例生成具有一致主题的3D资源

    3D到3D生成方法ThemeStation:根据少量的示例生成具有一致主题的3D资源

    来自香港城市大学、上海AI实验室、南洋理工大学的研究团队推出3D到3D生成方法ThemeStation,它是一个能够根据少量的示例(exemplars)生成具有一致主题的3D资源的创新方法。其追求两个...
    新技术# 3D模型# ThemeStation
    2年前
    06720
    阿里云正式宣布通义灵码上线 Qwen3-Coder,免费使用不限量

    阿里云正式宣布通义灵码上线 Qwen3-Coder,免费使用不限量

    阿里云正式宣布,开源其最新一代AI编程大模型——Qwen3-Coder。这是阿里云在代码生成领域迄今最具突破性的成果,标志着国产AI编程能力迈入全球领先行列。 与此同时,阿里云旗下AI编程助手“通义灵...
    早报# Qwen3-Coder# 通义灵码# 阿里云
    8个月前
    06710
    新型实时文本驱动的说话头像生成框架OmniTalker :在零样本场景下同时生成同步的语音和说话头像视频,同时保留语音风格和面部风格

    新型实时文本驱动的说话头像生成框架OmniTalker :在零样本场景下同时生成同步的语音和说话头像视频,同时保留语音风格和面部风格

    阿里通义实验室推出新型实时文本驱动的说话头像生成框架OmniTalker ,能够在零样本(zero-shot)场景下同时生成同步的语音和说话头像视频,同时保留语音风格和面部风格。OmniTalker ...
    新技术# OmniTalker# 通义实验室
    1年前
    06700
    阿里巴巴Wanx 团队推出新型多模态生成模型ACE:可以根据文本指令来执行复杂的图像编辑和生成任务

    阿里巴巴Wanx 团队推出新型多模态生成模型ACE:可以根据文本指令来执行复杂的图像编辑和生成任务

    阿里巴巴Wanx 团队推出新型多模态生成模型ACE,这个模型的核心功能是处理和生成图像,但它与传统的图像处理工具不同,因为它可以根据文本指令来执行复杂的图像编辑和生成任务。例如,你是一名摄影师,你拍摄...
    新技术# ACE# 阿里巴巴
    1年前
    06700
    自回归技术StreamingT2V:能够创建具有丰富运动动力学的长视频,不会出现停滞现象

    自回归技术StreamingT2V:能够创建具有丰富运动动力学的长视频,不会出现停滞现象

    来自Picsart AI研究部门、得克萨斯大学奥斯汀分校、佐治亚理工学院和伊利诺伊大学厄巴纳-香槟分校的研究团队推出先进的自回归技术StreamingT2V,能够创建具有丰富运动动力学的长视频,不会出...
    新技术# StreamingT2V# 自回归技术
    2年前
    06690
    Ideogram推出角色一致性功能Ideogram Character,支持跨场景形象统一

    Ideogram推出角色一致性功能Ideogram Character,支持跨场景形象统一

    在数字创作中,角色是叙事的核心。然而,与真人演员不同,AI生成的角色往往难以“保持人设”——同一张脸,在不同场景中可能变成另一个人。缺乏一致性,故事便失去了连贯的锚点。 现在,这个问题有了新的解法。 ...
    早报# Ideogram# Ideogram Character# 角色一致性
    8个月前
    06680
    多模态框架FakeShield:通过多模态大语言模型评估图像的真实性,用于检测AI及PS图片

    多模态框架FakeShield:通过多模态大语言模型评估图像的真实性,用于检测AI及PS图片

    生成式AI的快速发展为内容创作带来了巨大便利,但同时也使得图像篡改变得更加容易且难以检测。当前的图像伪造检测和定位(IFDL)方法虽然通常有效,但仍面临两大挑战: 黑箱性质:检测原理未知,难以理解和解...
    新技术# FakeShield# 多模态框架
    1年前
    06680
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    查看完整榜单