SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    百科

    共 2607 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    基于身份条件的人脸基础模型Arc2Face:能够根据一个人的面部特征生成高质量的、逼真的图像

    基于身份条件的人脸基础模型Arc2Face:能够根据一个人的面部特征生成高质量的、逼真的图像

    来自英国伦敦帝国理工学院的研究人员推出基于身份条件的人脸基础模型Arc2Face,能够根据一个人的面部特征生成高质量的、逼真的图像。 项目主页 GitHub Demo 模型 想象一下,如果你有一张朋友...
    新技术# Arc2Face
    2年前
    06910
    Search_T2V:改善文本到视频合成的质量和真实感

    Search_T2V:改善文本到视频合成的质量和真实感

    浙江大学、飞步科技、宁波港和腾讯数据平台的研究人员推出新技术Search_T2V,旨在改善文本到视频(Text-to-Video, T2V)合成的质量和真实感。该技术通过搜索现有的视频资源作为运动先验...
    新技术# Search_T2V# 文生视频模型
    2年前
    06900
    字节跳动推出数据集COCONut,专门针对图像分割任务

    字节跳动推出数据集COCONut,专门针对图像分割任务

    字节跳动推出数据集COCONut,它是对现有的COCO数据集的现代化升级,专门针对图像分割任务。图像分割是计算机视觉中的一个核心问题,它的目标是将图像中的每个像素正确地分类到不同的实例或类别中,此数据...
    新技术# COCONut# 图像分割# 字节跳动
    2年前
    06900
    StereoCrafter框架:用于将单目(2D)视频转换为沉浸式立体 3D 视频,以满足人们对沉浸式数字体验的需求

    StereoCrafter框架:用于将单目(2D)视频转换为沉浸式立体 3D 视频,以满足人们对沉浸式数字体验的需求

    腾讯AI实验室和腾讯PCG ARC Lab的研究人员推出StereoCrafter框架,用于将单目视频转换为沉浸式立体 3D 视频,以满足人们对沉浸式数字体验的需求。该框架主要解决了传统 2D-to...
    新技术# StereoCrafter
    1年前
    06890
    AI视频生成新模型CONSISTI2V:通过增强视觉一致性来改善视频生成的质量

    AI视频生成新模型CONSISTI2V:通过增强视觉一致性来改善视频生成的质量

    来自滑铁卢大学、Vector Institute、Harmony.AI、多模式艺术投影研究社区的研究人员提出了一种基于扩散的图像到视频生成新方法CONSISTI2V,它旨在通过增强视觉一致性来改善视频...
    新技术# AI视频生成# CONSISTI2V
    2年前
    06880
    阿里云无影AgentBay发布,5分钟搭建高并发Agent环境

    阿里云无影AgentBay发布,5分钟搭建高并发Agent环境

    4月9日,阿里云无影正式推出国内首个支持MCP协议的云电脑服务——AgentBay。这一创新服务让开发者能够通过云端一键生成专属的AI运行环境,动态调用云上算力、存储及工具链资源,彻底突破本地设备的性...
    早报# AgentBay# 无影# 阿里云
    1年前
    06860
    文本到3D生成模型VP3D:通过利用2D视觉提示来增强3D模型的视觉真实感

    文本到3D生成模型VP3D:通过利用2D视觉提示来增强3D模型的视觉真实感

    来自HiDream.ai和复旦大学的研究人员推出新型文本到3D生成模型VP3D,它通过利用2D视觉提示来增强3D模型的视觉真实感。在以往的研究中,虽然已经有了一些能够从文本生成3D模型的技术,但这些技...
    新技术# 3D生成模型# VP3D
    2年前
    06860
    全新LoRA训练方法ADDifT(交替直接差分训练)

    全新LoRA训练方法ADDifT(交替直接差分训练)

    背景与动机 LoRA(低秩适应)是一种参数高效的微调技术,广泛用于大语言模型和扩散模型(如Stable Diffusion)的定制化训练。然而,传统LoRA训练方法存在效率低和易学到无关特征(如背景或...
    新技术# ADDifT# Lora# LoRA模型
    1年前
    06840
    AutoVFX:基于自然语言指令的自动视觉效果生成

    AutoVFX:基于自然语言指令的自动视觉效果生成

    现代视觉效果(VFX)软件使熟练的艺术家能够创造出几乎任何图像,但创作过程仍然费力、复杂,并且对普通用户来说基本上是不可访问的。为了简化这一过程,伊利诺伊大学厄巴纳-香槟分校的研究人员提出了AutoV...
    新技术# AutoVFX
    1年前
    06840
    快速视频生成方法AnimateLCM:只需四步推理就可以生成视频

    快速视频生成方法AnimateLCM:只需四步推理就可以生成视频

    来自香港中文大学、Avolution AI、上海人工智能实验室、商汤科技研究院的研究人员推出快速视频生成方法AnimateLCM,该方法利用一致性学习策略,将图像生成先验和运动生成先验进行解耦,从而提...
    新技术# AI视频生成# AnimateLCM
    2年前
    06830
    新型单视图3D重建方法FDGaussian:能够从2D输入中提取出3D几何特征,从而生成一致的多视图图像

    新型单视图3D重建方法FDGaussian:能够从2D输入中提取出3D几何特征,从而生成一致的多视图图像

    来自复旦大学的研究团队推出新型单视图3D重建方法FDGaussian,它采用正交平面分解机制,能够从2D输入中提取出3D几何特征,从而生成一致的多视图图像。 项目主页 论文地址 想象一下,你只有一张物...
    新技术# 3D重建# FDGaussian
    2年前
    06820
    新型生成模型DisCo-Diff:用于增强连续扩散模型的性能

    新型生成模型DisCo-Diff:用于增强连续扩散模型的性能

    英伟达和麻省理工学院的研究人员推出新型生成模型DisCo-Diff,它用于增强连续扩散模型(Diffusion Models, DMs)的性能。扩散模型是一种强大的数据生成方法,但它们通常需要将复杂的...
    新技术# DisCo-Diff# 生成模型
    2年前
    06810
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    查看完整榜单