SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2250 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    AnyStory:用于文本到图像生成的统一单主体和多主体个性化框架,生成具有特定主体的高保真个性化图像

    阿里巴巴通义实验室推出一个用于文本到图像生成的统一单主体和多主体个性化框架AnyStory,旨在生成具有特定主体的高保真个性化图像,无论是单个主体还是多个主体,都能在不牺牲主体保真度的情况下实现个性化...
    新技术# AnyStory
    12个月前
    02100
    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    交互式图像编辑工具FramePainter:利用视频扩散先验来增强图像编辑的能力

    哈尔滨工业大学和华为诺亚方舟实验室的研究人员推出交互式图像编辑工具FramePainter,它利用视频扩散先验(video diffusion priors)来增强图像编辑的能力。FramePaint...
    新技术# FramePainter# 交互式图像编辑
    12个月前
    02380
    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    腾讯推出音乐生成框架XMusic:支持多种输入形式(图像、视频、文本、标签和哼唱)生成音乐

    在 AI 生成内容的领域中,音乐创作一直未能跟上视觉和文本内容的步伐。如今,腾讯推出的 XMusic 框架有望改变这一现状,通过情感可控、高质量的音乐创作,为创意应用带来新的可能性。 项目主页:htt...
    新技术# XMusic
    12个月前
    02080
    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    通用视频人脸恢复的统一框架SVFR:用于解决视频中的人脸恢复问题

    厦门大学多媒体可信感知与高效计算教育部重点实验室和腾讯优图实验室的研究人员推出人脸恢复统一框架SVFR,用于解决视频中的人脸恢复问题。人脸恢复(Face Restoration, FR)是图像和视频处...
    新技术# SVFR# 人脸恢复
    12个月前
    02350
    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    VisionReward:用于图像和视频生成的细粒度多维度人类偏好学习框架

    清华大学和智谱AI的研究人员推出VisionReward,这是一个用于图像和视频生成的细粒度多维度人类偏好学习框架。VisionReward通过构建一个细粒度且多维度的奖励模型,将人类对图像和视频的偏...
    新技术# VisionReward
    12个月前
    03150
    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    Ingredients:将多个特定身份(ID)的照片与视频生成模型结合,实现定制化的视频创作

    昆仑万维的研究人员推出一个强大的框架 Ingredients,通过将多个特定身份(ID)的照片与视频扩散变换器(Video Diffusion Transformers)结合,实现定制化的视频创作。该...
    新技术# Ingredients
    12个月前
    02490
    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    单步扩散模型 DepthMaster:将扩散模型应用于单目深度估计

    中国科学技术大学和vivo移动通信有限公司的研究人员推出一种单步扩散模型 DepthMaster,,旨在将扩散模型应用于单目深度估计(Monocular Depth Estimation, MDE...
    新技术# DepthMaster# 单目深度
    12个月前
    02520
    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    Meta和耶路撒冷希伯来大学的研究人员推出图生视频框架Through-The-Mask,旨在将静态图像转换为基于文本描述的真实视频序列。该框架通过引入基于掩码的运动轨迹作为中间表示,能够准确地动画化多...
    新技术# Through-The-Mask# 图生视频
    12个月前
    02960
    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...
    新技术# GS-DiT# 视频生成
    12个月前
    03260
    高保真面部表情编辑框架MagicFace:通过控制面部动作单元的变化来实现对特定人物面部表情的精细编辑

    高保真面部表情编辑框架MagicFace:通过控制面部动作单元的变化来实现对特定人物面部表情的精细编辑

    芬兰奥卢大学信息技术与电气工程学院机器视觉与信号分析中心和东南大学生物科学与医学工程学院儿童发展与学习科学教育部重点实验室的研究人员推出高保真面部表情编辑框架MagicFace,它通过控制面部动作单元...
    新技术# MagicFace# 面部表情编辑
    12个月前
    02300
    Magic Mirror框架:生成具有身份保持(ID-Preserved)和动态运动的高质量视频

    Magic Mirror框架:生成具有身份保持(ID-Preserved)和动态运动的高质量视频

    香港中文大学、香港科技大学、思谋科技和卡内基梅隆大学的研究人员推出Magic Mirror框架,旨在生成具有身份保持(ID-Preserved)和动态运动的高质量视频。尽管视频扩散模型在文本到视频生成...
    新技术# Magic Mirror
    12个月前
    02470
    PPTAgent:根据文档自动化地生成高质量的演示文稿

    PPTAgent:根据文档自动化地生成高质量的演示文稿

    中国科学院软件研究所中文信息处理实验室、中国科学院大学和上海捷信科技有限公司的研究人员推出新型框架PPTAgent,旨在自动化地生成高质量的演示文稿。与传统的文本到幻灯片的转换方法不同,PPTAgen...
    新技术# PPTAgent
    4周前
    02260
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Nano Banana Browser

    Nano Banana Browser

    用 Nano Banana 扩展改造你的网页浏览体验!这个有趣且创新的 Chrome 扩展使用 AI 技术,将你的脸插入到你在网页浏览时遇到的任何图像中。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    alphaXiv

    alphaXiv

    作为 arxiv labs 的官方产品,alphaXiv 不仅整合了 arXiv 的论文内容和开放的评论系统,还引入了先进的 AI 功能。用户不仅可以针对某篇论文进行问答,还可以通过 @ 引用其他论文的章节,类似于 AI 代码编辑器 Cursor 中 @ 引用其他代码文件或方法,这种创新的交互方式极大地丰富了学术讨论的形式。
    flolife.me

    flolife.me

    Flowith 团队利用 Nano Banana 的模型,结合自己的自由画布,打造出了一款独特的人生模拟器。你只需上传头像,就能看到自己从 8 岁到 80 岁可能经历的精彩(甚至有些离谱)人生。只要输入姓名,并完成初始角色设定,就能生成属于自己的人生模拟小故事。先起个满意的名字,接着分配好自己在健康、财富、家庭、智慧等方面的点数,然后上传个人照片,稍作等待,就能看到自己的模拟人生路径啦!
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单