SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    多智能体协作框架 FILMAGENT:通过大语言模型实现虚拟 3D 空间中的端到端电影自动化制作

    多智能体协作框架 FILMAGENT:通过大语言模型实现虚拟 3D 空间中的端到端电影自动化制作

    哈尔滨工业大学(深圳)和清华大学的研究人员推出多智能体协作框架 FILMAGENT,旨在通过大语言模型(LLMs)实现虚拟 3D 空间中的端到端电影自动化制作。该框架模拟了电影制作中的各种角色(如导演...
    新技术# FILMAGENT# 电影
    12个月前
    02540
    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份...
    新技术# EchoVideo# 视频生成
    12个月前
    02510
    1Prompt1Story:解决文生图模型生成中的一致性问题

    1Prompt1Story:解决文生图模型生成中的一致性问题

    南开大学、巴塞罗那自治大学计算机视觉中心、穆罕默德·本·扎耶德人工智能大学,林雪平大学和软银的研究人员推出1Prompt1Story,旨在解决文本到图像(Text-to-Image,T2I)生成中的一...
    新技术# 1Prompt1Story
    12个月前
    02310
    基于扩散模型的视频修复方法DiffuEraser:分解视频修复任务为子问题并给出解决方案

    基于扩散模型的视频修复方法DiffuEraser:分解视频修复任务为子问题并给出解决方案

    阿里巴巴通义实验室的研究人员推出一种基于扩散模型的视频修复方法DiffuEraser,能够生成更详细、更连贯的结构,并通过引入先验信息和优化时间一致性来提升性能。比如,在一段视频中,如果某个物体被意外...
    新技术# DiffuEraser# 视频修复
    12个月前
    02910
    思维链推理策略在自回归图像生成中的应用潜力

    思维链推理策略在自回归图像生成中的应用潜力

    香港中文大学、北京大学和上海人工智能实验室的研究人员探索思维链(Chain-of-Thought, CoT)推理策略在自回归图像生成中的应用潜力。思维链是一种通过逐步分解复杂问题来解决问题的策略,在语...
    新技术# 思维链
    12个月前
    02450
    基于扩散模型的新型零样本人像视频动画生成技术X-Dyna

    基于扩散模型的新型零样本人像视频动画生成技术X-Dyna

    南加州大学、字节跳动公司、斯坦福大学、加州大学洛杉矶分校和加州大学圣地亚哥分校的研究团队推出一种新型的零样本(zero-shot)人像视频动画生成技术X-Dyna,基于扩散模型(diffusion-b...
    新技术# X-Dyna# 人像视频动画
    12个月前
    02650
    Textoon:基于文本描述生成Live2D格式2D卡通角色的创新方法

    Textoon:基于文本描述生成Live2D格式2D卡通角色的创新方法

    在数字角色创作领域,2D卡通风格因其独特的魅力而深受年轻观众的喜爱。尽管3D角色研究取得了显著进展,但交互式2D卡通角色的发展却显得相对滞后。为了解决这一问题,阿里巴巴通义实验室推出了Textoon...
    新技术# Live2D# Textoon
    12个月前
    03400
    NeuralSVG:用于从文本提示生成矢量图形

    NeuralSVG:用于从文本提示生成矢量图形

    特拉维夫大学和麻省理工学院的研究人员推出了一种名为 NeuralSVG 的新方法,用于从文本提示生成矢量图形(SVG)。该方法通过隐式神经表示(NeRFs)和分数蒸馏采样(SDS)技术,生成具有层次结...
    新技术# NeuralSVG
    12个月前
    02810
    micro_diffusion :一种低成本训练文生图模型的方法

    micro_diffusion :一种低成本训练文生图模型的方法

    索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe...
    新技术# micro_diffusion# 文生图模型
    12个月前
    04010
    实时动画生成系统RAIN:能够使用单个 RTX 4090实时生成无限长的视频流

    实时动画生成系统RAIN:能够使用单个 RTX 4090实时生成无限长的视频流

    中国科技大学的研究人员推出实时动画生成系统RAIN,能够使用单个 RTX 4090实时生成无限长的视频流。该系统的核心目标是解决现有扩散模型在实时动画生成中的局限性,例如延迟高、视觉质量下降以及无法长...
    新技术# RAIN# 动画生成
    12个月前
    02480
    新型虚拟试穿方法MN-VTON:通过单个生成网络实现高质量的虚拟试穿效果,挑战了当前依赖双网络范式的主流方法

    新型虚拟试穿方法MN-VTON:通过单个生成网络实现高质量的虚拟试穿效果,挑战了当前依赖双网络范式的主流方法

    虚拟试穿(VTON)作为电子商务领域的一项关键技术,能够帮助消费者真实地预览服装在自己身上的效果。然而,早期的VTON技术受限于单一生成网络,在保留细粒度的服装细节方面存在不足。为了解决这个问题,研究...
    新技术# MN-VTON# 虚拟试衣
    12个月前
    03250
    多实例生成方法3DIS-FLUX:利用最新的FLUX模型进行渲染,以实现更高质量的图像生成和更强的控制能力

    多实例生成方法3DIS-FLUX:利用最新的FLUX模型进行渲染,以实现更高质量的图像生成和更强的控制能力

    浙江大学和哈佛大学的研究人员推出多实例生成(Multi-Instance Generation)方法3DIS-FLUX,用于文本到图像生成。3DIS-FLUX是3DIS框架的扩展,利用最新的FLUX模...
    新技术# 3DIS-FLUX# 多实例生成
    1年前
    02620
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    MiroFish

    MiroFish

    MiroFish 是一款基于多智能体技术的新一代 AI 预测引擎。通过提取现实世界的种子信息(如突发新闻、政策草案、金融信号),自动构建出高保真的平行数字世界。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    AI-Paperless

    AI-Paperless

    AI-Paperless是基于卓越的开源文档管理系统 paperless-ngx 深度二次开发,创新性地融合了 大语言模型(LLM) 与 视觉模型(VLM) 等先进 AI 能力。目标是打造一个功能更强大、交互更智能、管理更高效的智能文档知识库,让您的文档真正实现深度理解与高效利用。
    查看完整榜单