SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    虚拟脱衣TryOffAnyone:从穿着服装的人身上生成高保真平铺服装图像

    虚拟脱衣TryOffAnyone:从穿着服装的人身上生成高保真平铺服装图像

    多伦多大学和帕特雷大学的研究人员推出TryOffAnyone,这是一个从穿着服装的人身上生成高保真平铺服装图像的技术。这项技术对于时尚行业来说非常重要,因为它可以增强在线购物体验,提供个性化推荐、服装...
    新技术# TryOffAnyone# 虚拟脱衣
    11个月前
    07810
    视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型

    视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型

    上海人工智能实验室、马克斯普朗克信息研究所和南洋理工大学的研究人员推出视频流翻译方法Live2Diff(LIVE2DIFF),它利用了单向注意力机制在视频扩散模型中,专门为直播视频流设计。这种方法的核...
    新技术# Live2Diff# 直播
    1年前
    07780
    EmoKnob:允许在语音合成中对任意情感进行细粒度控制的框架

    EmoKnob:允许在语音合成中对任意情感进行细粒度控制的框架

    哥伦比亚大学的研究人员推出一个允许在语音合成中对任意情感进行细粒度控制的框架EmoKnob,它用于提升语音克隆技术,只需少量示 范样本,允许用户在语音合成中精细控制情感及其强度。简单来说,EmoKno...
    新技术# EmoKnob# 语音克隆
    1年前
    07770
    清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频

    清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频

    清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人类视频的4D扩散变换器(4D Diffusion Transformer)。这项技术可以从单张图片生成逼真的人类动...
    新技术# Human4DiT# 新畅元科技# 清华大学
    2年前
    07740
    新型自编码器LiteVAE:用于提高图像生成模型中的效率和性能

    新型自编码器LiteVAE:用于提高图像生成模型中的效率和性能

    来自苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出新型自编码器LiteVAE,它被设计用于提高图像生成模型中的效率和性能。自编码器是一类神经网络,它们通过学习数据的压缩表示来重构数据。在图像处理中...
    新技术# LiteVAE# 自编码器
    2年前
    07710
    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    新型3D生成算法MicroDreamer:能够在大约20秒内生成高质量的3D模型,而无需任何3D数据

    来自中国人民大学、清华大学和快手的研究人员推出新型3D生成算法MicroDreamer,它能够在大约20秒内生成高质量的3D模型,而无需任何3D数据。这项技术基于一种称为“基于分数的迭代重建”(Sco...
    新技术# 3D生成算法# MicroDreamer
    2年前
    07690
    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    用于视频合成的交互式工具Image Conductor:让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

    北京大学、腾讯PCG ARC实验室、南洋理工大学、 清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor,它是一种用于视频合成的交互式工具,能够让用户对视频内容中的相机运...
    新技术# Image Conductor# 视频合成
    1年前
    07680
    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    华东师范大学和阿里巴巴的研究人员推出新型视频合成模型扩展方法ExVideo,这种方法旨在通过参数高效的方式对现有的视频合成模型(Stable Video Diffusion)进行后期调整(post-t...
    新技术# ExVideo# SVD模型
    1年前
    07680
    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    图像高清修复技术SUPIR:将低质量图像提升到高质量水平

    来自中国科学院深圳先进技术学院、上海AI实验室、悉尼大学、香港理工大学、,腾讯PCG ARC实验室、香港中文大学的研究人员推出图像高清修复技术SUPIR(Scaling-UP Image Restor...
    新技术# SUPIR# 高清修复
    2年前
    07660
    全新生成模型StableIdentity:只需一张人脸照片,快速生成不同风格的人物照片、视频

    全新生成模型StableIdentity:只需一张人脸照片,快速生成不同风格的人物照片、视频

    来自大连理工大学、ZMO AI的研究人员提出了一种全新的图像、视频和3D定制生成模型StableIdentity,它能够将任何人的面部特征稳定地融入到各种不同的场景中。这项技术的核心在于,它能够通过一...
    新技术# StableIdentity# 生成模型
    2年前
    07660
    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    弱监督方法CatLIP:用于在互联网规模的图像-文本数据上预训练视觉模型

    苹果推出新颖的弱监督方法CatLIP(Categorical Loss for Image-text Pre-training),旨在提高图像和文本数据集上的视觉模型预训练效率,同时保持与现有的对比学...
    新技术# CatLIP# CLIP# 弱监督
    2年前
    07650
    LaVi-Bridge:将不同的语言模型和生成视觉模型结合起来,用于文生图

    LaVi-Bridge:将不同的语言模型和生成视觉模型结合起来,用于文生图

    来自香港大学、香港中文大学、香港科技大学的研究团队推出LaVi-Bridge,它能够将不同的语言模型和生成视觉模型结合起来,用于文本到图像的生成任务。通过利用LoRA和适配器技术,LaVi-Bridg...
    新技术# LaVi-Bridge# 文生图
    2年前
    07650
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    查看完整榜单