SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作

    针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作

    韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该技术能有效抵抗姿态估计错误,并在时间维度上保持连贯。这是一个关于如何让静态图片中的人体动作起来的研究,具体来说,就...
    新技术# TCAN# 人像图像动画
    2年前
    07930
    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变

    大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...
    新技术# Noise Calibration# 噪声校准# 视频增强技术
    2年前
    07930
    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型

    Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...
    新技术# E2GAN# 生成对抗网络(GAN)模型
    2年前
    04950
    视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型

    视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型

    上海人工智能实验室、马克斯普朗克信息研究所和南洋理工大学的研究人员推出视频流翻译方法Live2Diff(LIVE2DIFF),它利用了单向注意力机制在视频扩散模型中,专门为直播视频流设计。这种方法的核...
    新技术# Live2Diff# 直播
    2年前
    08720
    基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事

    基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事

    香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模态大语言模型SEED-Story,它能够根据用户提供的文本和图片生成长篇的多模态故事。这些故事不仅包含丰富的叙事文本,还包括...
    新技术# SEED-Story# 图文故事# 多模态大语言模型
    2年前
    01,1490
    基于偏好学习的奖励模型VADER:让模型更有效地学习如何生成符合特定要求的视频

    基于偏好学习的奖励模型VADER:让模型更有效地学习如何生成符合特定要求的视频

    卡内基梅隆大学的研究人员推出奖励模型(一种基于偏好学习的方法)VADER,来指导视频生成过程,从而让模型更有效地学习如何生成符合特定要求的视频。例如,你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...
    新技术# VADER# 奖励模型
    2年前
    06060
    肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频

    肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频

    蚂蚁集团支付宝终端技术部推出肖像动画新技术EchoMimic,它可以将静态的肖像照片转化为逼真的动态视频。EchoMimic创新性地结合音频与面部标志点进行联合训练,并通过一项新颖的训练策略,使其不仅...
    新技术# EchoMimic# 肖像动画
    2年前
    05530
    视频驱动人脸识别动画系统LivePortrait:将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力

    视频驱动人脸识别动画系统LivePortrait:将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力

    快手科技、中国科学技术大学和复旦大学的研究人员推出视频驱动人脸识别动画系统LivePortrait,它能够将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力。例如,你有一张其他人物照片,Liv...
    新技术# LivePortrait
    2年前
    07880
    新型生成模型DisCo-Diff:用于增强连续扩散模型的性能

    新型生成模型DisCo-Diff:用于增强连续扩散模型的性能

    英伟达和麻省理工学院的研究人员推出新型生成模型DisCo-Diff,它用于增强连续扩散模型(Diffusion Models, DMs)的性能。扩散模型是一种强大的数据生成方法,但它们通常需要将复杂的...
    新技术# DisCo-Diff# 生成模型
    2年前
    06760
    独立条件引导(ICG)和时间步引导(TSG):在不牺牲这两种特性的情况下,改善生成模型的表现

    独立条件引导(ICG)和时间步引导(TSG):在不牺牲这两种特性的情况下,改善生成模型的表现

    苏黎世联邦理工学院和迪士尼搜索的研究人员提出了两种新的图像生成模型引导方法——独立条件引导(ICG)和时间步引导(TSG),它们可以在不牺牲这两种特性的情况下,改善生成模型的表现。这些方法可以提高生成...
    新技术# ICG# TSG# 时间步引导
    2年前
    09900
    3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

    3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

    谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG,它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实(VR)和增强现实(AR)领域尤为重要,因为它可以提供...
    新技术# 3D立体视频# SVG
    2年前
    05130
    腾讯优图推出RealTalk:用于生成逼真、实时的音频驱动人脸视频的框架

    腾讯优图推出RealTalk:用于生成逼真、实时的音频驱动人脸视频的框架

    腾讯优图实验室和南京大学的研究人员推出新技术RealTalk,它是一个用于生成逼真、实时的音频驱动人脸视频的框架。简单来说,RealTalk可以根据一个人的语音生成一个看起来非常真实的3D人脸动画,而...
    新技术# RealTalk# 南京大学# 腾讯优图
    2年前
    06970
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    360 安全龙虾

    360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    查看完整榜单