SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Compress3D:从单张图片生成三维模型

    Compress3D:从单张图片生成三维模型

    来自西安交通大学的研究团队推出Compress3D,它是一种从单张图片生成三维模型的方法。想象一下,你有一张你最喜欢的动漫角色的图片,你想在虚拟现实游戏中使用这个角色的三维模型。传统上,这需要3D艺术...
    新技术# Compress3D# 三维模型
    2年前
    04530
    FlexGen框架:能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像

    FlexGen框架:能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像

    来自香港科技大学(广州)、香港科技大学和趣玩的研究人员开发了一个名为FlexGen的框架,它能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像。想象一下,你给FlexGen...
    新技术# FlexGen
    1年前
    04520
    ChatGPT 面向免费用户推出高级语音模式,但附带使用限制

    ChatGPT 面向免费用户推出高级语音模式,但附带使用限制

    OpenAI今天宣布,为 ChatGPT 推出免费版本的高级语音模式。该功能基于 GPT-4o mini 模型,这是其最新模型 GPT-4o 的一种变体。这一举措旨在为更多用户提供更高效、更具交互性的...
    早报# ChatGPT# OpenAI# 高级语音模式
    10个月前
    04510
    阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换

    阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换

    阿里巴巴智能计算研究院推出MIMO,它能够根据用户提供的简单输入,合成具有可控属性(如角色、动作和场景)的逼真角色视频。简单来说,这项技术能够让用户通过提供一些基本的指令或样本,来创造出一段新的视频...
    新技术# MIMO# 角色视频合成# 阿里巴巴
    1年前
    04510
    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个...
    新技术# MotionClone# 视频生成
    2年前
    04500
    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导(APG),保留了CFG提高质量的优势,同时允许使用更高的引导比例而不产生过饱和。APG易于实现,并且实际上不会给采样过程带来额外的计算开销...
    新技术# APG# 自适应投影引导
    1年前
    04490
    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    近年来,文本到3D生成器和3D扫描仪技术取得了显著进展,能够生成高质量的3D资产。然而,这些资产通常由单一的融合表示组成,例如隐式神经场、高斯混合或网格,缺乏任何有用的结构。这种单一表示方式使得资产难...
    新技术# 3D对象# PartGen
    12个月前
    04480
    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...
    新技术# Dr. Mo# 视频生成
    1年前
    04460
    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen,与流行的扩散模型(例如,Stable Diffusion)不同,OmniGen不再需要额外的模块,如ControlNet或IP-Adapter来处...
    新技术# OmniGen# 图像生成模型
    1年前
    04460
    ElevenLabs 发布 Eleven v3(Alpha 版),迄今最具表现力的TTS模型

    ElevenLabs 发布 Eleven v3(Alpha 版),迄今最具表现力的TTS模型

    在语音合成技术不断进化的今天,ElevenLabs 正式推出了其最新一代文本转语音模型 —— Eleven v3(Alpha 版)。该版本在情感表达、对话自然度和多语言支持方面实现了重大突破,被誉为目...
    早报# Eleven v3# ElevenLabs# TTS模型
    7个月前
    04450
    3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合

    3D感知图像对齐技术3D Congealing:用于处理捕捉语义相似对象的2D图像集合

    来自斯坦福大学、谷歌研究、图宾根大学和Stability AI的研究人员推出3D Congealing,这是一种新颖的3D感知图像对齐技术,用于处理捕捉语义相似对象的2D图像集合。 项目主页 论文 简...
    新技术# 3D Congealing
    2年前
    04450
    基于常加速度方程的普通微分方程(ODE)框架CAF:用于学习两个分布之间的映射,特别是在图像生成领域

    基于常加速度方程的普通微分方程(ODE)框架CAF:用于学习两个分布之间的映射,特别是在图像生成领域

    高丽大学和韩国科学技术研究院的研究人员推出新型框架Constant Acceleration Flow(CAF),它是一种基于常加速度方程的普通微分方程(ODE)框架,用于学习两个分布之间的映射,特别...
    新技术# CAF# 图像生成
    1年前
    04440
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    人生 K 线

    新人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    查看完整榜单