SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2227 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    controllable text-to-3D generation:根据文本提示和条件图像生成高质量、可控制的3D模型

    controllable text-to-3D generation:根据文本提示和条件图像生成高质量、可控制的3D模型

    来自浙江大学、西湖大学和同济大学的研究团队推出controllable text-to-3D generation,它能够根据文本提示和条件图像生成高质量、可控制的3D模型。这种方法的核心在于使用一种...
    新技术# 3D模型# controllable text-to-3D generation
    2年前
    05030
    新型个性化图像生成方法Infinite-ID:保持特定身份特征的同时,根据用户的文本描述生成高质量的图像

    新型个性化图像生成方法Infinite-ID:保持特定身份特征的同时,根据用户的文本描述生成高质量的图像

    来自中国科学技术大学和悉尼大学的研究人员推出新型个性化图像生成方法Infinite-ID,它能够在保持特定身份特征的同时,根据用户的文本描述生成高质量的图像。这是一个全新的ID-语义解耦范式,专门用于...
    新技术# Infinite-ID# 个性化图像生成
    2年前
    05010
    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    北京航空航天大学和美团的研究人员推出 Diffusion-4K,即利用潜在扩散模型(Latent Diffusion Models)进行超高清(4K)图像合成。该研究的核心目标是直接生成高质量的4K图...
    新技术# Diffusion-4K# FLUX# SD3
    9个月前
    05000
    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn,旨在加速大模型的推理过程,同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色,但由于其计算复杂度与序列...
    新技术# SpargeAttn# 加州大学伯克利分校# 清华大学
    10个月前
    05000
    MimicTalk:用于实现特定说话人的高表现力的虚拟人视频合成

    MimicTalk:用于实现特定说话人的高表现力的虚拟人视频合成

    说话人脸生成(Talking Face Generation, TFG)的目标是将目标身份的脸部动画化,以创建逼真的说话视频。个性化TFG是这一任务的一个重要变体,强调生成的视频在静态外观和动态说话风...
    新技术# MimicTalk# 虚拟人
    1年前
    05000
    新型高分辨率图像到3D生成框架Hi3D:将单张2D图片转换成具有高分辨率纹理细节的3D模型

    新型高分辨率图像到3D生成框架Hi3D:将单张2D图片转换成具有高分辨率纹理细节的3D模型

    复旦大学计算机学院、新加坡管理大学和智象未来的研究人员推出新型高分辨率图像到3D生成框架Hi3D,Hi3D 的目标是将单张2D图片转换成具有高分辨率纹理细节的3D模型。这就像给一个平面的照片施魔法,让...
    新技术# 3D# 3D模型# Hi3D
    1年前
    05000
    豆包APP上线实时视频通话功能,开启智能互动新体验

    豆包APP上线实时视频通话功能,开启智能互动新体验

    豆包官方微信公众号宣布,豆包App正式上线实时视频通话功能。这一创新功能的推出,标志着豆包在智能互动领域迈出了重要一步,为用户带来了更加丰富和便捷的使用体验。 实时视频通话功能介绍 用户在豆包App的...
    早报# 实时视频通话# 豆包
    7个月前
    04990
    苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程

    苹果推出基于最优传输理论的通用框架ACT:用于控制大型生成模型的生成过程

    大型生成模型(如大语言模型LLMs和文本到图像扩散模型T2Is)的能力不断增强,但其日益广泛的部署也引发了对可靠性和安全性的担忧。为了解决这些问题,研究人员提出了通过引导模型激活来控制模型生成的方法...
    新技术# ACT# 大语言模型# 文生图模型
    1年前
    04990
    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕

    来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先进模型PLLaVA(Pooling LLaVA),此模型的主要功能是能够理解视频中的内容,包括动作、场景、人物穿着等,并能够...
    新技术# PLLaVA# 视觉模型
    2年前
    04990
    3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

    3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

    谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG,它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实(VR)和增强现实(AR)领域尤为重要,因为它可以提供...
    新技术# 3D立体视频# SVG
    1年前
    04980
    FouriScale:从预训练的扩散模型中生成高质量的高分辨率图像

    FouriScale:从预训练的扩散模型中生成高质量的高分辨率图像

    来自香港中文大学-商汤科技联合实验室、香港中文大学感知与交互智能研究中心、中山大学、商汤科技研究院 和北京航空航天大学的研究团队提出了一种创新的、无需额外训练的方法—FouriScale,它旨在从预训...
    新技术# FouriScale# 扩散模型
    2年前
    04980
    新颖HDR视图合成技术HDR-GS:高效地生成新的HDR视角图像,并依据用户指定的曝光时间重建LDR图像

    新颖HDR视图合成技术HDR-GS:高效地生成新的HDR视角图像,并依据用户指定的曝光时间重建LDR图像

    约翰·霍普金斯大学、香港科技大学(广州)、清华大学和上海交通大学的研究人员推出一种新型的高动态范围(HDR)图像的新颖视图合成技术HDR-GS(High Dynamic Range Gaussian ...
    新技术# HDR-GS
    2年前
    04950
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    微舆(BettaFish)

    新微舆(BettaFish)

    “微舆” 是一个从0实现的创新型 多智能体 舆情分析系统,帮助大家破除信息茧房,还原舆情原貌,预测未来走向,辅助决策。用户只需像聊天一样提出分析需求,智能体开始全自动分析 国内外30+主流社媒 与 数百万条大众评论。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    查看完整榜单