SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2226 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    轨迹条件文本到4D生成方法TC4D:根据文本描述和一条轨迹生成动态的三维场景

    轨迹条件文本到4D生成方法TC4D:根据文本描述和一条轨迹生成动态的三维场景

    来自多伦多大学、Vector Institute、Snap、香港中文大学、斯坦福大学、香港大学、密歇根大学和 Google DeepMind的研究团队推出轨迹条件文本到4D生成方法TC4D(Traje...
    新技术# 4D# TC4D# 三维场景
    2年前
    05930
    Midjourney 推出全新外部图像编辑功能、图像重新纹理化以及下一代AI审查系统

    Midjourney 推出全新外部图像编辑功能、图像重新纹理化以及下一代AI审查系统

    由前 Magic Leap 工程师 David Holz 创立的 AI 图像生成初创公司Midjourney,昨晚宣布了一项令人瞩目的新功能——AI 图像编辑。这项功能不仅让现有的2000多万用户感到...
    教程# Midjourney# 图像编辑
    1年前
    05920
    文本编码器Glyph-ByT5:为提高视觉文本渲染的准确性而设计

    文本编码器Glyph-ByT5:为提高视觉文本渲染的准确性而设计

    来自微软亚洲研究院、清华大学、北京大学和澳大利亚国立大学的研究团队推出文本编码器Glyph-ByT5,它是为了提高视觉文本渲染的准确性而设计的。Glyph-ByT5通过微调一个字符感知的ByT5编码器...
    新技术# Glyph-ByT5# 文本编码器
    2年前
    05920
    阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架

    阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架

    阿里推出新型视频生成框架I4VGen,这是一个无需训练(training-free)且即插即用(plug-and-play)的视频扩散推理框架,它通过强化图像技术来提升文本到视频(text-to-vi...
    新技术# I4VGen# 视频生成框架
    2年前
    05910
    混合数据专家MoDE:通过聚类方法来提升对比语言-图像预训练(CLIP)的性能

    混合数据专家MoDE:通过聚类方法来提升对比语言-图像预训练(CLIP)的性能

    来自Meta、哥伦比亚大学、纽约大学和华盛顿大学的研究人员推出机器学习系统MoDE(Mixture of Data Experts,混合数据专家),它通过聚类方法来提升对比语言-图像预训练(CLIP...
    新技术# CLIP# MoDE# 混合数据专家
    2年前
    05910
    3D场景编辑方法ReplaceAnything3D(RAM3D):通过文本提示在3D场景中替换特定的物体

    3D场景编辑方法ReplaceAnything3D(RAM3D):通过文本提示在3D场景中替换特定的物体

    来自Meta、伦敦大学的研究人员推出一种基于文本引导的3D场景编辑方法ReplaceAnything3D(RAM3D),它允许用户通过文本提示在3D场景中替换特定的物体。这种方法结合了预训练的文本引导...
    新技术# 3D场景编辑# RAM3D# ReplaceAnything3D
    2年前
    05910
    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image:能够生成高保真度的图像内容,并且具有像素级完美准确性

    英伟达推出图像生成模型家族Edify Image,它们能够生成高保真度的图像内容,并且具有像素级完美准确性。Edify Image利用了一系列级联的像素空间扩散模型,这些模型通过一个新颖的拉普拉斯扩散...
    新技术# Edify Image# 图像生成# 英伟达
    1年前
    05890
    图像修补任务Reflecting Reality:专门用于创建逼真的镜面反射

    图像修补任务Reflecting Reality:专门用于创建逼真的镜面反射

    印度理工学院班加罗尔分校视觉与人工智能实验室、三星印度研发中心和牛津大学视觉几何组的研究人员推出Reflecting Reality,它专门用于创建逼真的镜面反射。简单来说,可以处理给定的图片,自动在...
    新技术# Reflecting Reality# 镜面反射
    1年前
    05890
    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...
    新技术# iCD# 蒸馏技术
    2年前
    05890
    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    新颖图像和视频处理框架MaGGIe:用于实现人类图像的精确分割,从图像和视频中提取人物前景

    来自马里兰大学和Adob​​e的研究人员推出新的图像和视频处理技术MaGGIe(Masked Guided Gradual Human Instance Matting),它用于实现人类图像的精确分割...
    新技术# MaGGIe# 图像分割# 抠图
    2年前
    05880
    LoRA:为解决大语言模型微调而开发

    LoRA:为解决大语言模型微调而开发

    微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于...
    新技术# Lora# 大语言模型# 微软
    2年前
    05880
    FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片

    FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片

    来自香港大学、阿里和蚂蚁的研究团队推出FlashFace,它允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片。 项目主页:https://jshilong.github.io/fla...
    新技术# FlashFace# 个性化
    2年前
    05870
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    TTSMaker

    TTSMaker

    TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单