SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2250 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...
    新技术# Dr. Mo# 视频生成
    1年前
    04470
    基于参考的线条艺术视频上色的视频扩散框架LVCD:用于根据参考图像和线稿序列为动画视频着色

    基于参考的线条艺术视频上色的视频扩散框架LVCD:用于根据参考图像和线稿序列为动画视频着色

    香港城市大学和腾讯的研究人员推出基于参考的线条艺术视频上色的视频扩散框架LVCD,用于根据参考图像和线稿序列为动画视频着色。这种方法能够生成长时间一致的、高质量的动画视频。LVCD在保持长时间一致性和...
    新技术# LVCD# 视频上色
    1年前
    04640
    多模态大语言模型Oryx:专门设计用于理解和处理视觉数据,如图像、视频和3D场景

    多模态大语言模型Oryx:专门设计用于理解和处理视觉数据,如图像、视频和3D场景

    清华大学、腾讯和南洋理工大学 S-Lab的研究人员推出多模态大语言模型Oryx,它专门设计用于理解和处理视觉数据,如图像、视频和3D场景。Oryx模型的特点是能够根据需要处理任意空间大小和时间长度的视...
    新技术# Oryx# 多模态大语言模型
    1年前
    06030
    新型图像到视频生成技术OSV:可以将单张图像仅仅一步内生成高质量视频

    新型图像到视频生成技术OSV:可以将单张图像仅仅一步内生成高质量视频

    复旦大学、香港科技大学、香港中文大学和腾讯优图实验室的研究人员推出新型图像到视频生成技术OSV,可以将单张图像转换成视频。这项技术的目标是能够快速生成高质量的视频内容,而不需要复杂的多步骤处理。例如...
    新技术# OSV
    1年前
    04380
    新型高品质文本音频生成器EzAudio:将文本描述转换成相应的音频内容

    新型高品质文本音频生成器EzAudio:将文本描述转换成相应的音频内容

    约翰·霍普金斯大学和腾讯人工智能实验室的研究人员推出一种新型的文本到音频(Text-to-Audio,简称T2A)生成技术EzAudio,这项技术的目标是将文本描述转换成相应的音频内容,比如将“一只狗...
    新技术# EzAudio# 文本音频生成器
    1年前
    06030
    diffusion-e2e-ft:通过微调图像条件扩散模型来简化和提高单目深度估计的效率

    diffusion-e2e-ft:通过微调图像条件扩散模型来简化和提高单目深度估计的效率

    亚琛工业大学和埃因霍温理工大学的研究人员推出diffusion-e2e-ft,通过微调图像条件扩散模型来简化和提高单目深度估计的效率。单目深度估计是指仅使用一张图片来预测场景中每个像素的深度信息。这项...
    新技术# diffusion-e2e-ft# 单目深度估计
    1年前
    05830
    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen

    北京人工智能研究院推出新型图像生成模型OmniGen,与流行的扩散模型(例如,Stable Diffusion)不同,OmniGen不再需要额外的模块,如ControlNet或IP-Adapter来处...
    新技术# OmniGen# 图像生成模型
    1年前
    04460
    Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化

    Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化

    Jina AI推出文本嵌入模型 jina-embeddings-v3,这是一个具有 5.7 亿参数的新型文本嵌入模型,它在多语言数据和长上下文检索任务上实现了最先进的性能,支持的最大上下文长度达到 8...
    新技术# jina-embeddings-v3# 文本嵌入模型
    1年前
    04420
    音乐生成系统Seed-Music:能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容

    音乐生成系统Seed-Music:能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容

    字节跳动旗下豆包团队推出音乐生成系统Seed-Music,能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容。Seed-Music结合了自回归语言建模和扩散方法,支持两种关键的音...
    新技术# Seed-Music# 音乐生成
    1年前
    04600
    图像编辑方法Click2Mask:通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述

    图像编辑方法Click2Mask:通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述

    耶路撒冷希伯来大学的研究人员推出图像编辑方法Click2Mask,它能够让用户通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述。总的来说,Click2Mask提供了一种直观且高效的...
    新技术# Click2Mask# 图像编辑
    1年前
    04540
    DrawingSpinUp:将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征

    DrawingSpinUp:将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征

    香港城市大学的研究人员推出创新系统DrawingSpinUp,它能够将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命,让它动起来,比如让一个纸上的...
    新技术# DrawingSpinUp
    1年前
    04250
    图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速

    图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速

    首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag,它能够让用户通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速。例如,你有一张图片,你想要移动图片中的某个部...
    新技术# InstantDrag# 图像编辑
    1年前
    04450
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    智川云

    智川云

    智川云 RiverMind 是专为高校科研团队与开发者打造的弹性 GPU 云平台,提供从按量训练到弹性推理在内的 AI 模型全生命周期算力服务。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单