SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2256 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。 官方介绍 以下是官方介绍全文翻译: 我们正在...
    新技术# AI视频生成模型# OpenAI# Sora
    2年前
    07400
    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...
    新技术# Lumos# 场景文本识别# 多模态大语言模型
    2年前
    05790
    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词(Continuous 3D Words)”的新方法,使得用户能够通过文本提示来精细控制图像生成过程中的多个属性,比如照明方向...
    新技术# AI绘画# Continuous 3D Words# 连续3D词
    2年前
    06850
    AI动画生成框架Keyframer:利用GPT4生成动画

    AI动画生成框架Keyframer:利用GPT4生成动画

    来自苹果的研究人员推出一款利用大语言模型(LLMs)生成动画的框架Keyframer,它利用大语言模型(LLMs)来帮助设计师通过自然语言描述来创建动画。 论文地址 Keyframer的主要功能包括从...
    新技术# AI动画# CSS动画# Keyframer
    2年前
    05160
    深度估算模型Depth Anything:让照片自动感知空间距离

    深度估算模型Depth Anything:让照片自动感知空间距离

    来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything,它是一个用于单目深度估计(Monocular Depth Estimation, MDE)的实...
    新技术# Depth Anything# 深度估算模型
    2年前
    05970
    AI视频生成模型Animated Stickers:让静态表情包动起来

    AI视频生成模型Animated Stickers:让静态表情包动起来

    来自Meta的研究人员推出了AI视频生成模型Animated Stickers,它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像(Text-to-Image)模型,通过添加时间层...
    新技术# AI视频生成模型# Animated Stickers# 表情包
    2年前
    06050
    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    Direct-a-Video是一个AI视频生成系统,该系统允许用户独立地为一个或多个对象和/或相机运动指定运动,就像导演拍摄视频一样。 项目主页 开发者提出了一种简单而有效的策略,用于分别控制对象运动...
    新技术# AI视频生成# Direct-a-Video
    2年前
    06020
    微软将在Windows 11 Build 26052 预览版引入新功能,将原生支持 Sudo 命令

    微软将在Windows 11 Build 26052 预览版引入新功能,将原生支持 Sudo 命令

    微软已经在Windows 11 预览版 26052中引入了新功能Sudo for Windows。对于熟悉macOS和Linux系统的用户来说,sudo命令一定不会陌生。 官方文档 GitHub su...
    教程# Sudo# Windows 11# 微软
    2年前
    08770
    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在...
    新技术# IMUSIC# 影眸科技# 灵秘科技
    2年前
    07510
    AI音乐模型Stable Audio:结合文本提示和时间控制长音频生成

    AI音乐模型Stable Audio:结合文本提示和时间控制长音频生成

    Stability AI发布AI音乐模型Stable Audio,它专注于从文本提示生成高质量、可变长度的立体声音乐和音效。这个模型特别适用于需要快速生成长形式音频内容的场景,如音乐制作、游戏音效设计...
    新技术# AI音乐# Stability AI# Stable Audio
    2年前
    06010
    专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量

    专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量

    来自斯坦福大学和Stability AI的研究人员推出了一个专门解读胸部X光片的图像模型CheXagent,这个模型的目的是帮助医生更准确地分析和理解X光片,从而提高临床决策的效率和质量。 项目主页 ...
    新技术# CheXagent# Stability AI# X光片
    2年前
    07130
    阿里推出AI视频生成模型I2VGen-XL

    阿里推出AI视频生成模型I2VGen-XL

    阿里旗下达摩院推出AI视频生成模型I2VGen-XL,可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频,生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...
    新技术# AI视频# I2VGen-XL# 阿里
    2年前
    06570
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    查看完整榜单