SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。 官方介绍 以下是官方介绍全文翻译: 我们正在...
    新技术# AI视频生成模型# OpenAI# Sora
    2年前
    07420
    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...
    新技术# Lumos# 场景文本识别# 多模态大语言模型
    2年前
    05800
    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词(Continuous 3D Words)”的新方法,使得用户能够通过文本提示来精细控制图像生成过程中的多个属性,比如照明方向...
    新技术# AI绘画# Continuous 3D Words# 连续3D词
    2年前
    06860
    AI动画生成框架Keyframer:利用GPT4生成动画

    AI动画生成框架Keyframer:利用GPT4生成动画

    来自苹果的研究人员推出一款利用大语言模型(LLMs)生成动画的框架Keyframer,它利用大语言模型(LLMs)来帮助设计师通过自然语言描述来创建动画。 论文地址 Keyframer的主要功能包括从...
    新技术# AI动画# CSS动画# Keyframer
    2年前
    05170
    深度估算模型Depth Anything:让照片自动感知空间距离

    深度估算模型Depth Anything:让照片自动感知空间距离

    来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything,它是一个用于单目深度估计(Monocular Depth Estimation, MDE)的实...
    新技术# Depth Anything# 深度估算模型
    2年前
    05970
    AI视频生成模型Animated Stickers:让静态表情包动起来

    AI视频生成模型Animated Stickers:让静态表情包动起来

    来自Meta的研究人员推出了AI视频生成模型Animated Stickers,它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像(Text-to-Image)模型,通过添加时间层...
    新技术# AI视频生成模型# Animated Stickers# 表情包
    2年前
    06270
    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    Direct-a-Video是一个AI视频生成系统,该系统允许用户独立地为一个或多个对象和/或相机运动指定运动,就像导演拍摄视频一样。 项目主页 开发者提出了一种简单而有效的策略,用于分别控制对象运动...
    新技术# AI视频生成# Direct-a-Video
    2年前
    06020
    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在...
    新技术# IMUSIC# 影眸科技# 灵秘科技
    2年前
    07590
    AI音乐模型Stable Audio:结合文本提示和时间控制长音频生成

    AI音乐模型Stable Audio:结合文本提示和时间控制长音频生成

    Stability AI发布AI音乐模型Stable Audio,它专注于从文本提示生成高质量、可变长度的立体声音乐和音效。这个模型特别适用于需要快速生成长形式音频内容的场景,如音乐制作、游戏音效设计...
    新技术# AI音乐# Stability AI# Stable Audio
    2年前
    06030
    专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量

    专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量

    来自斯坦福大学和Stability AI的研究人员推出了一个专门解读胸部X光片的图像模型CheXagent,这个模型的目的是帮助医生更准确地分析和理解X光片,从而提高临床决策的效率和质量。 项目主页 ...
    新技术# CheXagent# Stability AI# X光片
    2年前
    07140
    阿里推出AI视频生成模型I2VGen-XL

    阿里推出AI视频生成模型I2VGen-XL

    阿里旗下达摩院推出AI视频生成模型I2VGen-XL,可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频,生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...
    新技术# AI视频# I2VGen-XL# 阿里
    2年前
    06640
    AI视频生成新模型CONSISTI2V:通过增强视觉一致性来改善视频生成的质量

    AI视频生成新模型CONSISTI2V:通过增强视觉一致性来改善视频生成的质量

    来自滑铁卢大学、Vector Institute、Harmony.AI、多模式艺术投影研究社区的研究人员提出了一种基于扩散的图像到视频生成新方法CONSISTI2V,它旨在通过增强视觉一致性来改善视频...
    新技术# AI视频生成# CONSISTI2V
    2年前
    06640
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    oLLM

    oLLM

    oLLM 是一个轻量级的 Python 库,用于大型上下文 LLM 推理,基于 Huggingface Transformers 和 PyTorch 构建。它使运行像 gpt-oss-20B、qwen3-next-80B 或 Llama-3.1-8B-Instruct 这样的模型在 100k 上下文下使用约 200 美元的消费级 GPU(8GB VRAM)成为可能。不使用量化——仅使用 fp16/bf16 精度。
    OpenAI Codex CLI

    OpenAI Codex CLI

    OpenAI推出的一款开源的本地编码代理Codex CLI,可将自然语言转化为可运行的代码。只需告诉 Codex CLI 您想构建、修复或解释的内容,即可见证它将您的想法变为现实。Codex CLI 支持所有 OpenAI 模型,包括 o3、o4-mini 和 GPT-4.1。
    CachyOS

    CachyOS

    CachyOS是基于Arch Linux的Linux发行。它专注于速度和安全改进:缺省的Linux内核使用BORE调度器进行了深度优化,而桌面软件包使用了LTO和x86-64-v3优化项、安全标记、性能提升项进行编译。可用的桌面环境及窗口管理器包括KDE Plasma、GNOME、Xfce、i3、bspwm、LXQt、Openbox、Wayfire、Cutefish。CachyOS还带有图形化及命令行的安装程序,提供基于Firefox的名为Cachy-Browser的浏览器,浏览器做了安装增强和性能优化。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Genspark

    Genspark

    Genspark 超级智能体——您的全能AI伙伴,从拨打电话、制作幻灯片到生成TikTok短视频,轻松应对日常任务。内置80+预装工具与海量数据集,更快、更可靠、更可控。
    查看完整榜单