SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 959 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    自级联扩散模型Self-Cascade:快速适应高分辨率的图像和视频生成

    自级联扩散模型Self-Cascade:快速适应高分辨率的图像和视频生成

    来自南洋理工大学、腾讯AI实验室、香港科技大学和克莱姆森大学的研究人员提出了一种名为自级联扩散模型(Self-Cascade Diffusion Model)的新方法,该方法利用了低分辨率模型的丰富知...
    新技术# Self-Cascade# 自级联扩散模型
    2年前
    09820
    一种新颖的模型微调方法DoRA:比LoRA更精细、更全面的微调策略

    一种新颖的模型微调方法DoRA:比LoRA更精细、更全面的微调策略

    DoRA(Weight-Decomposed Low-Rank Adaptation)是一种用于微调(fine-tuning)大型预训练模型的新方法。DoRA的核心思想是将预训练模型的权重分解为两个部...
    新技术# DoRA# Lora# 模型微调
    2年前
    01,3180
    新型文生图模型的微调算法SPIN-Diffusion

    新型文生图模型的微调算法SPIN-Diffusion

    SPIN-Diffusion是一种新型文生图模型的微调算法。这个算法特别适用于那些只有单个图像与文本提示(prompt)相关联的数据集,它通过一种自我博弈(self-play)的机制,让模型不断地与自...
    新技术# SPIN-Diffusion# 文生图模型
    2年前
    08540
    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta今日推出V-JEPA(Video Joint-Embedding Predictive Architecture)模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习...
    新技术# Meta# V-JEPA# 世界模型
    2年前
    07970
    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频

    OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。 官方介绍 以下是官方介绍全文翻译: 我们正在...
    新技术# AI视频生成模型# OpenAI# Sora
    2年前
    07460
    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    多模态问答系统Lumos:结合场景文本识别和多模态大语言模型

    来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...
    新技术# Lumos# 场景文本识别# 多模态大语言模型
    2年前
    05850
    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性

    来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词(Continuous 3D Words)”的新方法,使得用户能够通过文本提示来精细控制图像生成过程中的多个属性,比如照明方向...
    新技术# AI绘画# Continuous 3D Words# 连续3D词
    2年前
    07000
    AI动画生成框架Keyframer:利用GPT4生成动画

    AI动画生成框架Keyframer:利用GPT4生成动画

    来自苹果的研究人员推出一款利用大语言模型(LLMs)生成动画的框架Keyframer,它利用大语言模型(LLMs)来帮助设计师通过自然语言描述来创建动画。 论文地址 Keyframer的主要功能包括从...
    新技术# AI动画# CSS动画# Keyframer
    2年前
    05340
    深度估算模型Depth Anything:让照片自动感知空间距离

    深度估算模型Depth Anything:让照片自动感知空间距离

    来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything,它是一个用于单目深度估计(Monocular Depth Estimation, MDE)的实...
    新技术# Depth Anything# 深度估算模型
    2年前
    06040
    AI视频生成模型Animated Stickers:让静态表情包动起来

    AI视频生成模型Animated Stickers:让静态表情包动起来

    来自Meta的研究人员推出了AI视频生成模型Animated Stickers,它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像(Text-to-Image)模型,通过添加时间层...
    新技术# AI视频生成模型# Animated Stickers# 表情包
    2年前
    07060
    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频

    Direct-a-Video是一个AI视频生成系统,该系统允许用户独立地为一个或多个对象和/或相机运动指定运动,就像导演拍摄视频一样。 项目主页 开发者提出了一种简单而有效的策略,用于分别控制对象运动...
    新技术# AI视频生成# Direct-a-Video
    2年前
    06080
    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下

    来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在...
    新技术# IMUSIC# 影眸科技# 灵秘科技
    2年前
    07960
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    AI朝廷

    AI朝廷

    AI 朝廷 (AI Court) 是一个基于 OpenClaw 框架的多 Agent 协作系统。它创造性地将中国明代三省六部制映射为现代 AI 组织架构。
    Impeccable

    Impeccable

    由pbakaus推出的 Impeccable 技能升级包,正是为了解决这一痛点而生。它不仅仅是一个简单的提示词集合,而是一套包含 17 条专业指令、7 大领域参考文件 以及 精心策划的“反模式” 的设计系统。它的目标很明确:对抗大模型的通用偏见,助你实现真正“无可挑剔”的前端设计。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单