SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    清华大学开源项目KTransformers突破大模型算力瓶颈:RTX 4090 单卡实现满血版DeepSeek-R1运行

    清华大学开源项目KTransformers突破大模型算力瓶颈:RTX 4090 单卡实现满血版DeepSeek-R1运行

    在 AI 大模型领域,运行像 DeepSeek-R1 这样的千亿级参数模型一直是个难题。普通用户要么依赖云服务,要么只能运行大幅缩水的本地版本,而租赁服务器的成本也让开发者望而却步。但现在,这一局面正...
    新技术# DeepSeek-R1# KTransformers
    10个月前
    02340
    强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现

    强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现

    上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL,通过基于结果奖励的强化学习(RL)提升大语言模型(LLMs)在数学推理任务中的表现。该框架...
    新技术# OREAL# 大语言模型# 强化学习
    10个月前
    03600
    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频...
    新技术# VidCRAFT3# 视频生成
    10个月前
    03670
    阿里通义实验室推出高保真角色图像动画生成框架Animate Anyone 2

    阿里通义实验室推出高保真角色图像动画生成框架Animate Anyone 2

    阿里通义实验室推出高保真角色图像动画生成框架Animate Anyone 2,它不仅利用运动信号来驱动角色动画,还从驱动视频中提取环境表示,使角色动画能够与环境自然地融合。前代技术Animate An...
    新技术# Animate Anyone 2# 通义实验室
    10个月前
    02380
    Go-with-the-Flow:通过实时扭曲噪声实现对视频生成的运动控制

    Go-with-the-Flow:通过实时扭曲噪声实现对视频生成的运动控制

    Netflix Eyeline Studios、Netflix、石溪大学、马里兰大学和斯坦福大学的研究人员推出一种简单高效的控制视频扩散模型运动模式的方法Go-with-the-Flow ,通过实时扭...
    新技术# Go-with-the-Flow
    11个月前
    02870
    字节跳动推出新型单目深度估计方法Video Depth Anything:专门用于超长视频(数分钟)的高质量、一致的深度估计

    字节跳动推出新型单目深度估计方法Video Depth Anything:专门用于超长视频(数分钟)的高质量、一致的深度估计

    字节跳动推出新型单目深度估计方法Video Depth Anything,专门用于超长视频(数分钟)的高质量、一致的深度估计。该方法基于 Depth Anything V2,通过引入高效的空间-时间头...
    新技术# Video Depth Anything# 字节跳动
    11个月前
    02560
    阿里推出新型音频驱动的虚拟角色视频生成方法EMO2:同时生成富有表现力的面部表情和手势动作

    阿里推出新型音频驱动的虚拟角色视频生成方法EMO2:同时生成富有表现力的面部表情和手势动作

    阿里在去年2月推出新型音频驱动的虚拟角色视频生成方法EMO,近期又发布了 EMO2,它能够同时生成富有表现力的面部表情和手势动作。该方法特别关注于语音伴随手势(co-speech gestures)的...
    新技术# EMO2
    11个月前
    05690
    GameFactory框架:通过生成式交互视频来创建全新的游戏

    GameFactory框架:通过生成式交互视频来创建全新的游戏

    香港大学和快手科技的研究人员推出GameFactory框架,旨在通过生成式交互视频来创建全新的游戏。该框架利用预训练的视频扩散模型(video diffusion models),结合少量的第一人称游...
    新技术# GameFactory# 快手
    11个月前
    02780
    新型多概念个性化方法TokenVerse:通过预训练的DiT架构文生图模型实现从单张或多张图像中提取复杂视觉概念,并支持无缝组合这些概念以生成新的图像

    新型多概念个性化方法TokenVerse:通过预训练的DiT架构文生图模型实现从单张或多张图像中提取复杂视觉概念,并支持无缝组合这些概念以生成新的图像

    谷歌 DeepMind、特拉维夫大学、以色列理工学院和魏茨曼研究所的研究人员推出新型多概念个性化方法TokenVerse,旨在通过预训练的DiT架构文生图模型实现从单张或多张图像中提取复杂视觉概念,并...
    新技术# TokenVerse
    11个月前
    02460
    多智能体协作框架 FILMAGENT:通过大语言模型实现虚拟 3D 空间中的端到端电影自动化制作

    多智能体协作框架 FILMAGENT:通过大语言模型实现虚拟 3D 空间中的端到端电影自动化制作

    哈尔滨工业大学(深圳)和清华大学的研究人员推出多智能体协作框架 FILMAGENT,旨在通过大语言模型(LLMs)实现虚拟 3D 空间中的端到端电影自动化制作。该框架模拟了电影制作中的各种角色(如导演...
    新技术# FILMAGENT# 电影
    11个月前
    02510
    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份...
    新技术# EchoVideo# 视频生成
    11个月前
    02480
    1Prompt1Story:解决文生图模型生成中的一致性问题

    1Prompt1Story:解决文生图模型生成中的一致性问题

    南开大学、巴塞罗那自治大学计算机视觉中心、穆罕默德·本·扎耶德人工智能大学,林雪平大学和软银的研究人员推出1Prompt1Story,旨在解决文本到图像(Text-to-Image,T2I)生成中的一...
    新技术# 1Prompt1Story
    11个月前
    02280
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单