SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    清华大学

    共 9 篇文章
    排序
    发布更新浏览点赞
    新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置

    新型实时端到端目标检测系统YOLOv10:快速地识别图像中的多个对象,并且告诉用户这些对象的具体位置

    清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉领域的一个重要任务,它的目的是识别出图像中的对象,并确定它们的位置。例如,你在玩一个视频游戏,需要快速识别并射击屏幕...
    新技术# YOLOv10# 清华大学# 目标检测
    2年前
    09990
    清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频

    清华大学和新畅元科技推出Human4DiT:能够根据单幅图像及任意视点生成高质量、时空连贯的人类视频

    清华大学和新畅元科技推出新技术Human4DiT,它是一种用于生成高质量、时空一致的人类视频的4D扩散变换器(4D Diffusion Transformer)。这项技术可以从单张图片生成逼真的人类动...
    新技术# Human4DiT# 新畅元科技# 清华大学
    2年前
    07740
    AI视频生成新框架Motion-I2V:让用户通过简单的轨迹绘制或区域选择来控制生成的视频内容

    AI视频生成新框架Motion-I2V:让用户通过简单的轨迹绘制或区域选择来控制生成的视频内容

    来自NVIDIA AI、香港中文大学、商汤科技、清华大学、CPII、上海人工智能实验室、Avolution AI的研究人员推出图像到视频生成(I2V)新框架Motion-I2V,它是一个用于将静态图片...
    新技术# AI视频生成# Motion-I2V# 清华大学
    2年前
    07610
    无需训练的组合式文本到图像生成方法CompAgent

    无需训练的组合式文本到图像生成方法CompAgent

    来自清华大学、华为诺亚方舟实验室、香港大学的研究人员提出了一种无需训练的组合式文本到图像生成方法CompAgent,该方法利用大语言模型(LLM)智能体进行复杂文本提示的分析与规划,将文本分解为单个对...
    新技术# CompAgent# 华为诺亚方舟# 文生图
    2年前
    06800
    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn,旨在加速大模型的推理过程,同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色,但由于其计算复杂度与序列...
    新技术# SpargeAttn# 加州大学伯克利分校# 清华大学
    9个月前
    04930
    清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型

    清华大学与瑞莱智慧联合团队推出RealSafe-R1:基于 DeepSeek R1 的安全优化大语言模型

    随着大语言模型(LLMs)在各个领域的广泛应用,其安全性问题日益受到关注。尽管这些模型在性能上表现出色,但在面对恶意查询和越狱攻击时,仍存在一定的风险。为了应对这一挑战,清华大学与瑞莱智慧联合团队推出...
    新技术# DeepSeek-R1# RealSafe-R1# 大语言模型
    10个月前
    04130
    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学的研究人员推出RIFLEx,解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率,有效抑制重复内容的生成,同时保持运动一致性,无需额外训练或修改模型。 项目主页...
    新技术# RIFLEx# 清华大学# 视频扩散模型
    8个月前
    03590
    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    强化学习(RL)在大语言模型(LLM)的后续训练中已被广泛应用,尤其是在提升模型的推理能力方面。然而,如何在各种领域中为LLM获得准确的奖励信号,仍然是一个关键挑战。 论文:https://arxiv...
    新技术# DeepSeek# 奖励建模# 清华大学
    8个月前
    02960
    SageAttention3 发布:FP4 推理加速与 8 位训练新探索

    SageAttention3 发布:FP4 推理加速与 8 位训练新探索

    清华大学研究团队近日推出 SageAttention3,一项聚焦于提升 Transformer 注意力机制效率的新研究成果。该工作在推理阶段引入基于 FP4 的微缩放量化技术,并首次系统性探索了 8 ...
    新技术# SageAttention3# 清华大学
    2个月前
    0690
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    查看完整榜单