SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出一个基于DiT模型的人类图像动画框架DreamActor-M1,实现整体性(holistic)、表现力(expressive)和鲁棒性(robust)的人类图像动画生成。该框架通过混合引导...
    新技术# DiT模型# DreamActor-M1# 字节跳动
    9个月前
    02730
    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    随着大语言模型(LLMs)在各种任务上的表现越来越接近人类水平,人们开始质疑这些模型是否真的具备人类意义上的推理能力,还是仅仅是在重复训练过程中见过的解决方案。 论文:https://arxiv.or...
    新技术# 大语言模型# 推理能力
    9个月前
    02350
    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学的研究人员推出RIFLEx,解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率,有效抑制重复内容的生成,同时保持运动一致性,无需额外训练或修改模型。 项目主页...
    新技术# RIFLEx# 清华大学# 视频扩散模型
    9个月前
    03720
    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    扩散模型是一种强大的生成模型,能够生成高质量的图像、视频等内容。然而,传统的扩散模型在采样过程中需要大量的步骤来逐步去除噪声并生成最终结果,这使得采样过程计算成本高昂。例如,在生成一张高质量的图像时...
    新技术# OSS# 扩散模型# 最优步长蒸馏
    9个月前
    03870
    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    北京大学和加州大学洛杉矶分校的研究人员推出MineStudio,这是一个用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包。它通过整合七个关键工程组件(模拟器、数据、模型、离线预训练...
    新技术# MineStudio# 我的世界
    9个月前
    03810
    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...
    新技术# WikiAutoGen# 多模态# 维基百科
    9个月前
    03660
    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    北京航空航天大学和美团的研究人员推出 Diffusion-4K,即利用潜在扩散模型(Latent Diffusion Models)进行超高清(4K)图像合成。该研究的核心目标是直接生成高质量的4K图...
    新技术# Diffusion-4K# FLUX# SD3
    9个月前
    04980
    FilmComposer:利用大语言模型驱动的方法为无声电影片段生成音乐

    FilmComposer:利用大语言模型驱动的方法为无声电影片段生成音乐

    上海大学和上海电影特效工程技术研究中心的研究人员推出 FilmComposer,利用大语言模型(LLM)驱动的方法为无声电影片段生成音乐。FilmComposer 旨在模拟专业音乐家的实际工作流程,结...
    新技术# FilmComposer# 大语言模型# 音乐
    9个月前
    04260
    Video-T1:视频生成任务中引入测试时扩展(TTS)技术,以提升生成视频的质量和与文本提示的一致性

    Video-T1:视频生成任务中引入测试时扩展(TTS)技术,以提升生成视频的质量和与文本提示的一致性

    清华大学和腾讯的研究人员推出 Video-T1,在视频生成任务中引入测试时扩展(Test-Time Scaling, TTS)技术,以提升生成视频的质量和与文本提示的一致性。通过在推理阶段增加计算资源...
    新技术# TTS# Video-T1# 测试时扩展
    9个月前
    02960
    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...
    新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导
    9个月前
    03840
    改进大语言模型的后训练方法,提升其在创意写作任务中的输出多样性和质量

    改进大语言模型的后训练方法,提升其在创意写作任务中的输出多样性和质量

    Midjourney和纽约大学的研究人员发布论文《Modifying Large Language Model Post-Training for Diverse Creative Writing...
    新技术# 创意写作# 大语言模型
    9个月前
    01900
    字节跳动发布DAPO(动态采样策略优化):提升大语言模型的推理能力

    字节跳动发布DAPO(动态采样策略优化):提升大语言模型的推理能力

    来自字节跳动、清华大学和香港大学的研究团队共同推出了一款名为 DAPO(动态采样策略优化)的开源系统,旨在提升大语言模型(LLM)的推理能力。DAPO 的发布标志着在强化学习(RL)技术应用于大规模语...
    新技术# DAPO# 动态采样策略优化# 大语言模型
    9个月前
    02550
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单