SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出基于DiT模型的人类图像动画框架DreamActor-M1:实现整体性、表现力和鲁棒性的人类图像动画生成

    字节跳动推出一个基于DiT模型的人类图像动画框架DreamActor-M1,实现整体性(holistic)、表现力(expressive)和鲁棒性(robust)的人类图像动画生成。该框架通过混合引导...
    新技术# DiT模型# DreamActor-M1# 字节跳动
    9个月前
    02730
    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    大语言模型真的具备推理能力吗?——RoR-Bench研究揭示真相

    随着大语言模型(LLMs)在各种任务上的表现越来越接近人类水平,人们开始质疑这些模型是否真的具备人类意义上的推理能力,还是仅仅是在重复训练过程中见过的解决方案。 论文:https://arxiv.or...
    新技术# 大语言模型# 推理能力
    9个月前
    02350
    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学的研究人员推出RIFLEx,解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率,有效抑制重复内容的生成,同时保持运动一致性,无需额外训练或修改模型。 项目主页...
    新技术# RIFLEx# 清华大学# 视频扩散模型
    9个月前
    03720
    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    最优步长蒸馏(OSS):通过优化采样步长来加速扩散模型的生成过程,同时保持生成质量

    扩散模型是一种强大的生成模型,能够生成高质量的图像、视频等内容。然而,传统的扩散模型在采样过程中需要大量的步骤来逐步去除噪声并生成最终结果,这使得采样过程计算成本高昂。例如,在生成一张高质量的图像时...
    新技术# OSS# 扩散模型# 最优步长蒸馏
    9个月前
    03880
    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包

    北京大学和加州大学洛杉矶分校的研究人员推出MineStudio,这是一个用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包。它通过整合七个关键工程组件(模拟器、数据、模型、离线预训练...
    新技术# MineStudio# 我的世界
    9个月前
    03830
    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统

    阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...
    新技术# WikiAutoGen# 多模态# 维基百科
    9个月前
    03660
    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成

    北京航空航天大学和美团的研究人员推出 Diffusion-4K,即利用潜在扩散模型(Latent Diffusion Models)进行超高清(4K)图像合成。该研究的核心目标是直接生成高质量的4K图...
    新技术# Diffusion-4K# FLUX# SD3
    9个月前
    04980
    FilmComposer:利用大语言模型驱动的方法为无声电影片段生成音乐

    FilmComposer:利用大语言模型驱动的方法为无声电影片段生成音乐

    上海大学和上海电影特效工程技术研究中心的研究人员推出 FilmComposer,利用大语言模型(LLM)驱动的方法为无声电影片段生成音乐。FilmComposer 旨在模拟专业音乐家的实际工作流程,结...
    新技术# FilmComposer# 大语言模型# 音乐
    9个月前
    04270
    Video-T1:视频生成任务中引入测试时扩展(TTS)技术,以提升生成视频的质量和与文本提示的一致性

    Video-T1:视频生成任务中引入测试时扩展(TTS)技术,以提升生成视频的质量和与文本提示的一致性

    清华大学和腾讯的研究人员推出 Video-T1,在视频生成任务中引入测试时扩展(Test-Time Scaling, TTS)技术,以提升生成视频的质量和与文本提示的一致性。通过在推理阶段增加计算资源...
    新技术# TTS# Video-T1# 测试时扩展
    9个月前
    02960
    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果

    南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...
    新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导
    9个月前
    03840
    改进大语言模型的后训练方法,提升其在创意写作任务中的输出多样性和质量

    改进大语言模型的后训练方法,提升其在创意写作任务中的输出多样性和质量

    Midjourney和纽约大学的研究人员发布论文《Modifying Large Language Model Post-Training for Diverse Creative Writing...
    新技术# 创意写作# 大语言模型
    9个月前
    01900
    字节跳动发布DAPO(动态采样策略优化):提升大语言模型的推理能力

    字节跳动发布DAPO(动态采样策略优化):提升大语言模型的推理能力

    来自字节跳动、清华大学和香港大学的研究团队共同推出了一款名为 DAPO(动态采样策略优化)的开源系统,旨在提升大语言模型(LLM)的推理能力。DAPO 的发布标志着在强化学习(RL)技术应用于大规模语...
    新技术# DAPO# 动态采样策略优化# 大语言模型
    9个月前
    02550
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    Amazon Bedrock

    Amazon Bedrock

    Amazon Bedrock 是亚马逊AWS推出的一项完全托管的服务,旨在为用户提供一种简单、安全且高效的方式来构建和部署生成式AI应用程序。通过整合来自多家行业领先AI公司的高性能基础模型,Bedrock 提供了一个统一的API接口,使开发者能够轻松试验、评估并定制适合其特定需求的模型。此外,Bedrock 的无服务器架构让用户无需管理底层基础设施,从而专注于应用开发与优化。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单