SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    5个月前
    04790
    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    上海交通大学、香港科技大学(广州)、利物浦大学、加州大学伯克利分校、上海创新学院、加州大学戴维斯分校、弗吉尼亚理工大学和伦敦大学学院的研究人员发布Agentic Web(智能体网络),它探讨了如何通过...
    新技术# Agentic Web
    5个月前
    01370
    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost,通过一个统一的扩散变换器(Diffusion Transformer)同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能。 项目主页...
    新技术# Voost# 虚拟试穿
    5个月前
    02540
     LaTCoder:将网页设计图像自动转换为代码

     LaTCoder:将网页设计图像自动转换为代码

    华中科技大学和重庆大学的研究人员提出了一种名为 LaTCoder 的新方法,将网页设计图像自动转换为代码(即设计到代码,design-to-code)。这种方法通过引入“布局即思考”(Layout-a...
    新技术# LaTCoder
    5个月前
    02250
    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    在 AI 智能体(Agent)技术快速发展的当下,开发者已经可以通过 LangChain、AutoGen、OpenAI Agent SDK 等框架,快速构建具备工具调用、多轮对话和任务编排能力的智能系...
    新技术# Agent Lightning# 微软# 智能体
    5个月前
    01350
    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    由腾讯 AI 西雅图实验室、圣路易斯华盛顿大学、马里兰大学帕克分校与德克萨斯大学达拉斯分校联合提出的新框架 R-Zero,正在挑战当前大语言模型训练范式的边界。 项目主页:https://chengs...
    新技术# R-Zero# 推理增强框架
    5个月前
    05800
    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    纽约大学、英特尔和AMD的研究人员推出一种基于二维高斯分布的图像表示方法Image-GS,它通过自适应地分配和优化一组二维高斯分布来重建图像。这种方法旨在为图像和纹理提供一种高效、灵活且硬件友好的表示...
    新技术# Image-GS# 图像表示方法
    5个月前
    01750
    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    在大语言模型(LLM)领域,扩散型大语言模型(Diffusion Large Language Models, DLLMs)正凭借其并行生成能力与全局上下文建模优势,成为传统自回归模型(AR)的有力竞...
    新技术# DAEDAL# 扩散大模型
    5个月前
    02180
    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    上海交通大学、山东大学、电子科技大学和香港科技大学的研究人员推出加速DiT架构模型推理速度的新方法TaylorSeer,扩散模型在图像和视频生成任务中表现出色,但其计算需求较高,限制了实时应用的可行性...
    新技术# TaylorSeer
    5个月前
    01580
    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    近年来,视频生成模型在质量上取得了显著进步。然而,一个根本性挑战始终存在: 时序维度的引入,使计算成本呈指数级增长。 标准扩散模型中的稠密注意力机制(Dense Attention)在处理长视频时面临...
    新技术# Radial Attention
    5个月前
    01750
    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO),用于训练大型语言模型(LLMs)。与以往基于单个标记(token)重要性比率...
    新技术# GSPO# Qwen3
    6个月前
    03380
    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    在文本到图像生成中,如何让模型“不生成某样东西”——例如“一只没有翅膀的鸟”或“一辆没有轮子的自行车”——始终是一个挑战。尽管正向提示可以引导生成内容,但负提示(negative prompt)的执行...
    新技术# VSF# 负面提示
    6个月前
    01650
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单