SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    驳“大型推理模型不是真正的智能模型”:Claude Opus第一作者发文指出苹果论文实验设计局限

    新驳“大型推理模型不是真正的智能模型”:Claude Opus第一作者发文指出苹果论文实验设计局限

    近日,Anthropic 研究团队在一篇新发布的论文中,对苹果公司 Shojaee 等人(2025)提出的观点进行了系统性反驳。该观点认为:大型推理模型(LRMs)在复杂规划任务中表现出“准确性崩溃...
    早报# Claude Opus# 推理模型# 苹果
    8小时前
    050
    多智能体系统的构建与实战:Anthropic 如何打造高效研究代理

    新多智能体系统的构建与实战:Anthropic 如何打造高效研究代理

    Anthomic 发布了一篇关于其多智能体研究系统的深度技术解析文章,详细阐述了他们如何利用多个 Claude 智能体协作完成复杂研究任务,并分享了从原型到生产过程中的关键经验教训。 本文不仅揭示了多...
    科普# Anthropic# 多智能体
    9小时前
    020
    Holo1:HCompany开源高性能视觉-语言模型,赋能Surfer-H代理实现精准网页交互

    新Holo1:HCompany开源高性能视觉-语言模型,赋能Surfer-H代理实现精准网页交互

    Holo1 是由 HCompany 开发的一款专为网络代理系统设计的 动作视觉-语言模型(VLM),作为 Surfer-H 网络代理的核心组件之一,它具备像人类用户一样与网页界面交互的能力。 模型:h...
    多模态模型# Holo1# 视觉-语言模型
    17小时前
    040
    字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    新字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    近年来,随着扩散模型等深度生成技术的发展,视频生成能力取得了显著进步。然而,在涉及多个参考主体的场景中,如何保证各主体之间的视觉一致性、身份一致性和生成稳定性,依然是一个重大挑战。 为了解决这一问题...
    视频模型# MAGREF# 字节跳动# 视频生成框架
    17小时前
    040
    浙大 & vivo 联合发布 MagicTryOn:首个基于扩散 Transformer 的视频虚拟试衣框架

    新浙大 & vivo 联合发布 MagicTryOn:首个基于扩散 Transformer 的视频虚拟试衣框架

    在虚拟试衣技术持续发展的背景下,如何在视频中实现自然、真实、连贯的服装模拟,依然是一个极具挑战性的课题。 浙江大学、vivo 和博维智慧科技的研究团队提出了一种全新的视频虚拟试衣(Video Virt...
    视频模型# MagicTryOn# Wan2.1# 视频虚拟试衣
    1天前
    050
    告别塑料感!腾讯开源新一代 3D 生成大模型混元 3D 2.1

    新告别塑料感!腾讯开源新一代 3D 生成大模型混元 3D 2.1

    在计算机视觉领域顶级会议 CVPR 2025 上,腾讯宣布将旗下 混元 3D 2.1 大模型全面开源,这是目前首个实现全链路开源的工业级 3D 生成大模型,标志着国产 AI 在 3D 内容生成领域的又...
    3D模型# 混元 3D 2.1# 腾讯
    1天前
    090
    Firefox 139 正式支持 Perplexity AI 搜索引擎,提升学术与编程场景体验

    新Firefox 139 正式支持 Perplexity AI 搜索引擎,提升学术与编程场景体验

    Mozilla 与 Perplexity AI 的合作终于落地。在最新发布的 Firefox 火狐浏览器 139 版本中,用户现已可以将 Perplexity AI 添加为搜索引擎,进一步拓展浏览器在...
    百科# Firefox# Perplexity AI
    1天前
    050
    微软 VS Code 1.101 发布:正式集成 MCP 协议,迈向“AI 编辑器”关键一步

    新微软 VS Code 1.101 发布:正式集成 MCP 协议,迈向“AI 编辑器”关键一步

    微软近日发布了 Visual Studio Code 1.101 版本更新,重点引入了对 Model Context Protocol(MCP)协议 的原生支持。这一改动标志着 VS Code 正式向...
    早报# VS Code 1.101# 微软
    1天前
    090
    Meta豪掷150亿美元投资Scale AI,补强AI短板

    新Meta豪掷150亿美元投资Scale AI,补强AI短板

    近日,社交巨头Meta宣布向数据标注初创公司Scale AI投资150亿美元,并聘请其联合创始人兼前CEO亚历山大·王(Alexandr Wang),引发业界广泛关注。 这笔交易不仅让Scale AI...
    早报# Meta# Scale AI
    1天前
    050
    谷歌搜索新增“音频概览(Audio Overview)”功能:让搜索结果‘说出来

    新谷歌搜索新增“音频概览(Audio Overview)”功能:让搜索结果‘说出来

    谷歌最近在搜索功能中引入了一项新尝试——基于搜索结果生成AI语音对话。这项功能被称为“音频概览(Audio Overview)”,它让你无需点击链接或阅读文字摘要,就能通过两个AI角色之间的对话,快速...
    早报# 谷歌# 音频概览
    1天前
    090
    Frequency Separation Extension for WebUI:频率分离新玩法,让 SD WebUI 输出更清晰的图像

    新Frequency Separation Extension for WebUI:频率分离新玩法,让 SD WebUI 输出更清晰的图像

    在使用 Stable Diffusion 进行图像生成时,我们常常会遇到一个痛点:细节不够清晰、纹理被模糊处理。这通常是由 VAE(变分自编码器)在解码过程中对高频信息的“软化”所导致。 为了解决这一...
    web UI# Frequency Separation# SD WebUI
    2天前
    040
    Sparc3D:用于高分辨率三维形状建模的稀疏表示和构建框架

    新Sparc3D:用于高分辨率三维形状建模的稀疏表示和构建框架

    南洋理工大学、Math Magic和伦敦帝国理工学院的研究人员推出一个用于高分辨率三维形状建模的稀疏表示和构建框架 Sparc3D,它通过稀疏可变形的 Marching Cubes(Sparcubes...
    3D模型# Sparc3D
    2天前
    0270
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    扣子空间

    扣子空间

    扣子空间(Coze Space)是一个通用型 AI Agent 平台,允许用户用自然语言描述任务,比如生成一份研究报告或一个 PPT。平台会自动分析需求,调用合适的工具和插件来完成任务,输出如网页、文档或表格等内容。它特别适合没有编程经验的用户,通过可视化界面快速搭建 AI 应用。
    RunningHub

    RunningHub

    RunningHub 是一个云平台,让用户轻松开发和分享 AI 应用。它特别适合那些希望通过浏览器直接操作的创作者,无需复杂的本地设置。平台基于 ComfyUI 工作流,提供强大的 GPU 云计算支持,确保高效任务执行。
    AI Speaker

    AI Speaker

    AI Speaker 是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的 语音,支持100多种语言和600多种AI语音。
    星野APP

    星野APP

    星野APP是一款由MiniMax开发的AI伴侣应用,专为中国用户设计,旨在提供个性化的虚拟交互体验。用户可以通过星野APP创建自己的AI角色,定制其外貌、声音、性格和技能。
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    查看完整榜单