SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    DeepSeek

    共 25 篇文章
    排序
    发布更新浏览点赞
    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,大模型推理引擎“赤兔 Chitu”现已正式开源。该引擎首次实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行...
    新技术# Chitu# DeepSeek# 大模型推理引擎
    9个月前
    03470
    DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠

    DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠

    在因容量限制暂停服务近三周后,DeepSeek(深渡求索)于今日宣布重新开放其 API 充值,并推出夜间错峰优惠活动,以满足用户需求并优化服务体验。 暂停与恢复背景 DeepSeek 在此前因容量限制...
    早报# API# DeepSeek# 深渡求索
    9个月前
    03240
    深度求索发布开源推理大语言模型DeepSeek-R1,性能对标 OpenAI o1 正式版

    深度求索发布开源推理大语言模型DeepSeek-R1,性能对标 OpenAI o1 正式版

    幻方量化旗下的AI公司深度求索(DeepSeek)今日正式发布了其最新的大语言模型DeepSeek-R1,并同步开源了模型权重。这一举措旨在通过提供高性能的开源解决方案,推动人工智能领域的发展。 地址...
    大语言模型# DeepSeek# DeepSeek-R1# 深度求索
    10个月前
    03230
    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    在 DeepSeek 开源周的第四天,摩尔线程宣布了一项重要的技术进展:成功支持 DeepSeek 的开源通信库 DeepEP 和并行算法 DualPipe,并发布了相关的开源代码仓库 MT-Deep...
    早报# DeepEP# DeepSeek# DualPipe
    9个月前
    03160
    Manus 可能并非中国的第二个“DeepSeek 时刻”

    Manus 可能并非中国的第二个“DeepSeek 时刻”

    科技媒体 TechCrunch报道:上周,一个名为Manus的“代理式”AI平台以预览形式发布,引发了巨大的关注和炒作。Hugging Face的产品负责人称Manus为“我尝试过的最令人印象深刻的A...
    早报# DeepSeek# Manus
    9个月前
    03080
    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    强化学习(RL)在大语言模型(LLM)的后续训练中已被广泛应用,尤其是在提升模型的推理能力方面。然而,如何在各种领域中为LLM获得准确的奖励信号,仍然是一个关键挑战。 论文:https://arxiv...
    新技术# DeepSeek# 奖励建模# 清华大学
    8个月前
    02960
    亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek

    亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek

    据 Business Insider 报道,亚马逊正在开发自己的推理模型,以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS...
    早报# DeepSeek# OpenAI# 亚马逊
    9个月前
    02750
    英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误

    英伟达 CEO 黄仁勋表示市场对 DeepSeek 的影响理解错误

    英伟达创始人兼首席执行官黄仁勋在最近的一次采访中表示,市场对 DeepSeek 技术进步及其对英伟达业务潜在负面影响的理解存在偏差。他强调,DeepSeek 的开源推理模型 R1 并不会削弱对计算资源...
    早报# DeepSeek# 英伟达# 黄仁勋
    10个月前
    02740
    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    在开源周的第三天,DeepSeek 推出了一个名为 DeepGEMM 的新库,专为高效、简洁的 FP8 通用矩阵乘法(GEMM)而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题,特别...
    新技术# DeepGEMM# DeepSeek# 深度求索
    9个月前
    02690
    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    在大语言模型领域,专家混合(MoE)架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战,传统的全对全通信方法可能成为瓶颈。为此,深度求索开源第二弹Dee...
    新技术# DeepEP# DeepSeek# 深度求索
    9个月前
    02520
    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提...
    新技术# 3FS# DeepSeek# Smallpond
    9个月前
    02480
    百度宣布文心大模型4.5将于3月16日发布,支持深度思考和原生多模态

    百度宣布文心大模型4.5将于3月16日发布,支持深度思考和原生多模态

    百度宣布,其最新的文心大模型4.5将于2025年3月16日正式上线。根据官方介绍,文心大模型4.5在基础模型能力上实现了显著提升,并具备原生多模态和深度思考等先进特性。此外,百度还计划从2025年6月...
    早报# DeepSeek# 文心大模型4.5# 李彦宏
    9个月前
    02480
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单