SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    DeepSeek

    共 29 篇文章
    排序
    发布更新浏览点赞
    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    通过推理计算来提高通用奖励建模(RM)的推理时间可扩展性

    强化学习(RL)在大语言模型(LLM)的后续训练中已被广泛应用,尤其是在提升模型的推理能力方面。然而,如何在各种领域中为LLM获得准确的奖励信号,仍然是一个关键挑战。 论文:https://arxiv...
    新技术# DeepSeek# 奖励建模# 清华大学
    1年前
    03270
    DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署

    DeepSeek低调发布DeepSeek-V3-0324,性能超过Claude Sonnet 3.5,可在消费级硬件部署

    DeepSeek在昨晚悄悄地发布了一款新的大语言模型——DeepSeek-V3-0324。这款模型不仅因其出色的能力在AI行业掀起波澜,更因其独特的部署方式引发了广泛关注。该模型已经在Hugging ...
    早报# DeepSeek# Deepseek V3# DeepSeek-V3-0324
    1年前
    02030
    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番

    清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,大模型推理引擎“赤兔 Chitu”现已正式开源。该引擎首次实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行...
    新技术# Chitu# DeepSeek# 大模型推理引擎
    1年前
    03540
    Manus 可能并非中国的第二个“DeepSeek 时刻”

    Manus 可能并非中国的第二个“DeepSeek 时刻”

    科技媒体 TechCrunch报道:上周,一个名为Manus的“代理式”AI平台以预览形式发布,引发了巨大的关注和炒作。Hugging Face的产品负责人称Manus为“我尝试过的最令人印象深刻的A...
    早报# DeepSeek# Manus
    1年前
    04760
    亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek

    亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek

    据 Business Insider 报道,亚马逊正在开发自己的推理模型,以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS...
    早报# DeepSeek# OpenAI# 亚马逊
    1年前
    02880
    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    DeepSeek开源周第五弹:高性能分布式文件系统 3FS和Smallpond 数据处理框架

    在开源周的第五天,DeepSeek 正式发布了 3FS(Fire-Flyer File System)。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统,旨在为深度学习等数据密集型应用提...
    新技术# 3FS# DeepSeek# Smallpond
    1年前
    02660
    百度宣布文心大模型4.5将于3月16日发布,支持深度思考和原生多模态

    百度宣布文心大模型4.5将于3月16日发布,支持深度思考和原生多模态

    百度宣布,其最新的文心大模型4.5将于2025年3月16日正式上线。根据官方介绍,文心大模型4.5在基础模型能力上实现了显著提升,并具备原生多模态和深度思考等先进特性。此外,百度还计划从2025年6月...
    早报# DeepSeek# 文心大模型4.5# 李彦宏
    1年前
    02720
    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    摩尔线程宣布已经成功支持 DeepSeek 开源通信库 DeepEP 和并行算法 DualPipe

    在 DeepSeek 开源周的第四天,摩尔线程宣布了一项重要的技术进展:成功支持 DeepSeek 的开源通信库 DeepEP 和并行算法 DualPipe,并发布了相关的开源代码仓库 MT-Deep...
    早报# DeepEP# DeepSeek# DualPipe
    1年前
    03260
    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    DeepSeek 开源周第四弹:DualPipe 和 EPLB 的发布

    今天是 DeepSeek 开源周的第四天。与前三天相比,今天的开源项目公布稍晚一些,让关注者们等待得略显焦急,不过等待的结果总是值得的!DeepSeek 今日公布了两项重要的开源内容:DualPipe...
    新技术# DeepSeek# DualPipe# EPLB
    1年前
    02300
    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    深度求索开源第三弹DeepGEMM:专为高效 FP8 矩阵乘法设计的库

    在开源周的第三天,DeepSeek 推出了一个名为 DeepGEMM 的新库,专为高效、简洁的 FP8 通用矩阵乘法(GEMM)而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题,特别...
    新技术# DeepGEMM# DeepSeek# 深度求索
    1年前
    03020
    DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠

    DeepSeek 在暂停三周后重新开放 API充值,并推出夜间错峰优惠

    在因容量限制暂停服务近三周后,DeepSeek(深渡求索)于今日宣布重新开放其 API 充值,并推出夜间错峰优惠活动,以满足用户需求并优化服务体验。 暂停与恢复背景 DeepSeek 在此前因容量限制...
    早报# API# DeepSeek# 深渡求索
    1年前
    03580
    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    深度求索开源第二弹DeepEP:一款专为MoE模型和专家并行(EP)设计的开源通信库

    在大语言模型领域,专家混合(MoE)架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战,传统的全对全通信方法可能成为瓶颈。为此,深度求索开源第二弹Dee...
    新技术# DeepEP# DeepSeek# 深度求索
    1年前
    02600
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    即梦 CLI

    新即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单