新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

高效稀疏注意力机制 SpargeAttn：加速大模型的推理过程，同时不损失模型性能

清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn，旨在加速大模型的推理过程，同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色，但由于其计算复杂度与序列...

10个月前

05000

DeepSeek开源周第五弹：高性能分布式文件系统 3FS和Smallpond 数据处理框架

在开源周的第五天，DeepSeek 正式发布了 3FS（Fire-Flyer File System）。这是一个专为现代 SSD 和 RDMA 网络设计的并行文件系统，旨在为深度学习等数据密集型应用提...

新技术 # 3FS # DeepSeek # Smallpond

10个月前

02490

Hugging Face 发布开源Python库FastRTC，简化实时 AI 语音和视频应用

AI 初创公司 Hugging Face 近日推出了一款名为 FastRTC 的开源 Python 库，旨在简化开发者构建实时音频和视频 AI 应用的复杂性。这一创新工具的发布，标志着实时 AI 应用...

新技术 # AI 语音 # FastRTC # Python 库

10个月前

02060

DeepSeek 开源周第四弹：DualPipe 和 EPLB 的发布

今天是 DeepSeek 开源周的第四天。与前三天相比，今天的开源项目公布稍晚一些，让关注者们等待得略显焦急，不过等待的结果总是值得的！DeepSeek 今日公布了两项重要的开源内容：DualPipe...

新技术 # DeepSeek # DualPipe # EPLB

10个月前

02230

深度求索开源第三弹DeepGEMM：专为高效 FP8 矩阵乘法设计的库

在开源周的第三天，DeepSeek 推出了一个名为 DeepGEMM 的新库，专为高效、简洁的 FP8 通用矩阵乘法（GEMM）而设计。这一工具旨在解决现代 AI 计算中矩阵乘法的效率和精度问题，特别...

新技术 # DeepGEMM # DeepSeek # 深度求索

10个月前

02730

深度求索开源第二弹DeepEP：一款专为MoE模型和专家并行（EP）设计的开源通信库

在大语言模型领域，专家混合（MoE）架构因其能在不显著增加计算量的情况下提升模型容量而受到青睐。但MoE模型在GPU间通信方面面临挑战，传统的全对全通信方法可能成为瓶颈。为此，深度求索开源第二弹Dee...

新技术 # DeepEP # DeepSeek # 深度求索

10个月前

02530

清华大学与瑞莱智慧联合团队推出RealSafe-R1：基于 DeepSeek R1 的安全优化大语言模型

随着大语言模型（LLMs）在各个领域的广泛应用，其安全性问题日益受到关注。尽管这些模型在性能上表现出色，但在面对恶意查询和越狱攻击时，仍存在一定的风险。为了应对这一挑战，清华大学与瑞莱智慧联合团队推出...

新技术 # DeepSeek-R1 # RealSafe-R1 # 大语言模型

10个月前

04260

DeepSeek开源高效解码内核FlashMLA：从英伟达Hopper GPU中榨取最大性能

随着全球对高性能计算需求的不断增长，AI模型训练和推理对硬件资源的需求也在快速攀升。然而，由于美国出口限制等原因，中国市场更多依赖于英伟达的“缩减版”H800 GPU（相较于H100功能有所削减）。这...

新技术 # DeepSeek # FlashMLA # H800

10个月前

02230

字节跳动推出统一的视频生成框架Phantom ：通过跨模态对齐实现主体一致性的视频生成

字节跳动的研究人员推出一个统一的视频生成框架Phantom ，通过跨模态对齐实现主体一致性的视频生成（Subject-to-Video, S2V），用于单主体和多主体参考，构建在现有的文本到视频和图像...

新技术 # Phantom # 字节跳动 # 视频生成

8个月前

02760

OpenAI 推出基准测试SWE-Lancer：评估 AI 模型在真实软件工程任务中的表现

OpenAI 最近推出了 SWE-Lancer，这是一个基于真实世界软件工程任务的基准测试平台。SWE-Lancer 包含超过 1400 个来自 Upwork 的自由软件工程任务，这些任务的总报酬价值...

新技术 # OpenAI # SWE-Lancer # 基准测试

10个月前

02930

埃隆·马斯克员工开发 DOGE AI 助手，目标提升美国政府效率

据 TechCrunch 报道，埃隆·马斯克的一名高级员工创建了一个名为 DOGE 的 AI 聊天机器人，旨在帮助美国政府效率部门（Government Efficiency Department，简...

新技术 # DOGE AI # 埃隆·马斯克

10个月前

02330

无需训练的视频重新打光方法Light-A-Video：对任意给定的视频序列或前景序列进行平滑且高质量的光照控制

上海交通大学、中国科学技术大学、香港中文大学、香港科技大学、斯坦福大学和上海人工智能实验室的研究人员推出Light-A-Video，这是一个无需训练（training-free）的视频重新打光（vid...

新技术 # Light-A-Video # 重新打光

10个月前

02680

加载更多

高效稀疏注意力机制 SpargeAttn：加速大模型的推理过程，同时不损失模型性能

DeepSeek开源周第五弹：高性能分布式文件系统 3FS和Smallpond 数据处理框架

Hugging Face 发布开源Python库FastRTC，简化实时 AI 语音和视频应用

DeepSeek 开源周第四弹：DualPipe 和 EPLB 的发布

深度求索开源第三弹DeepGEMM：专为高效 FP8 矩阵乘法设计的库

深度求索开源第二弹DeepEP：一款专为MoE模型和专家并行（EP）设计的开源通信库

清华大学与瑞莱智慧联合团队推出RealSafe-R1：基于 DeepSeek R1 的安全优化大语言模型

DeepSeek开源高效解码内核FlashMLA：从英伟达Hopper GPU中榨取最大性能

字节跳动推出统一的视频生成框架Phantom ：通过跨模态对齐实现主体一致性的视频生成

OpenAI 推出基准测试SWE-Lancer：评估 AI 模型在真实软件工程任务中的表现

埃隆·马斯克员工开发 DOGE AI 助手，目标提升美国政府效率

无需训练的视频重新打光方法Light-A-Video：对任意给定的视频序列或前景序列进行平滑且高质量的光照控制

朱雀大模型检测

Fogsight (雾象)

秒哒

Tripo

OiiOii AI

ITELLOU

新技术

网址

朱雀大模型检测

Fogsight (雾象)

秒哒

Tripo

OiiOii AI

ITELLOU