高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量近年来,大语言模型(LLM)的快速发展为AI领域带来了巨大的潜力,但其对计算资源的高需求也限制了广泛应用。无论是研究机构还是个人开发者,都面临着高昂的成本和技术门槛。然而,这一局面可能即将被打破。 由...新技术# HIGGS# 大语言模型8个月前02620
Mistral AI旗下AI助手Le Chat 推出文件组织与协作新功能 LibrariesMistral AI旗下AI助手Le Chat 最近推出了一项名为 Libraries 的新功能,帮助用户更高效地组织和管理文件。尽管目前仅支持 PDF 文件,结合 Mistral AI 最近发布的 ...早报# Le Chat# Libraries# Mistral AI9个月前03330
xAI 即将推出 Grok 系列重大更新:Grok 3.5、语音视觉功能与更多新特性埃隆·马斯克旗下的 xAI 正在为其 Grok 系列产品准备一系列令人期待的更新,涵盖模型性能提升、新功能开发以及用户体验优化。这些更新不仅展示了 xAI 在人工智能领域的持续投入,也进一步缩小了 G...早报# Grok# Grok 3.5# xAI9个月前08410
字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型(LLM)在复杂、冗长任务中的推理能力而设计,特别是在数学推理和长链推理(Long Chain-of-T...新技术# VAPO# 大语言模型# 字节跳动9个月前04220
Meta原版Llama-4-Maverick模型在基准测试中大翻车本周,Meta因使用未经发布的实验版Llama 4 Maverick模型在众包基准测试平台LM Arena上获得高分而引发争议。这一事件不仅促使LM Arena的维护者公开道歉并调整政策,还让未经修改...早报# Llama 4 Maverick# Meta9个月前02350
Canva全面拥抱AI:新增图像生成、交互式编程与电子表格功能设计工具领域的领军企业Canva近日宣布推出一系列全新AI功能,进一步扩展其平台的能力。这些新功能包括AI助手(Canva AI)、通过提示创建交互式应用程序的能力(Canva Code)、AI驱动的...早报# AI# Canva9个月前05340
OpenAI推出“领域特定”AI基准计划Pioneer Program,重新定义模型评估标准OpenAI近日宣布启动一项名为“先锋计划”(Pioneer Program)的新项目,旨在为AI模型设计一套全新的“领域特定”评估标准。这一计划的核心目标是解决当前AI基准测试存在的缺陷,帮助行业更...早报# OpenAI# Pioneer Program9个月前02350
YouTube推出AI生成音乐功能Creator Music,创作者可轻松定制器乐背景YouTube正在测试一项全新功能,允许创作者通过AI技术生成定制的器乐背景音乐,并将其无缝添加到视频中。这一更新由YouTube在其Creator Insider频道发布,标志着平台在AI辅助创作领...早报# Creator Music# YouTube9个月前02110
伊利亚·苏茨凯维的新AI公司SSI正与谷歌云展开深度合作OpenAI联合创始人兼前首席科学家伊利亚·苏茨凯维(Ilya Sutskever)创立的新AI初创公司Safe Superintelligence(SSI),正与谷歌云展开深度合作。根据周三的一份联...早报# SSI# 伊利亚·苏茨凯维# 谷歌云9个月前02050
OpenAI宣布将于4月30日停用GPT-4OpenAI近日宣布,将于4月30日从ChatGPT中正式停用两年前推出的AI模型GPT-4。根据周四发布的更新日志,GPT-4将被当前ChatGPT的默认模型GPT-4o“完全取代”。不过,用户仍可...早报# GPT-4# OpenAI# 萨姆·奥尔特曼9个月前03230
爱尔兰数据监管机构调查X:欧洲用户数据是否被滥用于训练Grok?爱尔兰数据保护委员会(DPC)于周五宣布,已对埃隆·马斯克旗下的社交媒体平台X展开正式调查。此次调查的重点在于X是否使用从欧洲用户公开帖子中提取的个人数据来训练生成式AI模型Grok。这一举动引发了关...早报# Grok# X# xAI9个月前03110
Allen人工智能研究所推出OLMoTrace:让大语言模型透明化,追溯AI决策的真实来源在企业AI应用中,大语言模型(LLM)的“黑盒”特性一直是阻碍其大规模采用的主要障碍之一。如何理解模型输出的来源、提升透明度并增强信任,成为行业亟需解决的问题。本周,Allen人工智能研究所(Ai2...新技术# Ai2# OLMoTrace# 大语言模型9个月前03330