艾伦AI研究所发布Olmo 3系列模型:完全开放的推理模型,训练数据与中间步骤全透明在开源AI领域,“开放”往往局限于最终模型权重的分享,而模型训练的数据、流程、中间检查点等核心环节仍处于“黑箱”状态。Ai2(艾伦人工智能研究所)最新发布的 Olmo 3 系列模型,彻底打破了这一现状...大语言模型# Olmo 3# 艾伦AI研究所2周前01080
艾伦AI研究所推出Fluid Benchmarking:为每个语言模型定制最合适的考题在当前的语言模型评测中,我们通常采用“统一试卷”模式: 无论模型是刚起步的小型模型,还是千亿参数的顶尖系统,都使用同一套固定题目进行打分。 这就像让小学生和博士生做同一份数学卷子——看似公平,实则难以...新技术# Fluid Benchmarking# 流动基准测试# 艾伦AI研究所3个月前0970
艾伦AI研究所推出全新开源 ASR 模型家族OLMoASR在自动语音识别(ASR)领域,Whisper 一直是开源社区的标杆——强大、鲁棒、支持零样本迁移。但它有一个根本局限:训练数据未公开,模型行为难以分析,也无法完全复现。 现在,艾伦人工智能研究所(AI...语音模型# OLMoASR# 艾伦AI研究所3个月前0960
美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新美国国家科学基金会(NSF)与英伟达(NVIDIA)近日宣布达成一项重要合作,共同投资 1.52 亿美元,支持由 Allen 人工智能研究所(Ai2) 牵头的“开放多模态 AI 基础设施加速科学”(O...早报# Ai2# 美国国家科学基金会# 艾伦AI研究所4个月前03810
艾伦AI研究所发布10 亿参数的小模型Olmo 2 1B艾伦AI研究所(AI2)于周四发布了 Olmo 2 1B,这是一个拥有 10 亿参数的 AI 模型。AI2 宣称,该模型在多项基准测试中击败了谷歌、Meta 和阿里巴巴的同规模模型。尽管参数数量相对较...大语言模型# Olmo 2 1B# 艾伦AI研究所7个月前02230
艾伦AI研究所推出 olmOCR:高性能的 PDF 和文档图像文本提取工具包艾伦AI研究所正式推出了 olmOCR,这是一款高性能的开源工具包,专为将 PDF 和文档图像转换为干净、结构化的纯文本而设计。 GitHub:https://github.com/allenai/o...多模态模型# olmOCR# 艾伦AI研究所9个月前01750
艾伦AI研究所推出Tülu 3 405B:超越 DeepSeek V3 的性能表现艾伦AI研究所在成功推出Tülu 3之后,又在昨天宣布推出Tülu 3 405B——这是首次将完全开放的后训练方法应用于最大规模的开放权重模型。此次发布不仅展示了艾伦AI研究所在大规模参数模型上的可扩...大语言模型# Tülu 3# Tülu 3 405B# 艾伦AI研究所10个月前02690