大语言模型

排序

发布更新浏览点赞

Meta FAIR提出 Darling：用强化学习平衡大语言模型生成质量与语义多样性

由 Meta FAIR、卡内基梅隆大学与约翰霍普金斯大学联合提出的新框架 Darling（Diversity-Aware Reinforcement Learning for Generation...

7个月前

02190

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

字节跳动Seed团队和南京大学的研究人员推出DuPO框架，它通过双学习（dual learning）和偏好优化（preference optimization）的方法，使大语言模型（LLMs）能够在没...

新技术 # DuPO框架 # 大语言模型

7个月前

01900

Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

MistralAI宣布推出Mistral Small 3.1，这一新模型在性能和功能上均达到了同级别模型中的顶尖水平。作为Mistral Small 3的升级版本，3.1版本不仅在文本性能和多模态理解...

大语言模型 # Mistral AI # Mistral Small 3.1 # 大语言模型

1年前

01870

GreenBoost：Linux 下的“显存无限”魔法，让 12GB 显卡跑 32GB 大模型

你是否拥有一张消费级显卡（如 RTX 4070/5070 12GB），却眼馋那些需要 24GB 甚至 48GB 显存才能运行的超大语言模型（如 GLM-4-Flash, Llama-3-70B）？传...

新技术 # GreenBoost # 大语言模型

2周前

01680

大语言模型知识获取研究新工具：特拉维夫大学与麦吉尔大学推出 LMEnt 套件

语言模型正在越来越多地承担需要世界知识的任务：回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决：模型是如何从训练数据中“学会”知识的？我们训练模型时喂的是文本，但它输出的却是“信念...

大语言模型 # LMEnt # 大语言模型

7个月前

01460

Beyond Memorization：通过不同的架构和训练方法来提升大语言模型多步推理能力

阿联酋MBZUAI、莫斯科物理技术学院、莫斯科AIRI和伦敦数学科学研究所的研究人员推出Beyond Memorization，通过不同的架构和训练方法来提升大语言模型（LLMs）多步推理能力。作者们...

新技术 # Beyond Memorization # 大语言模型

7个月前

0970

没有了

Meta FAIR提出 Darling：用强化学习平衡大语言模型生成质量与语义多样性

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

GreenBoost：Linux 下的“显存无限”魔法，让 12GB 显卡跑 32GB 大模型

大语言模型知识获取研究新工具：特拉维夫大学与麦吉尔大学推出 LMEnt 套件

Beyond Memorization：通过不同的架构和训练方法来提升大语言模型多步推理能力

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂

大语言模型

Meta FAIR提出 Darling：用强化学习平衡大语言模型生成质量与语义多样性

DuPO框架：通过双学习和偏好优化的方法，使大语言模型能够在没有标注数据的情况下进行自我验证和优化

Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

GreenBoost：Linux 下的“显存无限”魔法，让 12GB 显卡跑 32GB 大模型

大语言模型知识获取研究新工具：特拉维夫大学与麦吉尔大学推出 LMEnt 套件

Beyond Memorization：通过不同的架构和训练方法来提升大语言模型多步推理能力

网址

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂