Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性由 Meta FAIR、卡内基梅隆大学与约翰霍普金斯大学联合提出的新框架 Darling(Diversity-Aware Reinforcement Learning for Generation...新技术# Darling# Meta FAIR# 大语言模型3个月前01550
大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件语言模型正在越来越多地承担需要世界知识的任务:回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决: 模型是如何从训练数据中“学会”知识的? 我们训练模型时喂的是文本,但它输出的却是“信念...大语言模型# LMEnt# 大语言模型3个月前01320
Beyond Memorization:通过不同的架构和训练方法来提升大语言模型多步推理能力阿联酋MBZUAI、莫斯科物理技术学院、莫斯科AIRI和伦敦数学科学研究所的研究人员推出Beyond Memorization,通过不同的架构和训练方法来提升大语言模型(LLMs)多步推理能力。作者们...新技术# Beyond Memorization# 大语言模型3个月前0840
DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化字节跳动Seed团队和南京大学的研究人员推出DuPO框架,它通过双学习(dual learning)和偏好优化(preference optimization)的方法,使大语言模型(LLMs)能够在没...新技术# DuPO框架# 大语言模型4个月前01550
MemOS:为大语言模型设计的长期记忆操作系统MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型(LLMs)设计的长期记忆操作系统。 项目主页:https...大语言模型# MemOS# 大语言模型5个月前03800
LongWriter-Zero:通过强化学习从零开始训练大语言模型,以实现超长文本生成新加坡科技设计大学和清华大学的研究人员推出新型模型LongWriter-Zero,基于 Qwen 2.5-32B-Base 构建,通过强化学习(RL)从零开始训练大语言模型(LLMs),以实现超长文本...大语言模型# LongWriter-Zero# 大语言模型6个月前02320
LMCache:为大语言模型加速的新一代缓存系统随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...新技术# LMCache# 大语言模型# 缓存6个月前03270
针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律香港大学和字节跳动的研究人员介绍了一种针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律。量化是一种减少模型权重和激活精度的方法,以降低内存使用和计算成本。尽管现有的量化方法在中等精度...新技术# 大语言模型# 量化感知训练7个月前02340
ComfyUI LLM Toolkit:将各种大语言模型提供商与 ComfyUI 集成的自定义节点集合ComfyUI LLM Toolkit是一个专为 ComfyUI 打造的自定义节点集合,旨在将多种大语言模型(包括云端和本地模型)无缝集成到工作流中。无论是文本生成、图像创作,还是未来的视频生成,这款...插件# ComfyUI LLM Toolkit# 大语言模型7个月前02110
ComfyUI GeminiOllama Extension:将大语言模型及多种图像处理工具集成到 ComfyUI 中ComfyUI GeminiOllama Extension是一款ComfyUI插件,此插件将 Google 的 Gemini API、OpenAI(ChatGPT)、Anthropic 的 Clau...插件# ComfyUI GeminiOllama Extension# 大语言模型8个月前03910
高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量近年来,大语言模型(LLM)的快速发展为AI领域带来了巨大的潜力,但其对计算资源的高需求也限制了广泛应用。无论是研究机构还是个人开发者,都面临着高昂的成本和技术门槛。然而,这一局面可能即将被打破。 由...新技术# HIGGS# 大语言模型8个月前02570
字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型(LLM)在复杂、冗长任务中的推理能力而设计,特别是在数学推理和长链推理(Long Chain-of-T...新技术# VAPO# 大语言模型# 字节跳动8个月前03930