SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    大语言模型

    共 41 篇文章
    排序
    发布更新浏览点赞
    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    由 Meta FAIR、卡内基梅隆大学与约翰霍普金斯大学联合提出的新框架 Darling(Diversity-Aware Reinforcement Learning for Generation...
    新技术# Darling# Meta FAIR# 大语言模型
    3个月前
    01550
    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    语言模型正在越来越多地承担需要世界知识的任务:回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决: 模型是如何从训练数据中“学会”知识的? 我们训练模型时喂的是文本,但它输出的却是“信念...
    大语言模型# LMEnt# 大语言模型
    3个月前
    01320
    Beyond Memorization:通过不同的架构和训练方法来提升大语言模型多步推理能力

    Beyond Memorization:通过不同的架构和训练方法来提升大语言模型多步推理能力

    阿联酋MBZUAI、莫斯科物理技术学院、莫斯科AIRI和伦敦数学科学研究所的研究人员推出Beyond Memorization,通过不同的架构和训练方法来提升大语言模型(LLMs)多步推理能力。作者们...
    新技术# Beyond Memorization# 大语言模型
    3个月前
    0840
    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    字节跳动Seed团队和南京大学的研究人员推出DuPO框架,它通过双学习(dual learning)和偏好优化(preference optimization)的方法,使大语言模型(LLMs)能够在没...
    新技术# DuPO框架# 大语言模型
    4个月前
    01560
    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型(LLMs)设计的长期记忆操作系统。 项目主页:https...
    大语言模型# MemOS# 大语言模型
    5个月前
    03880
    LongWriter-Zero:通过强化学习从零开始训练大语言模型,以实现超长文本生成

    LongWriter-Zero:通过强化学习从零开始训练大语言模型,以实现超长文本生成

    新加坡科技设计大学和清华大学的研究人员推出新型模型LongWriter-Zero,基于 Qwen 2.5-32B-Base 构建,通过强化学习(RL)从零开始训练大语言模型(LLMs),以实现超长文本...
    大语言模型# LongWriter-Zero# 大语言模型
    6个月前
    02340
    LMCache:为大语言模型加速的新一代缓存系统

    LMCache:为大语言模型加速的新一代缓存系统

    随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...
    新技术# LMCache# 大语言模型# 缓存
    6个月前
    03300
    针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律

    针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律

    香港大学和字节跳动的研究人员介绍了一种针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律。量化是一种减少模型权重和激活精度的方法,以降低内存使用和计算成本。尽管现有的量化方法在中等精度...
    新技术# 大语言模型# 量化感知训练
    7个月前
    02350
    ComfyUI LLM Toolkit:将各种大语言模型提供商与 ComfyUI 集成的自定义节点集合

    ComfyUI LLM Toolkit:将各种大语言模型提供商与 ComfyUI 集成的自定义节点集合

    ComfyUI LLM Toolkit是一个专为 ComfyUI 打造的自定义节点集合,旨在将多种大语言模型(包括云端和本地模型)无缝集成到工作流中。无论是文本生成、图像创作,还是未来的视频生成,这款...
    插件# ComfyUI LLM Toolkit# 大语言模型
    7个月前
    02110
    ComfyUI GeminiOllama Extension:将大语言模型及多种图像处理工具集成到 ComfyUI 中

    ComfyUI GeminiOllama Extension:将大语言模型及多种图像处理工具集成到 ComfyUI 中

    ComfyUI GeminiOllama Extension是一款ComfyUI插件,此插件将 Google 的 Gemini API、OpenAI(ChatGPT)、Anthropic 的 Clau...
    插件# ComfyUI GeminiOllama Extension# 大语言模型
    8个月前
    04130
    高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量

    高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量

    近年来,大语言模型(LLM)的快速发展为AI领域带来了巨大的潜力,但其对计算资源的高需求也限制了广泛应用。无论是研究机构还是个人开发者,都面临着高昂的成本和技术门槛。然而,这一局面可能即将被打破。 由...
    新技术# HIGGS# 大语言模型
    8个月前
    02600
    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型(LLM)在复杂、冗长任务中的推理能力而设计,特别是在数学推理和长链推理(Long Chain-of-T...
    新技术# VAPO# 大语言模型# 字节跳动
    8个月前
    03990
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单