SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 41 篇文章
    排序
    发布更新浏览点赞
    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    由 Meta FAIR、卡内基梅隆大学与约翰霍普金斯大学联合提出的新框架 Darling(Diversity-Aware Reinforcement Learning for Generation...
    新技术# Darling# Meta FAIR# 大语言模型
    6个月前
    02040
    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    语言模型正在越来越多地承担需要世界知识的任务:回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决: 模型是如何从训练数据中“学会”知识的? 我们训练模型时喂的是文本,但它输出的却是“信念...
    大语言模型# LMEnt# 大语言模型
    6个月前
    01430
    Beyond Memorization:通过不同的架构和训练方法来提升大语言模型多步推理能力

    Beyond Memorization:通过不同的架构和训练方法来提升大语言模型多步推理能力

    阿联酋MBZUAI、莫斯科物理技术学院、莫斯科AIRI和伦敦数学科学研究所的研究人员推出Beyond Memorization,通过不同的架构和训练方法来提升大语言模型(LLMs)多步推理能力。作者们...
    新技术# Beyond Memorization# 大语言模型
    6个月前
    0950
    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    DuPO框架:通过双学习和偏好优化的方法,使大语言模型能够在没有标注数据的情况下进行自我验证和优化

    字节跳动Seed团队和南京大学的研究人员推出DuPO框架,它通过双学习(dual learning)和偏好优化(preference optimization)的方法,使大语言模型(LLMs)能够在没...
    新技术# DuPO框架# 大语言模型
    7个月前
    01800
    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS:为大语言模型设计的长期记忆操作系统

    MemOS 是由记忆张量科技联合上海交通大学、同济大学、浙江大学、北京大学等多所高校及研究机构联合开源的一项突破性研究成果——专为大语言模型(LLMs)设计的长期记忆操作系统。 项目主页:https...
    大语言模型# MemOS# 大语言模型
    8个月前
    05430
    LongWriter-Zero:通过强化学习从零开始训练大语言模型,以实现超长文本生成

    LongWriter-Zero:通过强化学习从零开始训练大语言模型,以实现超长文本生成

    新加坡科技设计大学和清华大学的研究人员推出新型模型LongWriter-Zero,基于 Qwen 2.5-32B-Base 构建,通过强化学习(RL)从零开始训练大语言模型(LLMs),以实现超长文本...
    大语言模型# LongWriter-Zero# 大语言模型
    9个月前
    02580
    LMCache:为大语言模型加速的新一代缓存系统

    LMCache:为大语言模型加速的新一代缓存系统

    随着大语言模型(LLM)在各类应用场景中的广泛部署,如何提升推理效率、降低延迟、节省资源成为关键挑战。近日,开源项目 LMCache 正式亮相,它是一个专为 LLM 服务优化的高性能缓存引擎,显著降低...
    新技术# LMCache# 大语言模型# 缓存
    9个月前
    03660
    针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律

    针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律

    香港大学和字节跳动的研究人员介绍了一种针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律。量化是一种减少模型权重和激活精度的方法,以降低内存使用和计算成本。尽管现有的量化方法在中等精度...
    新技术# 大语言模型# 量化感知训练
    10个月前
    02700
    ComfyUI LLM Toolkit:将各种大语言模型提供商与 ComfyUI 集成的自定义节点集合

    ComfyUI LLM Toolkit:将各种大语言模型提供商与 ComfyUI 集成的自定义节点集合

    ComfyUI LLM Toolkit是一个专为 ComfyUI 打造的自定义节点集合,旨在将多种大语言模型(包括云端和本地模型)无缝集成到工作流中。无论是文本生成、图像创作,还是未来的视频生成,这款...
    插件# ComfyUI LLM Toolkit# 大语言模型
    10个月前
    02330
    ComfyUI GeminiOllama Extension:将大语言模型及多种图像处理工具集成到 ComfyUI 中

    ComfyUI GeminiOllama Extension:将大语言模型及多种图像处理工具集成到 ComfyUI 中

    ComfyUI GeminiOllama Extension是一款ComfyUI插件,此插件将 Google 的 Gemini API、OpenAI(ChatGPT)、Anthropic 的 Clau...
    插件# ComfyUI GeminiOllama Extension# 大语言模型
    11个月前
    06310
    高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量

    高效的无数据量化方法HIGGS:可快速压缩大语言模型而无需显著牺牲质量

    近年来,大语言模型(LLM)的快速发展为AI领域带来了巨大的潜力,但其对计算资源的高需求也限制了广泛应用。无论是研究机构还是个人开发者,都面临着高昂的成本和技术门槛。然而,这一局面可能即将被打破。 由...
    新技术# HIGGS# 大语言模型
    11个月前
    02820
    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型(LLM)在复杂、冗长任务中的推理能力而设计,特别是在数学推理和长链推理(Long Chain-of-T...
    新技术# VAPO# 大语言模型# 字节跳动
    11个月前
    05580
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    QClaw

    新QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    纳米漫剧流水线

    纳米漫剧流水线

    国内首个工业级 AI 漫剧智能体生产平台 ——“纳米漫剧流水线” 启动公开测试。该平台面向漫剧工作室、视频制作机构与专业创作者,直击行业 “效率与品质难以兼顾” 的长期痛点,以高效量产、品质可控、风格统一为核心,正式开启 AI 漫剧工业化生产新时代。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    Cutia

    Cutia

    Cutia 是一个开源、基于浏览器的视频编辑工具,旨在成为 CapCut 的最佳替代品。它坚持“本地优先”的理念,让你无需安装任何重型软件,只需打开浏览器,即可享受专业级的多轨道剪辑体验,且全程无订阅、无追踪、无水印。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    查看完整榜单