SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    大语言模型

    共 303 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Block Diffusion:结合了自回归(Autoregressive)和扩散(Diffusion)模型优点的新型语言生成模型

    Block Diffusion:结合了自回归(Autoregressive)和扩散(Diffusion)模型优点的新型语言生成模型

    康奈尔科技校区、斯坦福大学和Cohere推出语言模型Block Diffusion,它是一种结合了自回归(Autoregressive)和扩散(Diffusion)模型优点的新型语言生成模型。论文的核...
    大语言模型# Block Diffusion# 大语言模型
    1年前
    05700
    谷歌推出Gemma系列最新模型Gemma 3,号称是全球最佳单加速器模型

    谷歌推出Gemma系列最新模型Gemma 3,号称是全球最佳单加速器模型

    自首次推出以来,Gemma 模型已被下载超过 1 亿次,社区创造了超过 60,000 个适用于各种用例的变体。今天,谷歌正式发布 Gemma 3,这是 Gemma 开源模型家族中最强大、最先进的版本...
    大语言模型# Gemma 3# 多语言大语言模型# 大语言模型
    1年前
    02620
    卡内基梅隆大学推出 L1-1.5B:用强化学习优化 AI 推理过程,精准控制“思考”时长

    卡内基梅隆大学推出 L1-1.5B:用强化学习优化 AI 推理过程,精准控制“思考”时长

    推理语言模型通过生成更长的思维链序列来提升性能,但目前无法控制推理长度,导致计算资源分配低效。模型可能生成过长输出浪费资源,或过早停止导致性能不佳。传统方法(如使用“等待”或“最终答案”标记)会降低性...
    大语言模型# L1-1.5B# 卡内基梅隆大学# 推理模型
    1年前
    03020
    AI21开源大语言模型Jamba 1.6系列,适合企业私有部署

    AI21开源大语言模型Jamba 1.6系列,适合企业私有部署

    AI21 正式发布开源模型Jamba 1.6 系列,专为企业私有部署设计,兼具卓越性能和数据安全性。 模型地址:https://huggingface.co/collections/ai21labs...
    大语言模型# AI21# Jamba 1.6# 大语言模型
    1年前
    05570
    老显卡福音!美团技术团队开源INT8无损满血版DeepSeek R1

    老显卡福音!美团技术团队开源INT8无损满血版DeepSeek R1

    美团技术团队于3月6日宣布对 DeepSeek R1 模型进行了 INT8 精度量化,使其能够在如 A100 等老型号 GPU 上进行部署。这一技术突破为 DeepSeek R1 的广泛应用提供了更多...
    大语言模型# DeepSeek-R1# 美团
    1年前
    03940
    AMD 推出完全开源的 3B 参数语言模型Instella-3B,媲美 Llama-3.2-3B 和 Qwen2.5-3B

    AMD 推出完全开源的 3B 参数语言模型Instella-3B,媲美 Llama-3.2-3B 和 Qwen2.5-3B

    在AI领域,开源模型的发展一直是推动技术进步和创新的重要力量。AMD宣布推出 Instella,这是一系列完全开源的语言模型,基于 AMD Instinct™ MI300X GPU 从头训练,参数量达...
    大语言模型# AMD# Instella-3B# Llama-3.2-3B
    1年前
    02220
    阿里达摩院开源多语言大语言模型Babel:解决现有开源多语言模型在语言覆盖上的不足

    阿里达摩院开源多语言大语言模型Babel:解决现有开源多语言模型在语言覆盖上的不足

    阿里达摩院推出开源多语言大语言模型Babel,旨在解决现有开源多语言模型在语言覆盖上的不足。Babel 支持全球前 25 种使用人数最多的语言,覆盖超过 90% 的全球人口,并特别关注那些被现有模型忽...
    大语言模型# Babel# 多语言大语言模型# 阿里达摩院
    1年前
    02560
    阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

    阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

    阿里云的Qwen团队最近宣布了一项重要进展,他们通过整合大规模强化学习(RL)技术来提升大语言模型的智能水平,并推出了新的推理模型QwQ-32B。这款拥有320亿参数的模型,在性能上能够与具有6710...
    大语言模型# Qwen# QwQ-32B# 强化学习
    1年前
    03350
    360推出Light-R1-32B:通过SFT和DPO以低成本超越DeepSeek-R1-Distill-Qwen-32B

    360推出Light-R1-32B:通过SFT和DPO以低成本超越DeepSeek-R1-Distill-Qwen-32B

    在数学竞赛 AIME24 上,尽管许多研究者尝试在 72B 或更小的模型上复现 DeepSeek-R1-Distill-Qwen-32B 的 72.6 分,但一直未能成功。 模型 集成模型 推出日期 ...
    大语言模型# 360# Light-R1-32B# 推理模型
    1年前
    03880
    Prompt-to-Leaderboard (P2L):为特定使用场景量身定制的大语言模型排行榜

    Prompt-to-Leaderboard (P2L):为特定使用场景量身定制的大语言模型排行榜

    LMArena 推出了 Prompt-to-Leaderboard(P2L),这是一种创新方法,旨在通过自然语言提示生成针对特定使用场景的实时大语言模型(LLM)排行榜。P2L 的核心思想是训练一个大...
    大语言模型# P2L# 大语言模型
    1年前
    05580
    OpenAI推出最新模型GPT-4.5,这是迄今为止该公司发布的最大模型

    OpenAI推出最新模型GPT-4.5,这是迄今为止该公司发布的最大模型

    OpenAI 于北京时间2月28日正式推出其最新模型 GPT-4.5,这是迄今为止该公司发布的最大模型,使用的计算能力和数据量均超过以往任何模型。然而,尽管规模庞大,OpenAI 并未将 GPT-4...
    大语言模型# GPT-4.5# OpenAI
    1年前
    04820
    Qodo推出代码嵌入模型Qodo-Embed-1:专为软件开发领域设计,在优化自然语言到代码和代码到代码的检索任务

    Qodo推出代码嵌入模型Qodo-Embed-1:专为软件开发领域设计,在优化自然语言到代码和代码到代码的检索任务

    在软件开发领域,代码嵌入模型正逐渐成为提升开发效率和代码质量的关键工具。今天,Qodo 宣布推出其最新的代码嵌入模型系列 Qodo-Embed-1,该系列在保持较小模型体积的同时,实现了最先进的性能...
    大语言模型# Qodo# Qodo-Embed-1# Qodo-Embed-1-1.5B
    1年前
    05800
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    pure-genealogy

    pure-genealogy

    pure-genealogy是一个完全开源、深度中文化、支持多维可视化的现代化家族族谱管理系统。它不仅是一个工具,更是一种数字家史的载体。
    ljg-skills

    ljg-skills

    李继刚(知名设计师、提示词工程师)将其沉淀已久的思维模型与创作工作流,封装为一套专为 Claude Code 设计的自定义技能集 —— ljg-skills。
    同事.skill

    同事.skill

    同事.skill 是一款创新工具。它不仅能提取离职同事的技术规范和工作经验,更能通过飞书消息、钉钉文档、微信聊天记录等“数字足迹”,还原其性格特质、沟通风格甚至“甩锅”技巧。
    Qwen Chat

    Qwen Chat

    Qwen Chat是阿里通义团队在海外市场推出了一款全新的AI助手,可以看作是通义千问的海外版,这款助手基于开源的Open WebUI框架开发而成。
    查看完整榜单