大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

Anthropic在今天推出全新模型Claude 3.7 Sonnet，号称业界首个“混合AI推理模型”。它不仅能实时回答问题，还能像人类一样“深度思考”，提供更精准的答案！用户可以自由选择让模型“思...

11个月前

03490

字节跳动推出Seed-Coder：轻量级开源代码大模型，性能媲美更大规模模型

字节跳动近日发布了全新的开源代码大语言模型（LLM）系列——Seed-Coder，标志着其在开源大语言模型生态系统中的首次重要贡献。这一系列模型以轻量化和高性能为核心特点，包括基础模型、指令模型和推理...

大语言模型 # Seed-Coder # 代码大模型 # 字节跳动

9个月前

03450

快手开源 KwaiCoder-AutoThink-preview：打造自动切换“思考模式”的大模型

快手 Kwaipilot 团队正式开源了其最新研究成果——KwaiCoder-AutoThink-preview 自动思考大模型。该模型针对当前深度思考类大模型中普遍存在的“过度思考”问题，提出了一种...

大语言模型 # KwaiCoder-AutoThink-preview # 快手

8个月前

03440

DeepSeek R1 升级：推理能力逼近顶尖模型，小模型也迎来突破

DeepSeek 最新发布了其旗舰模型 DeepSeek R1 的升级版本 —— DeepSeek-R1-0528。这次更新不仅在推理深度上有了显著提升，还在幻觉控制、函数调用支持和代码生成体验等方面...

大语言模型 # DeepSeek-R1

8个月前

03440

Falcon-Edge：一系列强大、通用、可微调的1.58位语言模型

Falcon 团队正式发布了 Falcon-Edge 系列模型——一组基于 BitNet 架构设计的三值格式语言模型。这些模型不仅具备高性能，还支持灵活的微调能力，为边缘设备上的高效部署提供了全新可能...

大语言模型 # BitNet # Falcon-Edge

9个月前

03430

面壁智能发布 MiniCPM 4.0：端侧大模型效率再升级，极限提速 220 倍！

6 日晚，面壁智能正式发布了新一代高效端侧大语言模型 MiniCPM 4.0。该系列模型以极致轻量化和高效推理为核心目标，结合自研 CPM.cu 推理框架和稀疏注意力机制，在端侧设备上实现了惊人的性...

大语言模型 # MiniCPM 4.0 # 面壁智能

8个月前

03410

南加州大学推出一系列紧凑型推理模型Tina：利用LoRA技术实现低成本强化学习

在语言模型（LLM）领域，尽管通用任务性能取得了显著进展，但实现强大的多步推理能力仍然是一个重大挑战。这种能力对于复杂问题解决场景（如科学研究和战略规划）至关重要。然而，传统方法如监督微调（SFT）虽...

大语言模型 # Tina # v # 推理模型

9个月前

03380

腾讯混元项目组推出高效课程强化学习方法FASTCURL：通过逐步扩展上下文窗口的策略，加速了类似 R1 的推理模型的强化学习训练效率，并提升其在复杂推理任务中的性能

腾讯混元项目组推出提出了一种名为 FASTCURL 的高效课程强化学习方法，通过逐步扩展上下文窗口的策略，加速了类似 R1 的推理模型的强化学习训练效率，并提升了其在复杂推理任务中的性能。它们还发布...

大语言模型 # FASTCURL # FastCuRL-1.5B-Preview # 混元

10个月前

03380

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理（Agent）导向应用设计，首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...

大语言模型 # GLM-4.5 # GLM-4.5-Air # 智谱AI

6个月前

03370

智谱发布新一代 GLM-4-32B-0414 系列模型：高性能、多功能、易部署

4 月 14 日，智谱发布了一则重磅消息：推出新一代 GLM-4-32B-0414 系列模型。这一系列模型凭借 320 亿参数的强大性能，效果直逼 OpenAI 的 GPT 系列和 DeepSeek ...

大语言模型 # GLM-4-32B-0414 # 智谱AI

10个月前

03360

深度求索发布开源推理大语言模型DeepSeek-R1，性能对标 OpenAI o1 正式版

幻方量化旗下的AI公司深度求索（DeepSeek）今日正式发布了其最新的大语言模型DeepSeek-R1，并同步开源了模型权重。这一举措旨在通过提供高性能的开源解决方案，推动人工智能领域的发展。地址...

大语言模型 # DeepSeek # DeepSeek-R1 # 深度求索

12个月前

03360

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

在 Qwen3-2507 系列全面上线后，阿里通义实验室正式推出 Qwen3-Max——迄今为止参数规模最大、综合能力最强的 Qwen 模型。作为 Qwen3 系列的旗舰型号，Qwen3-Max 不...

大语言模型 # Qwen3-Max

4个月前

03350

加载更多

Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

字节跳动推出Seed-Coder：轻量级开源代码大模型，性能媲美更大规模模型

快手开源 KwaiCoder-AutoThink-preview：打造自动切换“思考模式”的大模型

DeepSeek R1 升级：推理能力逼近顶尖模型，小模型也迎来突破

Falcon-Edge：一系列强大、通用、可微调的1.58位语言模型

面壁智能发布 MiniCPM 4.0：端侧大模型效率再升级，极限提速 220 倍！

南加州大学推出一系列紧凑型推理模型Tina：利用LoRA技术实现低成本强化学习

腾讯混元项目组推出高效课程强化学习方法FASTCURL：通过逐步扩展上下文窗口的策略，加速了类似 R1 的推理模型的强化学习训练效率，并提升其在复杂推理任务中的性能

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

智谱发布新一代 GLM-4-32B-0414 系列模型：高性能、多功能、易部署

深度求索发布开源推理大语言模型DeepSeek-R1，性能对标 OpenAI o1 正式版

Qwen3-Max 发布：阿里通义迄今最强语言模型，已开放 API

Clawdbot/Moltbot

Higgsfield AI

Situation Monitor

Fogsight (雾象)

CivitAI

打滑作业平台

大语言模型

网址

Clawdbot/Moltbot

Higgsfield AI

Situation Monitor

Fogsight (雾象)

CivitAI

打滑作业平台