大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

Deep Cogito 今日正式发布 Cogito v2 预览版，推出四款开源混合推理模型： 70B 密集型 109B MoE 405B 密集型 671B MoE 其中，671B MoE 是当前全球最...

7个月前

04210

腾讯混元发布四款小尺寸开源模型，端侧 AI 应用迎来新选择

继此前开源大尺寸模型后，腾讯混元团队近日推出四款全新小尺寸开源模型，参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计，可在消费级显卡、笔记本电脑、手机、智能座舱及...

大语言模型 # 腾讯混元

7个月前

03730

面向代码修复与优化任务的经验驱动型实验框架SWE-Exp

在自动化软件工程领域，一个长期存在的挑战是：如何让 AI 代理不仅“能修代码”，还能“会总结、能举一反三”？上海交通大学、华为、加州大学圣地亚哥分校与西安电子科技大学的联合研究团队近日提出 SWE...

大语言模型 # SWE-Exp # 软件工程

7个月前

02120

问小白开源基于反思型生成范式训练的推理模型XBai o4

问小白发布了XBai o4，o=open，o4代表其开源的第四代大模型技术。XBai o4在复杂推理能力方面表现出色，在Medium模式下，XBai o4 现已全面超越OpenAI-o3-mini。 ...

大语言模型 # XBai o4 # 问小白

7个月前

02170

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover，Seed-Prover 通过结合 LLM 的推理能力和形式化语言（如 Lean）的验证能力，实现了对数学...

大语言模型 # Seed-Prover # 字节跳动 # 自动化定理证明

7个月前

01000

微软推出Phi-Ground：提高计算机界面（GUI）定位（grounding）的准确性

微软推出一个名为 Phi-Ground 的模型家族，旨在提高计算机界面（GUI）定位（grounding）的准确性。GUI 定位是计算机使用代理（CUAs）执行实际操作的核心组件，类似于机器人中的机械...

大语言模型 # Phi-Ground # 微软

7个月前

01780

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版，它采用离散状态扩散机制，专注于代码生成任务，在推理速度上实现了显著突破：最高可达 2,146 token...

大语言模型 # Seed Diffusion # 字节跳动

7个月前

01450

Meta发布新型多语言对比语言-图像预训练（CLIP）模型MetaCLIP 2

MetaCLIP 2 是一种新型的多语言对比语言-图像预训练（CLIP）模型，旨在从全球范围内的网络数据中学习图像和文本的表示。传统的 CLIP 模型主要基于英语数据进行训练，而 MetaCLIP 2...

大语言模型 # Meta # MetaCLIP 2

7个月前

01450

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里通义千问团队再次升级其 30B 级模型线，正式推出 Qwen3-30B-A3B-Thinking-2507。这并非一次简单迭代，而是针对复杂推理能力的深度优化版本。过去三个月中，项目组重点提升了...

大语言模型 # Qwen3-30B-A3B-Thinking-2507 # 推理模型

7个月前

03860

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

7个月前

07600

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat：https://chat.qwen.a...

大语言模型 # Qwen3-30B-A3B-Instruct-2507 # Qwen团队

7个月前

08340

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

在多语言交织、语码频繁切换的新加坡数字环境中，一句看似无害的“lah”或“leh”，可能暗藏冒犯；一段夹杂中英马来语的对话，对通用内容审核系统而言却是一道难题。去年，新加坡政府科技局（GovTech...

大语言模型 # LionGuard 2 # 内容审核防护模型

7个月前

03000

加载更多

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

腾讯混元发布四款小尺寸开源模型，端侧 AI 应用迎来新选择

面向代码修复与优化任务的经验驱动型实验框架SWE-Exp

问小白开源基于反思型生成范式训练的推理模型XBai o4

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

微软推出Phi-Ground：提高计算机界面（GUI）定位（grounding）的准确性

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

Meta发布新型多语言对比语言-图像预训练（CLIP）模型MetaCLIP 2

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

A股智能分析系统

YouMind

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

nanobot

大语言模型

网址

A股智能分析系统

YouMind

OpenClaw

OpenClaw（Clawdbot/Moltbot）

MimiClaw

nanobot