大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

瑞士发布国家级开源大模型 Apertus，构建自主可控、合规透明的AI基础设施

瑞士近日正式推出其国家级开源大语言模型 Apertus，标志着该国在构建自主可控、合规透明的人工智能基础设施方面迈出关键一步。这一模型由洛桑联邦理工学院（EPFL）、苏黎世联邦理工学院（ETH Z...

5个月前

02510

阿里发布 AgentScope 1.0：面向生产级智能体的开源开发框架

阿里巴巴近日正式推出 AgentScope 1.0 —— 一个以开发者为核心的开源智能体（Agent）开发框架，致力于解决当前智能体应用在可控性、可维护性和落地部署方面的关键挑战。不同于仅聚焦于单点...

大语言模型 # AgentScope 1.0 # 智能体开发框架 # 阿里巴巴

5个月前

01720

腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B：33语种互译，小模型也能大作为

腾讯混元宣布将其国际翻译模型 Hunyuan-MT-7B 正式开源，供全球开发者免费下载与本地部署。同时开源的还有业界首个翻译集成模型 Hunyuan-MT-Chimera-7B（奇美拉），支持多译文...

大语言模型 # Hunyuan-MT-7B # 翻译模型 # 腾讯

5个月前

01800

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

美团LongCat团队正式推出大语言模型LongCat-Flash，该模型以5600亿总参数规模为基础，创新采用专家混合（MoE）架构，通过动态计算、架构优化等核心设计，在训练效率、推理性能与实用能力...

大语言模型 # LongCat-Flash # 美团

5个月前

01070

xAI 推出 Grok Code Fast 1：瞄准 GitHub Copilot，主打“快速且经济”的编程辅助

埃隆·马斯克旗下的 xAI 正式发布代理式编码模型 Grok Code Fast 1，直接对标微软 GitHub Copilot 和 OpenAI Codex。这款基于全新架构构建的模型，以“速度快...

大语言模型 # Grok Code Fast 1 # 编程辅助

5个月前

0650

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

神秘的 AI 初创公司 Nous Research 本周悄然推出开源大语言模型家族 Hermes 4。该公司声称，这一系列模型不仅在性能上比肩主流专有系统，更以“最小内容限制”和“用户高度可控”为核心...

大语言模型 # Hermes 4 # Nous Research

5个月前

04320

研究员改造 OpenAI 开源模型 gpt-oss-20b：移除推理约束，还原 “无对齐” 基础版本

8月初，OpenAI 发布了其首个自 GPT-2 以来的开放权重大语言模型系列 gpt-oss，包含 200 亿（gpt-oss-20b）和 1200 亿（gpt-oss-120b）参数两个版本，采用...

大语言模型 # gpt-oss-20b # gpt-oss-20b-base

5个月前

01450

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

微软近期推出的rStar2-Agent，以14亿参数的轻量化规模，在数学推理领域实现了突破性进展——它未依赖更长的推理时间，而是通过更智能的思考逻辑，达到了与671亿参数的DeepSeek-R1相当的...

大语言模型 # rStar2-Agent # 微软

5个月前

01900

腾讯优图实验室发布Youtu-agent：开源、高性能的自主智能体框架，开箱即用多场景能力

腾讯优图实验室近期推出了自主智能体框架 Youtu-agent——一款以“灵活、高性能、低成本”为核心的工具，不仅能支持自主智能体的构建、运行与评估，还在多项权威基准测试中表现突出。更重要的是，它针对...

大语言模型 # Youtu-agent # 智能体框架

5个月前

01430

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

大语言模型（LLM）在开放域问答、信息检索等任务中展现出强大潜力。然而，面对需要多步骤推理、工具调用和外部验证的复杂任务，仅靠模型的静态知识和简单提示工程往往力不从心。现有方法如检索增强生成（RAG...

大语言模型 # Atom-Searcher # 蚂蚁集团

5个月前

02550

深度求索发布 DeepSeek-V3.1：混合思考模式 + 128K 上下文，API 同步升级并支持 Anthropic 格式

深度求索（DeepSeek）正式推出 DeepSeek-V3.1 —— 一个在架构设计、推理效率和智能体能力上全面升级的新版本模型。此次更新不仅提升了性能，更引入了混合思考模式，让同一个模型可灵活适应...

大语言模型 # DeepSeek-V3.1 # 深度求索

5个月前

03050

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

字节跳动Seed团队正式推出Seed-OSS系列开放权重模型，该系列均为36B参数规模，聚焦长上下文处理、推理能力与代理任务优化，以Apache-2.0许可证开源，为开发者与研究社区提供高实用性工具...

大语言模型 # Seed-OSS # 字节跳动

5个月前

02730

加载更多

瑞士发布国家级开源大模型 Apertus，构建自主可控、合规透明的AI基础设施

阿里发布 AgentScope 1.0：面向生产级智能体的开源开发框架

腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B：33语种互译，小模型也能大作为

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

xAI 推出 Grok Code Fast 1：瞄准 GitHub Copilot，主打“快速且经济”的编程辅助

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

研究员改造 OpenAI 开源模型 gpt-oss-20b：移除推理约束，还原 “无对齐” 基础版本

微软发布rStar2-Agent：14亿参数实现671亿模型性能，数学推理模型迎来“轻量高效”新突破

腾讯优图实验室发布Youtu-agent：开源、高性能的自主智能体框架，开箱即用多场景能力

蚂蚁集团新框架Atom-Searcher：用“原子化思想”破解LLMs深度研究难题

深度求索发布 DeepSeek-V3.1：混合思考模式 + 128K 上下文，API 同步升级并支持 Anthropic 格式

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

CutCut

Fogsight (雾象)

大语言模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

CutCut

Fogsight (雾象)