大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

谷歌推出EmbeddingGemma：专为设备端设计的高性能开放嵌入模型

在构建轻量级、隐私优先的 AI 应用时，如何在资源受限的设备上实现高质量语义理解，是一大挑战。传统的嵌入模型往往依赖云端计算，带来延迟、隐私和离线可用性问题。为此，谷歌推出 EmbeddingGem...

6个月前

01980

Instinct：由 Continue 打造的全球首个开放 Next Edit 模型

在代码编辑中，真正消耗时间的往往不是“写代码”，而是重构、调整、维护与迭代。传统自动补全工具只能在光标处插入文本，面对复杂的多行修改仍需手动操作，打断开发节奏。为此，开发工具团队 Continue ...

大语言模型 # Continue # Instinct # Next Edit 模型

6个月前

02160

月之暗面发布 Kimi K2 新版本（0905）：编程能力再升级，支持 256K 上下文与高速 API

月之暗面宣布推出其旗舰模型 Kimi K2 的最新版本（0905），重点针对真实编程任务进行优化，在代码生成能力、上下文处理、API 性能和平台兼容性等方面实现多项重要升级。此次更新聚焦于提升模型在...

大语言模型 # Kimi K2 # Kimi-K2-Instruct-0905 # 月之暗面

6个月前

02110

字节跳动发布UI-TARS-2：一个面向真实GUI交互的原生代理模型

在图形用户界面（GUI）日益复杂的背景下，如何让AI代理像人类一样流畅操作系统、完成多步骤任务，是自动化与智能体研究的重要方向。然而，当前自主GUI代理的发展仍面临诸多挑战：训练数据难以规模化获取、多...

大语言模型 # UI-TARS-2

6个月前

01510

大语言模型知识获取研究新工具：特拉维夫大学与麦吉尔大学推出 LMEnt 套件

语言模型正在越来越多地承担需要世界知识的任务：回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决：模型是如何从训练数据中“学会”知识的？我们训练模型时喂的是文本，但它输出的却是“信念...

大语言模型 # LMEnt # 大语言模型

6个月前

01410

InfoSeek：智源研究院提出可扩展的深度研究数据合成框架

在大模型迈向“自主思考”的过程中，一个关键瓶颈逐渐显现：现有基准任务太简单，无法真正测试模型的复杂推理能力。 Natural Questions、HotpotQA 等主流数据集虽然推动了多跳推理的发...

大语言模型 # InfoSeek # 深度研究

6个月前

02280

瑞士发布国家级开源大模型 Apertus，构建自主可控、合规透明的AI基础设施

瑞士近日正式推出其国家级开源大语言模型 Apertus，标志着该国在构建自主可控、合规透明的人工智能基础设施方面迈出关键一步。这一模型由洛桑联邦理工学院（EPFL）、苏黎世联邦理工学院（ETH Z...

大语言模型 # Apertus # 开源大模型 # 瑞士

6个月前

02610

阿里发布 AgentScope 1.0：面向生产级智能体的开源开发框架

阿里巴巴近日正式推出 AgentScope 1.0 —— 一个以开发者为核心的开源智能体（Agent）开发框架，致力于解决当前智能体应用在可控性、可维护性和落地部署方面的关键挑战。不同于仅聚焦于单点...

大语言模型 # AgentScope 1.0 # 智能体开发框架 # 阿里巴巴

6个月前

01760

腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B：33语种互译，小模型也能大作为

腾讯混元宣布将其国际翻译模型 Hunyuan-MT-7B 正式开源，供全球开发者免费下载与本地部署。同时开源的还有业界首个翻译集成模型 Hunyuan-MT-Chimera-7B（奇美拉），支持多译文...

大语言模型 # Hunyuan-MT-7B # 翻译模型 # 腾讯

6个月前

01910

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

美团LongCat团队正式推出大语言模型LongCat-Flash，该模型以5600亿总参数规模为基础，创新采用专家混合（MoE）架构，通过动态计算、架构优化等核心设计，在训练效率、推理性能与实用能力...

大语言模型 # LongCat-Flash # 美团

6个月前

01100

xAI 推出 Grok Code Fast 1：瞄准 GitHub Copilot，主打“快速且经济”的编程辅助

埃隆·马斯克旗下的 xAI 正式发布代理式编码模型 Grok Code Fast 1，直接对标微软 GitHub Copilot 和 OpenAI Codex。这款基于全新架构构建的模型，以“速度快...

大语言模型 # Grok Code Fast 1 # 编程辅助

6个月前

0680

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

神秘的 AI 初创公司 Nous Research 本周悄然推出开源大语言模型家族 Hermes 4。该公司声称，这一系列模型不仅在性能上比肩主流专有系统，更以“最小内容限制”和“用户高度可控”为核心...

大语言模型 # Hermes 4 # Nous Research

6个月前

04510

加载更多

谷歌推出EmbeddingGemma：专为设备端设计的高性能开放嵌入模型

Instinct：由 Continue 打造的全球首个开放 Next Edit 模型

月之暗面发布 Kimi K2 新版本（0905）：编程能力再升级，支持 256K 上下文与高速 API

字节跳动发布UI-TARS-2：一个面向真实GUI交互的原生代理模型

大语言模型知识获取研究新工具：特拉维夫大学与麦吉尔大学推出 LMEnt 套件

InfoSeek：智源研究院提出可扩展的深度研究数据合成框架

瑞士发布国家级开源大模型 Apertus，构建自主可控、合规透明的AI基础设施

阿里发布 AgentScope 1.0：面向生产级智能体的开源开发框架

腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B：33语种互译，小模型也能大作为

美团LongCat团队发布5600亿参数模型LongCat-Flash，以MoE架构突破效率与性能瓶颈

xAI 推出 Grok Code Fast 1：瞄准 GitHub Copilot，主打“快速且经济”的编程辅助

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

OpenClaw

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

MimiClaw

OpenClaw 一键部署工具

Moonvalley

大语言模型

网址

OpenClaw

A股智能分析系统

OpenClaw（Clawdbot/Moltbot）

MimiClaw

OpenClaw 一键部署工具

Moonvalley