大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference，专治企业最头疼的两个难题！

生成式 AI 发展到今天，很多问题已经解决，但仍有两大“顽疾”困扰着企业用户：文本转 SQL 的准确性问题：AI 写出来的 SQL 看起来像模像样，但在真实数据库上却执行失败； AI 推理的速度与成...

8个月前

04470

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

本周一，OpenAI发布了全新的模型系列——GPT-4.1，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色，标志着OpenAI在打造“代理...

大语言模型早报 # GPT-4.1 # GPT-4.1 mini # GPT-4.1 nano

10个月前

04460

AI21开源大语言模型Jamba 1.6系列，适合企业私有部署

AI21 正式发布开源模型Jamba 1.6 系列，专为企业私有部署设计，兼具卓越性能和数据安全性。模型地址：https://huggingface.co/collections/ai21labs...

大语言模型 # AI21 # Jamba 1.6 # 大语言模型

11个月前

04460

Reka推出210亿参数模型Reka Flash 3，号称性能上可与OpenAI o1-mini等专有模型竞争

Reka于3月10日开源了Reka Flash 3的最新研究预览版，这是一个拥有210亿参数的模型。Reka Flash 3是一款紧凑的通用模型，擅长通用聊天、编码、指令遵循和函数调用。当前版本在性能...

大语言模型 # Reka # Reka Flash 3

11个月前

04380

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

神秘的 AI 初创公司 Nous Research 本周悄然推出开源大语言模型家族 Hermes 4。该公司声称，这一系列模型不仅在性能上比肩主流专有系统，更以“最小内容限制”和“用户高度可控”为核心...

大语言模型 # Hermes 4 # Nous Research

5个月前

04320

A-M-team推出32B密集语言模型AM-Thinking-v1：专注增强推理能力

A-M-team推出了AM-Thinking-v1，一款基于Qwen 2.5-32B-Base构建的32B密集语言模型，专注于提升推理能力。在推理基准测试中，AM-Thinking-v1表现出色，可媲...

大语言模型 # AM-Thinking-v1 # 推理模型

9个月前

04310

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

Deep Cogito 今日正式发布 Cogito v2 预览版，推出四款开源混合推理模型： 70B 密集型 109B MoE 405B 密集型 671B MoE 其中，671B MoE 是当前全球最...

大语言模型 # Cogito v2 # Deep Cogito

6个月前

04160

OpenAI推出最新模型GPT-4.5，这是迄今为止该公司发布的最大模型

OpenAI 于北京时间2月28日正式推出其最新模型 GPT-4.5，这是迄今为止该公司发布的最大模型，使用的计算能力和数据量均超过以往任何模型。然而，尽管规模庞大，OpenAI 并未将 GPT-4...

大语言模型 # GPT-4.5 # OpenAI

11个月前

04160

微软发布 Phi 系列两款新模型：Phi-4-multimodal 和 Phi-4-mini

微软在今天宣布推出 Phi 系列小型语言模型（SLM）的两款新成员——Phi-4-multimodal 和 Phi-4-mini。这两款模型旨在为开发者提供更强大的 AI 功能，分别在多模态处理和文本...

大语言模型 # Phi-4-mini # Phi-4-multimodal # 微软

11个月前

04130

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

在大模型“军备竞赛”愈演愈烈的今天，阿里巴巴通义实验室反其道而行之，推出两款 40 亿参数级别的小型语言模型： Qwen3-4B-Instruct-2507：面向多语言、高响应速度的通用指令模型 Q...

大语言模型 # Qwen3-4B-Instruct-2507 # Qwen3-4B-Thinking-2507 # 通义实验室

6个月前

04080

T5Gemma：谷歌推出全新编码器-解码器 Gemma 模型系列

在当前大语言模型（LLM）领域中，解码器独占架构凭借其强大的生成能力成为主流。然而，经典的编码器-解码器架构——如 T5（文本到文本转换变换器）——因其出色的推理效率、灵活的设计以及对输入语义的深度理...

大语言模型 # T5Gemma # 解码器 # 谷歌

7个月前

04060

Mistral 推出新编码模型 Devstral：开源、轻量、性能超越 GPT-4-mini

法国AI 初创公司 Mistral 宣布推出其最新开源模型 —— Devstral，专为软件工程任务设计。该模型由 Mistral 与 AI 公司 All Hands AI 联合开发，采用 Apach...

大语言模型 # All Hands AI # Devstral # Mistral

8个月前

03860

加载更多

Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference，专治企业最头疼的两个难题！

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

AI21开源大语言模型Jamba 1.6系列，适合企业私有部署

Reka推出210亿参数模型Reka Flash 3，号称性能上可与OpenAI o1-mini等专有模型竞争

Nous Research 发布 Hermes 4：无内容限制，数学性能超越 ChatGPT 的开源 AI 新选择

A-M-team推出32B密集语言模型AM-Thinking-v1：专注增强推理能力

Deep Cogito发布Cogito v2 预览版：从“思考更多”到“直觉更强”的推理范式跃迁

OpenAI推出最新模型GPT-4.5，这是迄今为止该公司发布的最大模型

微软发布 Phi 系列两款新模型：Phi-4-multimodal 和 Phi-4-mini

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

T5Gemma：谷歌推出全新编码器-解码器 Gemma 模型系列

Mistral 推出新编码模型 Devstral：开源、轻量、性能超越 GPT-4-mini

Clawdbot/Moltbot

Skills.sh

Situation Monitor

CutCut

Fogsight (雾象)

新Awesome Clawdbot(Moltbot) Skills

大语言模型

网址

Clawdbot/Moltbot

Skills.sh

Situation Monitor

CutCut

Fogsight (雾象)

新Awesome Clawdbot(Moltbot) Skills