Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference,专治企业最头疼的两个难题!生成式 AI 发展到今天,很多问题已经解决,但仍有两大“顽疾”困扰着企业用户: 文本转 SQL 的准确性问题:AI 写出来的 SQL 看起来像模像样,但在真实数据库上却执行失败; AI 推理的速度与成...大语言模型# Arctic Inference# Arctic-Text2SQL-R1# Snowflake8个月前04470
OpenAI发布全新GPT-4.1系列模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano本周一,OpenAI发布了全新的模型系列——GPT-4.1,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色,标志着OpenAI在打造“代理...大语言模型早报# GPT-4.1# GPT-4.1 mini# GPT-4.1 nano10个月前04460
AI21开源大语言模型Jamba 1.6系列,适合企业私有部署AI21 正式发布开源模型Jamba 1.6 系列,专为企业私有部署设计,兼具卓越性能和数据安全性。 模型地址:https://huggingface.co/collections/ai21labs...大语言模型# AI21# Jamba 1.6# 大语言模型11个月前04460
Reka推出210亿参数模型Reka Flash 3,号称性能上可与OpenAI o1-mini等专有模型竞争Reka于3月10日开源了Reka Flash 3的最新研究预览版,这是一个拥有210亿参数的模型。Reka Flash 3是一款紧凑的通用模型,擅长通用聊天、编码、指令遵循和函数调用。当前版本在性能...大语言模型# Reka# Reka Flash 311个月前04380
Nous Research 发布 Hermes 4:无内容限制,数学性能超越 ChatGPT 的开源 AI 新选择神秘的 AI 初创公司 Nous Research 本周悄然推出开源大语言模型家族 Hermes 4。该公司声称,这一系列模型不仅在性能上比肩主流专有系统,更以“最小内容限制”和“用户高度可控”为核心...大语言模型# Hermes 4# Nous Research5个月前04320
A-M-team推出32B密集语言模型AM-Thinking-v1:专注增强推理能力A-M-team推出了AM-Thinking-v1,一款基于Qwen 2.5-32B-Base构建的32B密集语言模型,专注于提升推理能力。在推理基准测试中,AM-Thinking-v1表现出色,可媲...大语言模型# AM-Thinking-v1# 推理模型9个月前04310
Deep Cogito发布Cogito v2 预览版:从“思考更多”到“直觉更强”的推理范式跃迁Deep Cogito 今日正式发布 Cogito v2 预览版,推出四款开源混合推理模型: 70B 密集型 109B MoE 405B 密集型 671B MoE 其中,671B MoE 是当前全球最...大语言模型# Cogito v2# Deep Cogito6个月前04160
OpenAI推出最新模型GPT-4.5,这是迄今为止该公司发布的最大模型OpenAI 于北京时间2月28日正式推出其最新模型 GPT-4.5,这是迄今为止该公司发布的最大模型,使用的计算能力和数据量均超过以往任何模型。然而,尽管规模庞大,OpenAI 并未将 GPT-4...大语言模型# GPT-4.5# OpenAI11个月前04160
微软发布 Phi 系列两款新模型:Phi-4-multimodal 和 Phi-4-mini微软在今天宣布推出 Phi 系列小型语言模型(SLM)的两款新成员——Phi-4-multimodal 和 Phi-4-mini。这两款模型旨在为开发者提供更强大的 AI 功能,分别在多模态处理和文本...大语言模型# Phi-4-mini# Phi-4-multimodal# 微软11个月前04130
阿里发布 Qwen3-4B 双模型:小参数,大能力,原生支持 256K 上下文在大模型“军备竞赛”愈演愈烈的今天,阿里巴巴通义实验室反其道而行之,推出两款 40 亿参数级别 的小型语言模型: Qwen3-4B-Instruct-2507:面向多语言、高响应速度的通用指令模型 Q...大语言模型# Qwen3-4B-Instruct-2507# Qwen3-4B-Thinking-2507# 通义实验室6个月前04080
T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列在当前大语言模型(LLM)领域中,解码器独占架构凭借其强大的生成能力成为主流。然而,经典的编码器-解码器架构——如 T5(文本到文本转换变换器)——因其出色的推理效率、灵活的设计以及对输入语义的深度理...大语言模型# T5Gemma# 解码器# 谷歌7个月前04060
Mistral 推出新编码模型 Devstral:开源、轻量、性能超越 GPT-4-mini法国AI 初创公司 Mistral 宣布推出其最新开源模型 —— Devstral,专为软件工程任务设计。该模型由 Mistral 与 AI 公司 All Hands AI 联合开发,采用 Apach...大语言模型# All Hands AI# Devstral# Mistral8个月前03860