大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

阿里正式发布 Qwen3 Embedding和Reranker 系列模型：专为文本表征与检索排序设计

今天凌晨，阿里巴巴正式开源 Qwen3 Embedding 系列模型，作为 Qwen 模型家族的最新成员，该系列专注于文本语义表征、信息检索与排序任务，在多语言理解、跨语言检索和代码相关性建模等方面展...

8个月前

01460

Homunculus-12B：在消费级显卡上运行的高效推理模型

随着大语言模型不断向轻量化和高性能方向演进，Arcee Homunculus-12B 成为一个值得关注的新成员。它是一款基于 Qwen3-235B 蒸馏而来、部署在 Mistral-Nemo 架构上的...

大语言模型 # Homunculus-12B # 推理模型

8个月前

02910

快手开源 KwaiCoder-AutoThink-preview：打造自动切换“思考模式”的大模型

快手 Kwaipilot 团队正式开源了其最新研究成果——KwaiCoder-AutoThink-preview 自动思考大模型。该模型针对当前深度思考类大模型中普遍存在的“过度思考”问题，提出了一种...

大语言模型 # KwaiCoder-AutoThink-preview # 快手

8个月前

03440

Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference，专治企业最头疼的两个难题！

生成式 AI 发展到今天，很多问题已经解决，但仍有两大“顽疾”困扰着企业用户：文本转 SQL 的准确性问题：AI 写出来的 SQL 看起来像模像样，但在真实数据库上却执行失败； AI 推理的速度与成...

大语言模型 # Arctic Inference # Arctic-Text2SQL-R1 # Snowflake

8个月前

04490

DeepSeek R1 升级：推理能力逼近顶尖模型，小模型也迎来突破

DeepSeek 最新发布了其旗舰模型 DeepSeek R1 的升级版本 —— DeepSeek-R1-0528。这次更新不仅在推理深度上有了显著提升，还在幻觉控制、函数调用支持和代码生成体验等方面...

大语言模型 # DeepSeek-R1

8个月前

03440

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

深度求索在本周对DeepSeek R1进行了升级，还开源了此版本模型DeepSeek-R1-0528，官方还推出了一个基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3...

大语言模型 # DeepSeek # DeepSeek-R1-0528-Qwen3-8B # 深度求索

8个月前

02400

阿里推出高效的长上下文压缩框架QwenLong-CPRS

在大语言模型（LLM）处理长文本时，两个核心问题始终存在：计算开销高和中间信息丢失严重。为了解决这些问题，阿里通义实验室 Qwen-Doc 团队推出了一个全新上下文压缩框架 —— QwenLong...

大语言模型 # QwenLong-CPRS # QwenLong-CPRS-7B

8个月前

05550

DMind AI 推出专为 Web3 生态系统优化的领域专用大模型 DMind-1 和 DMind-1-mini

Web3 技术的迅猛发展，尤其是区块链、去中心化金融（DeFi）和智能合约的广泛应用，催生了对专门的大型语言模型（LLM）的迫切需求。这些领域需要精准的领域适配和高级推理能力，而通用 LLM 往往在特...

大语言模型 # DMind AI # DMind-1 # DMind-1-mini

8个月前

01270

腾讯推出大型混合 Transformer-Mamba 专家混合（MoE）模型Hunyuan-TurboS

腾讯推出了Hunyuan-TurboS，这是一个新型的大型混合 Transformer-Mamba 专家混合（MoE）模型。它结合了 Mamba 架构在长序列处理上的高效性与 Transformer ...

大语言模型 # Hunyuan-TurboS # 腾讯

8个月前

02800

谷歌推了个能装进手机的大模型Gemma 3n，速度快、内存低、还能听会说

谷歌宣布推出其最新开源模型 Gemma 3n 的预览版，这是继 Gemma 3 和 Gemma 3 QAT 后，谷歌在轻量级大模型领域的又一重要进展。 Gemma 3n 专为手机、平板和笔记本电脑等设...

大语言模型 # Gemma 3n # 谷歌

8个月前

02430

Mistral 推出新编码模型 Devstral：开源、轻量、性能超越 GPT-4-mini

法国AI 初创公司 Mistral 宣布推出其最新开源模型 —— Devstral，专为软件工程任务设计。该模型由 Mistral 与 AI 公司 All Hands AI 联合开发，采用 Apach...

大语言模型 # All Hands AI # Devstral # Mistral

8个月前

03860

谷歌新研究模型 Gemini Diffusion：用扩散模型重新定义文本生成

谷歌推出了一项新的实验性研究模型 —— Gemini Diffusion，这是其在文本生成领域的一次重要尝试，探索扩散模型在语言任务中的潜力。不同于传统的自回归模型逐词生成文本的方式，Gemini ...

大语言模型 # Gemini Diffusion # 扩散模型 # 谷歌

8个月前

03670

加载更多

阿里正式发布 Qwen3 Embedding和Reranker 系列模型：专为文本表征与检索排序设计

Homunculus-12B：在消费级显卡上运行的高效推理模型

快手开源 KwaiCoder-AutoThink-preview：打造自动切换“思考模式”的大模型

Snowflake 开源两款 AI 工具Arctic-Text2SQL-R1 和 Arctic Inference，专治企业最头疼的两个难题！

DeepSeek R1 升级：推理能力逼近顶尖模型，小模型也迎来突破

DeepSeek推出基于Qwen3-8B的小型推理模型：DeepSeek-R1-0528-Qwen3-8B

阿里推出高效的长上下文压缩框架QwenLong-CPRS

DMind AI 推出专为 Web3 生态系统优化的领域专用大模型 DMind-1 和 DMind-1-mini

腾讯推出大型混合 Transformer-Mamba 专家混合（MoE）模型Hunyuan-TurboS

谷歌推了个能装进手机的大模型Gemma 3n，速度快、内存低、还能听会说

Mistral 推出新编码模型 Devstral：开源、轻量、性能超越 GPT-4-mini

谷歌新研究模型 Gemini Diffusion：用扩散模型重新定义文本生成

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Skills.sh

中国科技云数据胶囊

Fogsight (雾象)

大语言模型

网址

新QoderWork

Clawdbot/Moltbot

Situation Monitor

Skills.sh

中国科技云数据胶囊

Fogsight (雾象)