谷歌新研究模型 Gemini Diffusion:用扩散模型重新定义文本生成谷歌推出了一项新的实验性研究模型 —— Gemini Diffusion,这是其在文本生成领域的一次重要尝试,探索扩散模型在语言任务中的潜力。 不同于传统的自回归模型逐词生成文本的方式,Gemini ...大语言模型# Gemini Diffusion# 扩散模型# 谷歌7个月前03480
新型框架WriteHERE:通过异构递归规划实现自适应的长文本写作长文本写作(如小说、技术报告等)需要在信息检索、推理和创作之间进行灵活的整合与交互。现有的方法通常依赖于预定义的工作流程和僵化的思维模式,先生成大纲再进行写作,这限制了写作过程中的适应性。 项目主页...大语言模型# WriteHERE# 长文本写作8个月前03480
Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude CodeAnthropic在今天推出全新模型Claude 3.7 Sonnet,号称业界首个“混合AI推理模型”。它不仅能实时回答问题,还能像人类一样“深度思考”,提供更精准的答案!用户可以自由选择让模型“思...大语言模型# Anthropic# Claude 3.7 Sonnet# Claude Code10个月前03460
阿里发布 Qwen3-4B 双模型:小参数,大能力,原生支持 256K 上下文在大模型“军备竞赛”愈演愈烈的今天,阿里巴巴通义实验室反其道而行之,推出两款 40 亿参数级别 的小型语言模型: Qwen3-4B-Instruct-2507:面向多语言、高响应速度的通用指令模型 Q...大语言模型# Qwen3-4B-Instruct-2507# Qwen3-4B-Thinking-2507# 通义实验室4个月前03410
阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升阿里通义千问团队再次升级其 30B 级模型线,正式推出 Qwen3-30B-A3B-Thinking-2507。 这并非一次简单迭代,而是针对复杂推理能力的深度优化版本。过去三个月中,项目组重点提升了...大语言模型# Qwen3-30B-A3B-Thinking-2507# 推理模型4个月前03400
微软发布 Phi 系列两款新模型:Phi-4-multimodal 和 Phi-4-mini微软在今天宣布推出 Phi 系列小型语言模型(SLM)的两款新成员——Phi-4-multimodal 和 Phi-4-mini。这两款模型旨在为开发者提供更强大的 AI 功能,分别在多模态处理和文本...大语言模型# Phi-4-mini# Phi-4-multimodal# 微软9个月前03380
OpenAI推出最新模型GPT-4.5,这是迄今为止该公司发布的最大模型OpenAI 于北京时间2月28日正式推出其最新模型 GPT-4.5,这是迄今为止该公司发布的最大模型,使用的计算能力和数据量均超过以往任何模型。然而,尽管规模庞大,OpenAI 并未将 GPT-4...大语言模型# GPT-4.5# OpenAI9个月前03370
Jan-v1 发布:一个专为本地搜索与深度推理优化的 4B 级开源模型在 AI 搜索领域,闭源商业产品长期占据主导地位。而今天,开源社区迎来了一位强有力的挑战者——Jan-v1。 作为 Jan 模型家族的首个正式版本,Jan-v1 基于 Qwen3-4B-Thinkin...大语言模型# Jan-v1# 搜索4个月前03350
OpenAI发布全新GPT-4.1系列模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano本周一,OpenAI发布了全新的模型系列——GPT-4.1,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色,标志着OpenAI在打造“代理...大语言模型早报# GPT-4.1# GPT-4.1 mini# GPT-4.1 nano8个月前03310
Nous Research 发布 Hermes 4:无内容限制,数学性能超越 ChatGPT 的开源 AI 新选择神秘的 AI 初创公司 Nous Research 本周悄然推出开源大语言模型家族 Hermes 4。该公司声称,这一系列模型不仅在性能上比肩主流专有系统,更以“最小内容限制”和“用户高度可控”为核心...大语言模型# Hermes 4# Nous Research3个月前03290
Deep Cogito推出Cogito v1系列混合AI推理模型,基于Llama/Qwen训练Deep Cogito在今天发布了其最新成果——Cogito v1系列模型,这是一组参数规模从30亿到700亿不等的开源大语言模型(LLMs)。这些模型不仅在性能上超越了同等规模的最佳开源模型,还引入...大语言模型# Cogito v1# Deep Cogito# 混合AI推理模型8个月前03290
SEARCH-R1:通过强化学习让 LLM 在逐步推理过程中自主生成多个搜索查询,并实时检索信息伊利诺伊大学厄巴纳-香槟分校计算机科学系和马萨诸塞大学安姆赫斯特分校智能信息检索中心的研究人员推出新型框架SEARCH-R1 ,通过强化学习( RL)训练大语言模型,使其能够在推理过程中自主生成搜索查...大语言模型# DeepSeek-R1# SEARCH-R19个月前03250