大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2，这是之前介绍的Glyph-ByT5升级版，此技术的目标是提高在图形设计图像中渲染多...

1年前

01,0480

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat：https://chat.qwen.a...

大语言模型 # Qwen3-30B-A3B-Instruct-2507 # Qwen团队

7个月前

08360

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

7个月前

07620

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

谷歌推出开源模型Gemma，这是一款轻量级、先进的开源模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑...

大语言模型 # Gemma # 大语言模型 # 谷歌

1年前

07270

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

R1 1776是Perplexity基于DeepSeek-R1推出的无审查版本，该模型号称提供公正、准确和真实的信息，同时保持高推理能力。目前，用户可以在 HuggingFace 上下载该模型，或者通...

大语言模型 # DeepSeek-R1 # Perplexity # R1 1776

1年前

07240

Cohere 推出了 Command A：高性能、低计算需求的大语言模型，为企业量身定制

今天，Cohere 推出了 Command A，一款专为企业设计的新型先进生成模型，旨在满足企业对快速、安全和高质量 AI 的高要求。Command A 在性能、效率和企业级功能上表现出色，是市场上最...

大语言模型 # Cohere # Command A # 企业

12个月前

06450

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

在与社区深入交流并综合反馈后，阿里Qwen团队做出一项重要决策：停止使用混合“思维模式”（Thinking Mode）的训练方式，转而采用 Instruct 与 Thinking 模型分离训练的新策...

大语言模型 # Qwen3-235B-A22B-Instruct-2507

7个月前

06310

百川智能发布 Baichuan-M2：小模型，大医疗，单卡可部署的开源医疗大模型

8 月 6 日，OpenAI 开源两款大模型，主打“低成本部署”与“医疗能力突破”。仅仅五天后，百川智能推出 Baichuan-M2 ——一款在更小参数规模下实现医疗能力反超的开源模型。模型：htt...

大语言模型 # Baichuan-M2 # 医疗大模型 # 百川智能

7个月前

06300

香港大学与华为合作发布扩散大语言模型 Dream 7B

香港大学与华为诺亚方舟实验室携手，正式发布了迄今为止最强大的开放扩散（Diffusion）大语言模型——Dream 7B。这一模型不仅在性能上大幅超越现有的扩散语言模型，还在通用能力、数学能力和编码能...

大语言模型 # Dream 7B # 华为诺亚方舟实验室 # 扩散大语言模型

11个月前

05910

阿里推出高效的长上下文压缩框架QwenLong-CPRS

在大语言模型（LLM）处理长文本时，两个核心问题始终存在：计算开销高和中间信息丢失严重。为了解决这些问题，阿里通义实验室 Qwen-Doc 团队推出了一个全新上下文压缩框架 —— QwenLong...

大语言模型 # QwenLong-CPRS # QwenLong-CPRS-7B

9个月前

05690

Qodo推出代码嵌入模型Qodo-Embed-1：专为软件开发领域设计，在优化自然语言到代码和代码到代码的检索任务

在软件开发领域，代码嵌入模型正逐渐成为提升开发效率和代码质量的关键工具。今天，Qodo 宣布推出其最新的代码嵌入模型系列 Qodo-Embed-1，该系列在保持较小模型体积的同时，实现了最先进的性能...

大语言模型 # Qodo # Qodo-Embed-1 # Qodo-Embed-1-1.5B

1年前

05410

阿里推出 Qwen3 系列大模型：开源 8 款模型，性能飞跃，多语言支持，推理能力显著提升

阿里 QWEN 团队在今天推出 Qwen3，这是 Qwen 系列大言模型的最新力作。Qwen3 以其卓越的性能和广泛的应用潜力，正在成为开源AI领域的新焦点。性能突破：超越行业标杆 Qwen3 的旗...

大语言模型 # QWEN 团队 # 阿里巴巴

10个月前

05400

加载更多

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

Cohere 推出了 Command A：高性能、低计算需求的大语言模型，为企业量身定制

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

百川智能发布 Baichuan-M2：小模型，大医疗，单卡可部署的开源医疗大模型

香港大学与华为合作发布扩散大语言模型 Dream 7B

阿里推出高效的长上下文压缩框架QwenLong-CPRS

Qodo推出代码嵌入模型Qodo-Embed-1：专为软件开发领域设计，在优化自然语言到代码和代码到代码的检索任务

阿里推出 Qwen3 系列大模型：开源 8 款模型，性能飞跃，多语言支持，推理能力显著提升

YouMind

OpenClaw（Clawdbot/Moltbot）

纳米漫剧流水线

OpenClaw

OpenCloud

Skills.sh

大语言模型

网址

YouMind

OpenClaw（Clawdbot/Moltbot）

纳米漫剧流水线

OpenClaw

OpenCloud

Skills.sh