大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

来自微软亚洲研究院、清华大学、北京大学和利物浦大学的研究人员推出新型多语言视觉文本渲染技术Glyph-ByT5-v2，这是之前介绍的Glyph-ByT5升级版，此技术的目标是提高在图形设计图像中渲染多...

12个月前

01,0390

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat：https://chat.qwen.a...

大语言模型 # Qwen3-30B-A3B-Instruct-2507 # Qwen团队

6个月前

08170

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

6个月前

07500

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

谷歌推出开源模型Gemma，这是一款轻量级、先进的开源模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑...

大语言模型 # Gemma # 大语言模型 # 谷歌

12个月前

07240

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

R1 1776是Perplexity基于DeepSeek-R1推出的无审查版本，该模型号称提供公正、准确和真实的信息，同时保持高推理能力。目前，用户可以在 HuggingFace 上下载该模型，或者通...

大语言模型 # DeepSeek-R1 # Perplexity # R1 1776

11个月前

07010

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

在与社区深入交流并综合反馈后，阿里Qwen团队做出一项重要决策：停止使用混合“思维模式”（Thinking Mode）的训练方式，转而采用 Instruct 与 Thinking 模型分离训练的新策...

大语言模型 # Qwen3-235B-A22B-Instruct-2507

6个月前

06140

百川智能发布 Baichuan-M2：小模型，大医疗，单卡可部署的开源医疗大模型

8 月 6 日，OpenAI 开源两款大模型，主打“低成本部署”与“医疗能力突破”。仅仅五天后，百川智能推出 Baichuan-M2 ——一款在更小参数规模下实现医疗能力反超的开源模型。模型：htt...

大语言模型 # Baichuan-M2 # 医疗大模型 # 百川智能

6个月前

06040

Cohere 推出了 Command A：高性能、低计算需求的大语言模型，为企业量身定制

今天，Cohere 推出了 Command A，一款专为企业设计的新型先进生成模型，旨在满足企业对快速、安全和高质量 AI 的高要求。Command A 在性能、效率和企业级功能上表现出色，是市场上最...

大语言模型 # Cohere # Command A # 企业

11个月前

05880

香港大学与华为合作发布扩散大语言模型 Dream 7B

香港大学与华为诺亚方舟实验室携手，正式发布了迄今为止最强大的开放扩散（Diffusion）大语言模型——Dream 7B。这一模型不仅在性能上大幅超越现有的扩散语言模型，还在通用能力、数学能力和编码能...

大语言模型 # Dream 7B # 华为诺亚方舟实验室 # 扩散大语言模型

10个月前

05580

阿里推出高效的长上下文压缩框架QwenLong-CPRS

在大语言模型（LLM）处理长文本时，两个核心问题始终存在：计算开销高和中间信息丢失严重。为了解决这些问题，阿里通义实验室 Qwen-Doc 团队推出了一个全新上下文压缩框架 —— QwenLong...

大语言模型 # QwenLong-CPRS # QwenLong-CPRS-7B

8个月前

05530

思科发布专为网络安全打造的开源模型 Foundation-sec-8b

思科宣布其在AI领域的重大进展——推出首个由全新成立的Foundation AI团队开发的大语言模型（LLM）：Llama-3.1-FoundationAI-SecurityLLM-base-8B（简...

大语言模型 # Foundation-sec-8b # 思科

9个月前

05120

Block Diffusion：结合了自回归（Autoregressive）和扩散（Diffusion）模型优点的新型语言生成模型

康奈尔科技校区、斯坦福大学和Cohere推出语言模型Block Diffusion，它是一种结合了自回归（Autoregressive）和扩散（Diffusion）模型优点的新型语言生成模型。论文的核...

大语言模型 # Block Diffusion # 大语言模型

11个月前

05110

加载更多

多语言文本编码器Glyph-ByT5-v2：提高在图形设计图像中渲染多种语言文本的准确性和美观度

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

告别旧版，迎接进化！阿里Qwen团队发布Qwen3-235B-A22B-Instruct-2507

百川智能发布 Baichuan-M2：小模型，大医疗，单卡可部署的开源医疗大模型

Cohere 推出了 Command A：高性能、低计算需求的大语言模型，为企业量身定制

香港大学与华为合作发布扩散大语言模型 Dream 7B

阿里推出高效的长上下文压缩框架QwenLong-CPRS

思科发布专为网络安全打造的开源模型 Foundation-sec-8b

Block Diffusion：结合了自回归（Autoregressive）和扩散（Diffusion）模型优点的新型语言生成模型

Skills.sh

Situation Monitor

CutCut

TapNow

火宝短剧（Huobao Drama）

Clawdbot/Moltbot

大语言模型

网址

Skills.sh

Situation Monitor

CutCut

TapNow

火宝短剧（Huobao Drama）

Clawdbot/Moltbot