智谱AI

排序

发布更新浏览点赞

智谱突袭发布GLM-5.1：编码能力暴涨 30%，直逼 Claude Opus，手把手教你接入 Claude Code 与 OpenClaw

就在距离春节版 GLM-5.0 发布仅一个多月后，智谱 AI 今晚突然放出“大招”——正式推出改进版大模型 GLM-5.1。该模型现已面向 GLM Coding Plan 全体用户（Lite/Pro...

大语言模型早报 # Claude Code # Claude Opus # GLM-5.1

5天前

02210

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

智谱AI正式推出新一代通用大模型——GLM-5，这款模型在设计之初就明确了核心定位：面向复杂系统工程和长周期智能体任务，致力于打破基础模型“只能聊天、难以落地”的局限，实现从“氛围编程”到“智能体工程...

大语言模型 # GLM-5 # 智谱AI

2个月前

0370

智谱AI开源GLM-OCR：0.9B参数拿下榜单第一，支持vLLM部署，一行命令就能用

智谱AI又放出一款实用开源模型——GLM-OCR，这是一款专为复杂文档理解打造的多模态OCR模型，不仅在权威基准测试中拿下综合第一，还做到了轻量高效、易部署，关键是完全开源，个人和企业都能免费使用。 ...

多模态模型 # GLM-OCR # 智谱AI

2个月前

02670

智谱AI开源GLM-TTS：LLM驱动的高质量TTS系统，支持零样本克隆与情感增强

智谱AI推出的GLM-TTS是一款基于大语言模型的文本到语音合成系统，创新性采用LLM+Flow模型的两阶段架构，不仅实现了零样本语音克隆、流式推理等实用功能，还通过多奖励强化学习框架，大幅提升了语音...

语音模型 # GLM-TTS # 智谱AI

3个月前

0570

智谱AI开源GLM-Image：自回归+扩散混合架构，攻克知识密集型图像生成难题

智谱AI正式推出GLM-Image——业界首个开源的工业级离散自回归图像生成模型。这款模型创新性地采用自回归模块+扩散解码器的混合架构，既继承了自回归模型对复杂语义的精准理解能力，又兼具扩散模型高保真...

图像模型 # GLM-Image # 智谱AI

3个月前

01890

智谱AI发布GLM-4.7：聚焦编程、工具使用与多轮推理

智谱AI最新发布的 GLM-4.7 在多个关键维度实现突破，特别是在开发者关注的编程、工具调用与复杂推理能力上，带来可观的性能提升。本文将系统梳理 GLM-4.7 的主要改进，并说明如何快速接入与使用...

大语言模型 # GLM-4.7 # 智谱AI

3个月前

0460

智谱AI发布 Kaleido：通过多参考图像生成主体一致视频的 S2V 框架

在主体到视频（Subject-to-Video, S2V）生成任务中，目标是根据用户提供的多张目标主体参考图像和文本提示，合成一段主体身份一致、动作自然、背景可控的视频。尽管近期 S2V 模型取得进展...

视频模型 # Kaleido # 智谱AI

4个月前

0680

智谱AI提出 SSVAE：通过谱结构优化提升视频VAE“可扩散性”的新方法

在基于扩散模型的视频生成系统中，视频变分自编码器（VAE）扮演着关键角色：它将像素空间视频压缩到潜在空间，供扩散模型高效训练。然而，现有视频 VAE 的设计往往过度聚焦于重建保真度，却忽视了一个更根...

视频模型 # SSVAE # 智谱AI

4个月前

0210

智谱AI发布面向生产级角色动画的生成框架 SCAIL：通过3D一致姿态表征实现影棚级角色动画

高质量角色动画长期以来依赖昂贵的动作捕捉设备、繁琐的手动绑定和大量人力修型。尽管近年视频生成模型取得进展，但在复杂动作、风格化角色、多角色交互等场景下，现有方法仍普遍存在结构失真、时间不连贯、身份泄漏...

视频模型 # SCAIL # 智谱AI # 角色动画

4个月前

0790

智谱AI开源 RealVideo：基于自回归扩散的实时流式对话视频系统

随着多模态生成技术的发展，用户对虚拟角色的期待已从“能说话”升级为“能自然表达、实时互动、持续存在”。为此，智谱AI推出了 RealVideo —— 一个端到端实时流式视频对话系统，能够将文本对话实时...

视频模型 # RealVideo # 数字人 # 智谱AI

4个月前

01890

智谱AI语音识别模型GLM-ASR双版本登场：云端版精准识别多场景，Nano版开源免费，笔记本/手机均可部署

智谱AI全新发布 GLM-ASR 系列语音识别模型，包含云端部署的 GLM-ASR-2512 与端侧轻量化的 GLM-ASR-Nano-2512 两个版本。其中 Nano 版以 1.5B 紧凑参数规模...

语音模型 # GLM-ASR-2512 # GLM-ASR-Nano-2512 # 智谱AI

4个月前

0430

智谱AI开源GLM-4.6V：128K上下文视觉语言模型，原生工具调用打通感知与执行链路

智谱AI正式推出并开源 GLM-4.6V 系列多模态大语言模型，包含面向云端与高性能集群的 GLM-4.6V (106B) 基础模型，以及针对本地部署和低延迟场景优化的 GLM-4.6V-Flash ...

多模态模型 # GLM-4.6V # 智谱AI

4个月前

0280

加载更多

智谱突袭发布GLM-5.1：编码能力暴涨 30%，直逼 Claude Opus，手把手教你接入 Claude Code 与 OpenClaw

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

智谱AI开源GLM-OCR：0.9B参数拿下榜单第一，支持vLLM部署，一行命令就能用

智谱AI开源GLM-TTS：LLM驱动的高质量TTS系统，支持零样本克隆与情感增强

智谱AI开源GLM-Image：自回归+扩散混合架构，攻克知识密集型图像生成难题

智谱AI发布GLM-4.7：聚焦编程、工具使用与多轮推理

智谱AI发布 Kaleido：通过多参考图像生成主体一致视频的 S2V 框架

智谱AI提出 SSVAE：通过谱结构优化提升视频VAE“可扩散性”的新方法

智谱AI发布面向生产级角色动画的生成框架 SCAIL：通过3D一致姿态表征实现影棚级角色动画

智谱AI开源 RealVideo：基于自回归扩散的实时流式对话视频系统

智谱AI语音识别模型GLM-ASR双版本登场：云端版精准识别多场景，Nano版开源免费，笔记本/手机均可部署

智谱AI开源GLM-4.6V：128K上下文视觉语言模型，原生工具调用打通感知与执行链路

ITELLOU

S.H.I.T

新即梦 CLI

Meshy

Alaya Code

Qwen Chat

智谱AI

网址

ITELLOU

S.H.I.T

新即梦 CLI

Meshy

Alaya Code

Qwen Chat