智谱AI

排序

发布更新浏览点赞

智谱AI发布GLM-4.5V：106B参数的开源视觉推理模型，支持“思考模式”切换

今日，智谱 AI 正式推出其新一代开源视觉语言模型 GLM-4.5V，并在魔搭社区与 Hugging Face 同步开源。该模型总参数达 106B，采用 MOE（Mixture of Experts...

多模态模型 # GLM-4.5V # 智谱AI

8个月前

01730

智谱AI发布面向生产级角色动画的生成框架 SCAIL：通过3D一致姿态表征实现影棚级角色动画

高质量角色动画长期以来依赖昂贵的动作捕捉设备、繁琐的手动绑定和大量人力修型。尽管近年视频生成模型取得进展，但在复杂动作、风格化角色、多角色交互等场景下，现有方法仍普遍存在结构失真、时间不连贯、身份泄漏...

视频模型 # SCAIL # 智谱AI # 角色动画

4个月前

0790

智谱AI发布 Kaleido：通过多参考图像生成主体一致视频的 S2V 框架

在主体到视频（Subject-to-Video, S2V）生成任务中，目标是根据用户提供的多张目标主体参考图像和文本提示，合成一段主体身份一致、动作自然、背景可控的视频。尽管近期 S2V 模型取得进展...

视频模型 # Kaleido # 智谱AI

4个月前

0680

智谱AI开源GLM-TTS：LLM驱动的高质量TTS系统，支持零样本克隆与情感增强

智谱AI推出的GLM-TTS是一款基于大语言模型的文本到语音合成系统，创新性采用LLM+Flow模型的两阶段架构，不仅实现了零样本语音克隆、流式推理等实用功能，还通过多奖励强化学习框架，大幅提升了语音...

语音模型 # GLM-TTS # 智谱AI

3个月前

0570

智谱AI发布GLM-4.7：聚焦编程、工具使用与多轮推理

智谱AI最新发布的 GLM-4.7 在多个关键维度实现突破，特别是在开发者关注的编程、工具调用与复杂推理能力上，带来可观的性能提升。本文将系统梳理 GLM-4.7 的主要改进，并说明如何快速接入与使用...

大语言模型 # GLM-4.7 # 智谱AI

3个月前

0460

智谱AI语音识别模型GLM-ASR双版本登场：云端版精准识别多场景，Nano版开源免费，笔记本/手机均可部署

智谱AI全新发布 GLM-ASR 系列语音识别模型，包含云端部署的 GLM-ASR-2512 与端侧轻量化的 GLM-ASR-Nano-2512 两个版本。其中 Nano 版以 1.5B 紧凑参数规模...

语音模型 # GLM-ASR-2512 # GLM-ASR-Nano-2512 # 智谱AI

4个月前

0430

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

智谱AI正式推出新一代通用大模型——GLM-5，这款模型在设计之初就明确了核心定位：面向复杂系统工程和长周期智能体任务，致力于打破基础模型“只能聊天、难以落地”的局限，实现从“氛围编程”到“智能体工程...

大语言模型 # GLM-5 # 智谱AI

2个月前

0370

智谱AI开源GLM-4.6V：128K上下文视觉语言模型，原生工具调用打通感知与执行链路

智谱AI正式推出并开源 GLM-4.6V 系列多模态大语言模型，包含面向云端与高性能集群的 GLM-4.6V (106B) 基础模型，以及针对本地部署和低延迟场景优化的 GLM-4.6V-Flash ...

多模态模型 # GLM-4.6V # 智谱AI

4个月前

0280

智谱AI提出 SSVAE：通过谱结构优化提升视频VAE“可扩散性”的新方法

在基于扩散模型的视频生成系统中，视频变分自编码器（VAE）扮演着关键角色：它将像素空间视频压缩到潜在空间，供扩散模型高效训练。然而，现有视频 VAE 的设计往往过度聚焦于重建保真度，却忽视了一个更根...

视频模型 # SSVAE # 智谱AI

4个月前

0210

没有了

智谱AI发布GLM-4.5V：106B参数的开源视觉推理模型，支持“思考模式”切换

智谱AI发布面向生产级角色动画的生成框架 SCAIL：通过3D一致姿态表征实现影棚级角色动画

智谱AI发布 Kaleido：通过多参考图像生成主体一致视频的 S2V 框架

智谱AI开源GLM-TTS：LLM驱动的高质量TTS系统，支持零样本克隆与情感增强

智谱AI发布GLM-4.7：聚焦编程、工具使用与多轮推理

智谱AI语音识别模型GLM-ASR双版本登场：云端版精准识别多场景，Nano版开源免费，笔记本/手机均可部署

智谱AI正式发布GLM-5：744B参数+28.5T数据，长周期智能体能力登顶开源第一

智谱AI开源GLM-4.6V：128K上下文视觉语言模型，原生工具调用打通感知与执行链路

智谱AI提出 SSVAE：通过谱结构优化提升视频VAE“可扩散性”的新方法

ITELLOU

S.H.I.T

新即梦 CLI

Meshy

Alaya Code

BuildCores

智谱AI

网址

ITELLOU

S.H.I.T

新即梦 CLI

Meshy

Alaya Code

BuildCores