小马良

帅气的我简直无法用语言描述!
腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先

腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先

腾讯正式发布自研大模型 混元 2.0(Tencent HY 2.0),包含 HY 2.0 Think(推理优化版)与 HY 2.0 Instruct(指令对齐版)两个版本。该模型采用 混合专家(MoE...
2天前
050
微软发布轻量级实时TTS模型VibeVoice-Realtime:300ms响应的流式长文本TTS模型

微软发布轻量级实时TTS模型VibeVoice-Realtime:300ms响应的流式长文本TTS模型

实时文本转语音(TTS)技术在智能助手、实时播报、大模型交互等场景中有着极高的需求,但传统模型往往面临“延迟高”“长文本生成不稳定”“流式输入支持差”等痛点。 微软推出了一款轻量级实时TTS模型——V...
2天前
050
ComfyUI官方回应 Nodes 2.0 争议:传统画布保留,自定义节点支持优先

ComfyUI官方回应 Nodes 2.0 争议:传统画布保留,自定义节点支持优先

过去几天,我们看到了大量关于 Nodes 2.0 更新的热烈讨论。感谢大家的反馈!我们确实阅读了所有内容——无论是失望、错误报告还是迷因,无一遗漏。即使我们没有回复大部分讨论,但没有任何反馈被忽视。你...
2天前
0210
Meta 推出集中式支持中心,测试 AI 助手以简化账户恢复流程

Meta 推出集中式支持中心,测试 AI 助手以简化账户恢复流程

Meta 于本周四宣布,将为 Facebook 和 Instagram 用户 推出一个全新的集中式支持中心,并首次在帮助系统中引入 AI 驱动的搜索功能与 AI 助手。公司承认,过去的支持体验“未能始...
2天前
0110
可灵 AI 推出音画同出模型可灵 2.6:一句话生成带语音、音效与画面的完整视频

可灵 AI 推出音画同出模型可灵 2.6:一句话生成带语音、音效与画面的完整视频

快手旗下 可灵 AI 通过官方公众号宣布,其首个 音画同出模型 正式上线。该模型可在单次生成中同步输出画面、自然语音、匹配音效与环境氛围,首次实现“音”与“画”的深度协同创作。 新模型作为 可灵 2...
3天前
0140
火山引擎发布豆包图像模型 Seedream 4.5,强化多图融合与广告级排版能力

火山引擎发布豆包图像模型 Seedream 4.5,强化多图融合与广告级排版能力

火山引擎今日正式发布 豆包图像创作模型 Doubao-Seedream-4.5(简称 Seedream 4.5),即日起开启公测。该模型在主体一致性、指令遵循精度、空间逻辑理解与美学表现力四大维度实现...
3天前
060
千问 App 上线 Qwen3-Learning:支持拍照答疑与全科作业批改

千问 App 上线 Qwen3-Learning:支持拍照答疑与全科作业批改

今日,通义千问 App 正式上线基于 Qwen3 训练的最新学习专用大模型 —— Qwen3-Learning。官方称其为“阿里迄今最强的学习大模型”,面向 K12 及以上学习者提供深度辅导能力。 核...
3天前
080
阿里千问上线一站式智能文档与 PPT 生成,免费开放

阿里千问上线一站式智能文档与 PPT 生成,免费开放

阿里千问宣布,将 文档生成、智能排版、在线编辑、多格式转换 等能力全面整合,推出一站式智能文档中心。所有功能即日起向所有用户免费开放。 现在,用户无需再切换多个 Office 软件,只需与千问对话,即...
3天前
0100
ChatGPT 应用商店提交流程曝光:五步审核、人工复核,上线在即

ChatGPT 应用商店提交流程曝光:五步审核、人工复核,上线在即

OpenAI 正加速推进 ChatGPT 应用商店 的正式发布。根据其平台最新构建版本透露的信息,一套结构化、高规范性的应用提交与审核流程已基本成型,标志着该商店正从概念走向落地。 开发者未来提交 C...
3天前
080
Klok Caption Tagger :用于AI图像生成的训练数据集管理工具

Klok Caption Tagger :用于AI图像生成的训练数据集管理工具

Klok Caption Tagger 是一款功能强大的基于浏览器的工具,专门用于创建和管理AI图像生成的训练数据集,例如为 Z-Image、Stable Diffusion、FLUX、Illustr...
3天前
0100