小马良

帅气的我简直无法用语言描述!

ComfyUI Deep Exemplar-based Colorization Nodes:通过参考图为黑白照片或视频重新渲染为彩色

ComfyUI Deep Exemplar-based Colorization Nodes 是一个基于2019年发布的项目“Deep Exemplar-based Video Colorizatio...
6小时前
030

阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型

阿里巴巴推出一款名为 QVQ-Max 的全新视觉推理模型,这是其 Qwen模型系列中的最新成员。QVQ-Max 的独特之处在于它能够理解照片和视频的内容,并对这些信息进行分析和推理,从而提供解决方案。...
7小时前
020

OpenAI 放宽 ChatGPT 图像创建限制

本周,OpenAI 对 ChatGPT 的图像生成功能进行了重大更新,不仅提升了生成能力,还在内容审核政策上做出了显著调整。这些变化引发了广泛讨论,尤其是在处理敏感内容和公众人物图像方面。 OpenA...
7小时前
020

腾讯元宝更新:支持 36 种文件格式,助力开发者高效工作

腾讯元宝近日宣布更新,进一步扩展其文件处理能力,支持多达 36 种文件格式。这一更新不仅涵盖了常见的办公文档,如 Word、Excel、PPT 和 PDF,还广泛支持开发文件格式,包括 .py、.ja...
7小时前
020

OpenAI 发布增强版 GPT-4o 模型,ChatGPT 用户迎来多项重大改进

OpenAI 于近日宣布了 GPT-4o 模型的最新更新,为广受欢迎的 ChatGPT AI 助手带来了显著的性能提升和功能改进。这一更新在 2025 年 1 月 29 日发布的现有 GPT-4o 模...
9小时前
030

开源开发者反击 AI 爬虫,以巧妙且幽默的方式展开了反击

AI 爬虫正成为许多软件开发者眼中的“蟑螂”——它们无处不在,且常常带来麻烦。尤其是对于开源社区的开发者来说,AI 爬虫的不良行为已经严重影响了他们的日常工作和项目维护。然而,面对这些“数字害虫”,开...
10小时前
050

OpenAI 推出内部数据引用功能,满足企业级需求

OpenAI 为 ChatGPT 用户带来了一项备受期待的新功能:引用内部知识来源的能力。这一功能的推出,标志着 ChatGPT 在企业级应用中的实用性和灵活性迈上了新的台阶。 企业级需求的满足 对于...
16小时前
060

ComfyUI原生支持Hunyuan3D 2.0,开启3D生成新体验

ComfyUI现已原生支持腾讯发布的Hunyuan3D 2.0及其多视图生成模型(Hunyuan3D 2.0 MV)系列。这一更新为用户提供了更高效、更便捷的3D模型生成体验,无论是从文本还是图像生成...
9小时前
0130

Kyutai发布首个开源实时语音模型MoshiVis,开启视觉与语音交互新时代

在AI领域,将实时语音交互与视觉内容相结合一直是一个极具挑战性的课题。传统系统通常依赖于多个独立组件来实现语音活动检测、语音识别、文本对话和文本转语音合成,这种分段式的方法不仅容易引入延迟,还难以捕捉...
1天前
070

MCP(开源模型上下文协议)迎来重大更新,还获得了行业巨头OpenAI和微软的支持

开源模型上下文协议(MCP)的最新更新标志着AI代理与工具、数据和接口无缝交互的一个重要里程碑。这一更新不仅引入了关键升级,还获得了行业巨头OpenAI和微软的支持,显示出其在AI领域的巨大潜力和影响...
1天前
080