探索扩散模型中的量化后端:在性能与内存之间寻找平衡大型扩散模型如 Flux-dev 能够生成高质量图像,但它们通常需要大量显存和计算资源。对于大多数用户来说,这可能是一个难以跨越的门槛。 有没有一种方式,在不明显牺牲效果的前提下,降低模型对硬件的要求...科普# Flux Dev# 扩散模型7个月前01990
微软记事本也能用 AI 写文章了?Windows 11 新增 AI 写作功能你以为记事本只是个简单的文本编辑器?微软正在让它变得更聪明。 在最新发布的 Windows 11 Canary 和 Dev 预览版中,微软开始测试一项全新的 AI 功能:Write with AI,它...早报# AI# 微软# 记事本7个月前02050
Anthropic 推出新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4今天,Anthropic 宣布推出下一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准,为开发者和...早报# Claude# Claude Code# Claude Opus 47个月前03700
UniVG-R1:通过推理引导的多模态大语言模型实现通用视觉定位传统视觉定位方法主要关注单图像场景,依赖于简单文本引用。然而,在现实世界中,处理隐含和复杂的指令,尤其是在涉及多图像的情况下,是一个重大挑战,主要原因是缺乏跨多模态上下文的高级推理能力。 项目主页:h...新技术# UniVG-R1# 多模态大语言模型# 视觉定位7个月前02140
英伟达与微软携手,加速 RTX AI PC 的发展在当今快速发展的技术领域,生成式 AI 正在重塑我们的工作和娱乐方式。英伟达和微软的合作,通过推出 RTX AI PC,正在将这一变革推向新的高度。本文将详细介绍英伟达和微软如何通过一系列创新技术和工...早报# RTX AI PC# 微软# 英伟达7个月前02010
OpenAI 重磅升级 Responses API:支持远程 MCP、图像生成、代码解释器等OpenAI 在昨日(5 月 21 日)宣布对 Responses API 进行重大扩展,新增了多项关键能力:包括远程连接 MCP 服务器、图像生成、代码解释器集成、文件搜索优化等,旨在帮助开发者更高...早报# OpenAI# Responses API7个月前01990
Vid2World:将预训练的视频扩散模型转化为交互式世界模型清华大学软件学院、清华大学交叉信息研究所和重庆大学计算机学院的研究人员推出 Vid2World,将预训练的视频扩散模型(Video Diffusion Models)转化为交互式世界模型(Intera...新技术# Vid2World# 交互式世界模型# 视频扩散模型7个月前02780
针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律香港大学和字节跳动的研究人员介绍了一种针对大语言模型(LLMs)的量化感知训练(QAT)的统一缩放定律。量化是一种减少模型权重和激活精度的方法,以降低内存使用和计算成本。尽管现有的量化方法在中等精度...新技术# 大语言模型# 量化感知训练7个月前02370
3DTown框架:从单张俯视图像生成逼真且连贯的三维(3D)场景加州大学圣克鲁兹分校、哥伦比亚大学和Cybever AI的研究人员推出 3DTown框架,从单张俯视图像生成逼真且连贯的三维(3D)场景。传统的详细3D场景获取方法通常需要昂贵的设备、多视角数据或人工...新技术# 3DTown# 3D场景7个月前01850
萨姆·奥尔特曼与乔纳森·艾维联手打造设计公司 io被OpenAI收购了 OpenAI 宣布了一项重磅交易:以 65亿美元估值收购由乔纳森·艾维(Jony Ive)创立的设计公司 io,并将其团队纳入 OpenAI 生态体系。这不仅标志着 OpenAI 首次大规模并购...早报# OpenAI# 乔纳森·艾维# 萨姆·奥尔特曼7个月前02230
谷歌搜索上线AI搜索新模式:能看、能听、还能替你办事谷歌在今天的 Google I/O 2025 上宣布了一系列重磅更新,标志着 Google Search 正式迈入一个新时代 —— AI 不只是回答问题,而是帮助你思考、推理和行动。 从 AI 概述...百科# AI搜索# 谷歌搜索7个月前01530
Gemini 2.5 Flash 和 Pro 全面上线Vertex AI:更聪明、更安全、更懂企业的AI来了在今天举行的 Google I/O 2025 上,谷歌宣布将最新一代大模型 Gemini 2.5 Flash 和 Gemini 2.5 Pro 正式扩展至 Vertex AI 平台,为企业构建高复杂度...早报# Gemini 2.5 Flash# Gemini 2.5 Pro7个月前01800