微软生成式AI模型WHAMM,让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》微软昨天推出了一项令人瞩目的技术——WHAMM(World and Human Action MaskGIT Model),这是一个专门用于实时游戏的生成式AI模型。为了展示其强大功能,微软选择了28...早报# WHAMM# 微软# 雷神之锤21年前05030
Poe 推出新功能Poe Apps,用户可创建和共享自定义 AI 驱动的AI应用Quora 旗下的 Poe 平台,作为汇集众多 AI 模型的中心枢纽,近日推出了一项新功能——Poe Apps。这项功能允许用户在任意模型组合的基础上构建可视化界面,从而创建自定义的应用程序。通过这一...早报# Poe# Poe Apps# Quora1年前05030
微软亚洲研究院推出新框架VASA-1:基于一张静态图片和一个语音音频片段,实时生成逼真的会说话的面孔微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具有吸引力的视觉情感技能(VAS)的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...新技术# VASA-12年前05030
群核科技发布新一代空间大模型:SpatialLM 1.5 与 SpatialGen 正式亮相在首届技术开放日(TechDay)上,群核科技正式推出空间大模型体系的两大核心更新——新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并明确了后续开源节奏。作为业界首个...早报# SpatialGen# SpatialLM 1.5# 群核科技8个月前05000
为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话Anthropic宣布,其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力:在极端情况下,主动终止与用户的对话。 这并非因为用户“说错话”,而是当对话持续涉及严重滥用内容——如...早报# Anthropic# Claude8个月前05000
谷歌自主编码智能体 Jules 正式开放公测:写代码也能“异步执行”谷歌正式宣布其自主编码智能体 Jules 进入公开测试阶段,向全球支持 Gemini 模型的地区全面开放。 与传统代码补全工具不同,Jules 不是辅助你写代码,而是代替你写代码。它是一个真正意义上的...早报# Jules# 编码智能体# 谷歌11个月前04990
新型参考式人类图像补全框架CompleteMe:通过参考图像来补全被遮挡或缺失的人类图像区域,同时保留独特的细节信息加州大学默塞德分校和Adobe Research的研究人员推出新型参考式人类图像补全框架CompleteMe,旨在通过参考图像来补全被遮挡或缺失的人类图像区域,同时保留独特的细节信息,如特定的服装图案...新技术# CompleteMe11个月前04990
Google Vids更新:AI化身功能正式上线,同步推出免费消费者版本去年面向Google Workspace生产力套件推出的视频编辑器Google Vids,近日迎来重要更新:不仅新增AI化身、自动转录修剪、图像到视频等实用功能,还首次推出免费的消费者版本。此次调整既...早报# Google Vids# 视频编辑器# 谷歌8个月前04980
字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...新技术# WideSearch# 字节跳动# 智能体评估基准8个月前04980
帧感知视频扩散模型FVDM:时间步向量化方法,提高了视频生成任务的质量和灵活性香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型,称为帧感知视频扩散模型(Frame-Aware Video Diffusion Model,简称FV...新技术# FVDM# 帧感知视频扩散模型2年前04980
自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导(APG),保留了CFG提高质量的优势,同时允许使用更高的引导比例而不产生过饱和。APG易于实现,并且实际上不会给采样过程带来额外的计算开销...新技术# APG# 自适应投影引导2年前04970
E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...新技术# E2GAN# 生成对抗网络(GAN)模型2年前04970