谷歌 Kingfall 模型短暂上线 AI Studio后被迅速下架:是误放?还是有意为之?谷歌一款代号为 Kingfall 的机密模型在 AI Studio 平台短暂上线约20分钟后被迅速下架。尽管曝光时间极短,却已引发开发者和早期用户的广泛关注,并在技术社区中掀起热议。 此次事件恰逢 O...早报# Kingfall 模型# 谷歌6个月前01,5410
谷歌推出AI 学习工具Learn About:为用户提供个性化的学习体验谷歌最近发布了一个名为 Learn About 的 AI 学习工具,旨在为用户提供个性化的学习体验。此工具可以根据用户提出的问题给出详细的解释,并推荐合适的视频教程和文字教程。Learn About ...工具# AI 学习工具# Learn About# 谷歌1年前08690
谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(亚秒级)生成高质量的图片。该模型在架构和采样技术方面进行广泛优化,在iPhone 15 Pro上,Mobile...新技术# MobileDiffusion# 安卓# 扩散模型2年前07520
谷歌推出新一代开源模型Gemma,轻量级高性能,助力AI创新谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑...大语言模型# Gemma# 大语言模型# 谷歌10个月前07160
谷歌Gemini推出“引导学习(Guided Learning)”功能,正面回应 AI 教育争议周三,谷歌宣布在 Gemini 中上线一项名为 “引导学习”(Guided Learning)的新功能。它不像传统聊天机器人那样直接给出答案,而是以“AI 导师”的角色,帮助用户逐步理解复杂概念,构建...早报# Gemini# 引导学习# 谷歌4个月前07100
谷歌推出新型图像编辑工具Magic Insert:将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然谷歌推出新型图像编辑工具Magic Insert,可以让我们像变魔术一样,将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然,就像它本...新技术# Magic Insert# 图像编辑# 谷歌1年前07070
谷歌推出CamViG:控制视频生成过程中的相机视角,从而生成具有精确相机运动的视频Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于,它能够...新技术# CamViG# 相机运动# 谷歌2年前07060
谷歌推出新框架ImageInWords(IIW):创建准确且细节丰富的图像描述,以提高视觉-语言模型的训练效果Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords(IIW),此框架旨在创建准确且细节丰富的图像描述,以提高视觉-语言模型(VLMs...新技术# IIW# ImageInWords# 数据集2年前06930
视频编码器VideoPrism:能够处理多种视频理解任务,如分类、定位、检索、字幕生成和问答来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够处理多种视频理解任务,如分类、定位、检索、字幕生成和问答(QA)。VideoPrism通过在一个单一的冻结模型上进...新技术# VideoPrism# 视频编码器# 谷歌6个月前06860
如何在 LMArena 稳定使用谷歌 nano banana 模型?此前在大模型测试评估平台LMArena上现身的图像编辑模型nano banana,如今已确认归属谷歌——不过目前它仍处于测试阶段,仅能在LMArena内使用,且需通过“抽卡”方式获取使用资格,常需多轮...提示词# LMArena# nano-banana# 谷歌4个月前06830
新型图像匹配技术OmniGlue:首个以泛化为核心设计原则的可学习图像匹配器德克萨斯大学奥斯汀分校和谷歌的研究人员推出新型图像匹配技术OmniGlue,这是首个以泛化为核心设计原则的可学习图像匹配器。OmniGlue利用来自视觉基础模型的广泛知识来指导特征匹配过程,从而增强了...新技术# OmniGlue# 谷歌2年前06820
谷歌推出基于问答的自动评估指标Gecko,用于评估文生图模型的性能谷歌推出基于问答的自动评估指标Gecko2K,用于评估文生图模型的性能。文生图模型生成的图像并不总是能够完全符合文本中的所有细节。因此,评估这些模型生成的图像与文本描述的匹配程度是一个重要的研究问题...新技术# Gecko# Gecko2K# 自动评估2年前06590