谷歌 | SD百科导航

排序

发布更新浏览点赞

谷歌 Kingfall 模型短暂上线 AI Studio后被迅速下架：是误放？还是有意为之？

谷歌一款代号为 Kingfall 的机密模型在 AI Studio 平台短暂上线约20分钟后被迅速下架。尽管曝光时间极短，却已引发开发者和早期用户的广泛关注，并在技术社区中掀起热议。此次事件恰逢 O...

早报 # Kingfall 模型 # 谷歌

10个月前

01,6400

Gemini Canvas 免费使用指南，像朋友一样帮你完善创意

在创意和思考的过程中，有一个能够随时交流、提供反馈的伙伴无疑是极其宝贵的。然而，随着生活节奏的加快，我们与朋友交流的时间越来越少。这时，AI 成为了一个理想的替代者，它不仅能分享你的想法和创意，还能提...

教程 # Gemini Canvas # 谷歌

12个月前

09300

谷歌推出AI 学习工具Learn About：为用户提供个性化的学习体验

谷歌最近发布了一个名为 Learn About 的 AI 学习工具，旨在为用户提供个性化的学习体验。此工具可以根据用户提出的问题给出详细的解释，并推荐合适的视频教程和文字教程。Learn About ...

工具 # AI 学习工具 # Learn About # 谷歌

1年前

09030

谷歌Gemini推出“引导学习（Guided Learning）”功能，正面回应 AI 教育争议

周三，谷歌宣布在 Gemini 中上线一项名为 “引导学习”（Guided Learning）的新功能。它不像传统聊天机器人那样直接给出答案，而是以“AI 导师”的角色，帮助用户逐步理解复杂概念，构建...

早报 # Gemini # 引导学习 # 谷歌

8个月前

08970

如何在 LMArena 稳定使用谷歌 nano banana 模型？

此前在大模型测试评估平台LMArena上现身的图像编辑模型nano banana，如今已确认归属谷歌——不过目前它仍处于测试阶段，仅能在LMArena内使用，且需通过“抽卡”方式获取使用资格，常需多轮...

提示词 # LMArena # nano-banana # 谷歌

7个月前

08740

谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion

谷歌的研究团队推出了新的文生图模型MobileDiffusion，它能够在手机上几乎瞬间（亚秒级）生成高质量的图片。该模型在架构和采样技术方面进行广泛优化，在iPhone 15 Pro上，Mobile...

新技术 # MobileDiffusion # 安卓 # 扩散模型

2年前

08000

ComfyUI-Gemini_Flash_2.0_Exp：集成了谷歌的 Gemini Flash 2.0 实验模型的ComfyUI自定义节点

ComfyUI-Gemini_Flash_2.0_Exp 是一个ComfyUI 自定义节点，集成了谷歌的 Gemini Flash 2.0 实验模型。它支持在 ComfyUI 工作流中直接进行文本、图...

插件 # ComfyUI # ComfyUI-Gemini_Flash_2.0_Exp # Gemini Flash 2.0

1年前

07950

谷歌推出新型图像编辑工具Magic Insert：将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然

谷歌推出新型图像编辑工具Magic Insert，可以让我们像变魔术一样，将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然，就像它本...

新技术 # Magic Insert # 图像编辑 # 谷歌

2年前

07410

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

Google Research推出CamViG（Camera Aware Image-to-Video Generation），它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于，它能够...

新技术 # CamViG # 相机运动 # 谷歌

2年前

07390

谷歌推出新一代开源模型Gemma，轻量级高性能，助力AI创新

谷歌推出开源模型Gemma，这是一款轻量级、先进的开源模型，供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸，能够在不同的设备类型上运行，包括笔记本电脑...

大语言模型 # Gemma # 大语言模型 # 谷歌

1年前

07310

新型图像匹配技术OmniGlue：首个以泛化为核心设计原则的可学习图像匹配器

德克萨斯大学奥斯汀分校和谷歌的研究人员推出新型图像匹配技术OmniGlue，这是首个以泛化为核心设计原则的可学习图像匹配器。OmniGlue利用来自视觉基础模型的广泛知识来指导特征匹配过程，从而增强了...

新技术 # OmniGlue # 谷歌

2年前

07270

视频编码器VideoPrism：能够处理多种视频理解任务，如分类、定位、检索、字幕生成和问答

来自谷歌的研究人员推出视频编码器VideoPrism，它是一个通用的视频理解模型，能够处理多种视频理解任务，如分类、定位、检索、字幕生成和问答（QA）。VideoPrism通过在一个单一的冻结模型上进...

新技术 # VideoPrism # 视频编码器 # 谷歌

9个月前

07050

加载更多

谷歌