设计灵感来源于PaLI-3!谷歌推出开源视觉语言模型PaliGemma PaliGemma 是谷歌推出的新一代视觉语言模型家族,其设计灵感来源于PaLI-3,能够接收图像与文本输入并生成文本输出。PaliGemma建立在包括SigLIP视觉模型和Gemma语言模型在内的开... 多模态模型# PaliGemma# 谷歌 2周前04680
谷歌推出新一代开源模型Gemma,轻量级高性能,助力AI创新 谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用于AI构建。Gemma模型家族包括Gemma 2B和Gemma 7B两种尺寸,能够在不同的设备类型上运行,包括笔记本电脑... 大语言模型# Gemma# 大语言模型# 谷歌 2周前05160
谷歌推出最新视频和图像生成模型:Veo 2 和 Imagen 3 自从今年早些时候谷歌推出了视频生成模型 Veo 和图像生成模型 Imagen 3 以来,这些工具已经在多个领域产生了深远的影响。YouTube 创作者使用它们为 YouTube Shorts 制作创意... 早报# Imagen 3# Veo 2# 谷歌 2周前0200
谷歌AI播客应用Illuminate:将网页内容转化为音频对话 谷歌的AI笔记和研究助手NotebookLM获得了不错的回响后,近期又推出了AI音频应用 Illuminate,用户可以通过输入主题或链接生成对应的音频对话,并支持自定义语音和提示词。在播客兴起的当下... 工具# AI播客# Illuminate# 谷歌 3个月前01540
谷歌推出AI 学习工具Learn About:为用户提供个性化的学习体验 谷歌最近发布了一个名为 Learn About 的 AI 学习工具,旨在为用户提供个性化的学习体验。此工具可以根据用户提出的问题给出详细的解释,并推荐合适的视频教程和文字教程。Learn About ... 工具# AI 学习工具# Learn About# 谷歌 4个月前06130
谷歌推出个性化AI协作工具NotebookLM:帮助用户更高效地进行信息整理和笔记记录 NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。它通过将AI与用户选择的具体... 工具# NotebookLM# 谷歌 5个月前03310
谷歌旗下的AI图像生成工具 Imagen 3 经过长时间的测试与改进,谷歌旗下的AI图像生成工具 Imagen 3 终于向大众开放。目前,它已在 Gemini、ImageFX 等多项谷歌产品中提供服务。Imagen 3 能够创造出细节丰富、光影效... 工具# Imagen 3# 谷歌 6个月前03990
谷歌旗下最新图像生成模型Imagen2,已在Bard和ImageFX上线 无论是制作音乐、获取编程帮助还是创建图像,像Lyria、Codey和Imagen这样的基于任务的AI模型正在帮助人们将创意变为现实。 自从去年推出以来,我们的Imagen技术已经帮助人们和企业仅使用几... 工具# Bard# ImageFX# Imagen2 6个月前03740
谷歌推出新型图像编辑工具Magic Insert:将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然 谷歌推出新型图像编辑工具Magic Insert,可以让我们像变魔术一样,将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然,就像它本... 新技术# Magic Insert# 图像编辑# 谷歌 8个月前05060
谷歌推出贪婪生长方法(Greedy Growing):用来训练大规模、高分辨率的基于像素的图像扩散模型 谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Growing)的方法来训练大规模、高分辨率的基于像素的图像扩散模型,且无需级联超分辨率组件。简单来说,就是科学家们找... 新技术# Greedy Growing# 谷歌# 贪婪生长 9个月前04220
谷歌推出CamViG:控制视频生成过程中的相机视角,从而生成具有精确相机运动的视频 Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于,它能够... 新技术# CamViG# 相机运动# 谷歌 9个月前04760
新型图像匹配技术OmniGlue:首个以泛化为核心设计原则的可学习图像匹配器 德克萨斯大学奥斯汀分校和谷歌的研究人员推出新型图像匹配技术OmniGlue,这是首个以泛化为核心设计原则的可学习图像匹配器。OmniGlue利用来自视觉基础模型的广泛知识来指导特征匹配过程,从而增强了... 新技术# OmniGlue# 谷歌 9个月前04830