PaliGemma 是谷歌推出的新一代视觉语言模型家族,其设计灵感来源于PaLI-3,能够接...
1周前 62

谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Grow...
3周前 74

Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根...
4周前 62

德克萨斯大学奥斯汀分校和谷歌的研究人员推出新型图像匹配技术OmniGlue,这是首个...
4周前 86

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords...
2024-05-12 116

谷歌推出基于问答的自动评估指标Gecko2K,用于评估文生图模型的性能。文生图模型生...
2024-04-27 72

来自特拉维夫大学和谷歌的研究团队推出图像逆向技术ReNoise,这是一种通过迭代噪...
2024-03-22 67

来自谷歌和特拉维夫大学的团队推出图像编辑技术Prompt-to-Prompt,这是一种直观的...
2024-03-17 100

谷歌推出创新框架VLOGGER,它能够根据一段音频和一张人物的单张照片生成这个人说...
2024-03-15 79

谷歌发布新型生成模型“多步一致性模型”(Multistep Consistency Models),它在图...
2024-03-12 71

谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用...
2024-02-22 97

来自谷歌的研究人员推出视频编码器VideoPrism,它是一个通用的视频理解模型,能够...
2024-02-21 136
没有账号?注册  忘记密码?