PaliGemma 是谷歌推出的新一代视觉语言模型家族,其设计灵感来源于PaLI-3,能够接...
2024-06-10 184

谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Grow...
2024-05-28 150

Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根...
2024-05-25 114

德克萨斯大学奥斯汀分校和谷歌的研究人员推出新型图像匹配技术OmniGlue,这是首个...
2024-05-22 150

Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords...
2024-05-12 158

谷歌推出基于问答的自动评估指标Gecko2K,用于评估文生图模型的性能。文生图模型生...
2024-04-27 102

来自特拉维夫大学和谷歌的研究团队推出图像逆向技术ReNoise,这是一种通过迭代噪...
2024-03-22 95

来自谷歌和特拉维夫大学的团队推出图像编辑技术Prompt-to-Prompt,这是一种直观的...
2024-03-17 136

谷歌推出创新框架VLOGGER,它能够根据一段音频和一张人物的单张照片生成这个人说...
2024-03-15 107

谷歌发布新型生成模型“多步一致性模型”(Multistep Consistency Models),它在图...
2024-03-12 119

谷歌推出开源模型Gemma,这是一款轻量级、先进的开源模型,供开发者和研究人员用...
2024-02-22 159
没有账号?注册  忘记密码?