苹果推出新预训练方法CLOC:提升图像和文本表示的预训练效果,特别是在局部区域的语义理解方面苹果推出新预训练方法CLOC(对比定位语言-图像预训练),旨在提升图像和文本表示的预训练效果,特别是在局部区域的语义理解方面。CLOC模型可以生成高分辨率、细节丰富的深度图,这些深度图不仅包含整体图像...新技术# CLOC# 对比定位语言-图像预训练# 苹果2年前05230
新型视频扩展方法Follow-Your-Canvas:能够将现有视频的内容扩展到更高的分辨率,并在扩展区域生成丰富的新内容腾讯混元、香港科技大学、中国科学技术大学和清华大学的研究人员推出新型视频扩展方法Follow-Your-Canvas,它能够将现有视频的内容扩展到更高的分辨率,并在扩展区域生成丰富的新内容。这种方法特...新技术# Follow-Your-Canvas# 视频扩展2年前05230
图像生成评估基准DREAMBENCH++:与人类偏好对齐的自动化评估系统,专门用于个性化图像生成清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++,它是一个与人类偏好对齐的自动化评估系统,专门用于个性化图像生成。简单来说...新技术# DREAMBENCH++# 图像生成评估基准2年前05230
新型图像编辑工具StyleFeatureEditor:结合了AI的最新进展,使用户能够以前所未有的细节级别和灵活性来编辑图像俄罗斯高等经济大学、AIRI和德国不来梅建筑大学的研究人员推出新型图像编辑工具StyleFeatureEditor,它是基于一种名为StyleGAN的生成对抗网络(GAN)的。StyleGAN是一种特...新技术# StyleFeatureEditor# 图像编辑2年前05230
Bolt与 AnimaApp 合作:将 Figma 设计无缝转化为像素级完美的全栈应用程序Bolt 推出了一项强大的新功能,通过与 AnimaApp 合作,将 Figma 设计无缝转化为像素级完美的全栈应用程序。这一创新工具让设计师无需编写代码,即可将创意快速转化为真实、可运行的应用程序...早报# Bolt# Figma1年前05220
非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频中国科学技术大学和科大讯飞研究院的研究人员推出新框架DAWN,它能够根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频。这项技术的核心在于使用非自回归(NAR)扩散模型来一次性生成动态长度的...新技术# DAWN# 头部动画1年前05200
新型高分辨率图像到3D生成框架Hi3D:将单张2D图片转换成具有高分辨率纹理细节的3D模型复旦大学计算机学院、新加坡管理大学和智象未来的研究人员推出新型高分辨率图像到3D生成框架Hi3D,Hi3D 的目标是将单张2D图片转换成具有高分辨率纹理细节的3D模型。这就像给一个平面的照片施魔法,让...新技术# 3D# 3D模型# Hi3D2年前05190
CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导1年前05180
用于长视频生成的双速学习系统SLOWFAST-VGEN:模仿了人类大脑中慢速学习和快速学习相结合的互补学习系统人类拥有一个独特的学习系统,它既能从普遍的世界规律中缓慢学习,也能迅速地将新的经历转化为情景记忆。这种能力使我们在面对新情况时能灵活应对,同时保持对已知世界的深刻理解。然而,现有的视频生成技术大多聚焦...新技术# SLOWFAST-VGEN# 长视频生成1年前05180
3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG,它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实(VR)和增强现实(AR)领域尤为重要,因为它可以提供...新技术# 3D立体视频# SVG2年前05170
Anthropic 推出新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4今天,Anthropic 宣布推出下一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准,为开发者和...早报# Claude# Claude Code# Claude Opus 411个月前05160
新型个性化图像生成方法Infinite-ID:保持特定身份特征的同时,根据用户的文本描述生成高质量的图像来自中国科学技术大学和悉尼大学的研究人员推出新型个性化图像生成方法Infinite-ID,它能够在保持特定身份特征的同时,根据用户的文本描述生成高质量的图像。这是一个全新的ID-语义解耦范式,专门用于...新技术# Infinite-ID# 个性化图像生成2年前05160