图像复制检测模型ICDiff:解决扩散模型生成图像的版权和原创性问题悉尼科技大学、百度和浙江大学的研究人员推出图像复制检测模型ICDiff,这是第一个专门针对扩散模型的ICD(图像复制检测)。为此,研究人员构建了一个扩散-复制(D-Rep)数据集,并相应地提出了一种新...新技术# ICDiff# PDF-Embedding# 图像复制检测1年前05800
长视频生成新方法PA-VDM:现有的模型可以自然地扩展为自回归视频扩散模型,而无需改变架构石溪大学和Adobe 研究中心的研究人员推出长视频生成新方法PA-VDM,它能够生成高质量的长视频。在解释这个主题时,我们可以把它想象成一个能够将静态图片或简短视频变成长篇电影的魔法盒子。 项目主...新技术# PA-VDM# 长视频生成1年前05790
Claude 现可直接生成和编辑文件:Excel、PPT、PDF 全支持Anthropic 正式推出 Claude 文件创建与编辑功能,标志着其从“对话助手”向“生产力协作者”的关键跃迁。 现在,你不再需要让 Claude 只输出文本建议,而是可以直接对它说: “根据这份...早报# Claude3个月前05770
多模态问答系统Lumos:结合场景文本识别和多模态大语言模型来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...新技术# Lumos# 场景文本识别# 多模态大语言模型2年前05770
FlexiDreamer:从单张图片生成三维(3D)模型来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer,它能够从单张图片生成三维(3D)模型。 项目主页 GitHub 例如,你有一张你喜欢的动漫角色的照片,F...新技术# 3D生成模型# FlexiDreamer2年前05760
阿里发布 Wan2.2-I2V-Flash:更快、更稳、更可控的图生视频模型阿里通义大模型团队宣布,Wan2.2-I2V-Flash 正式上线。这款轻量级图生视频(Image-to-Video)模型,在保持高画质与强控制力的同时,实现了生成速度与性价比的显著跃升。 它不是对前...早报# Wan2.2-I2V-Flash4个月前05740
diffusion-e2e-ft:通过微调图像条件扩散模型来简化和提高单目深度估计的效率亚琛工业大学和埃因霍温理工大学的研究人员推出diffusion-e2e-ft,通过微调图像条件扩散模型来简化和提高单目深度估计的效率。单目深度估计是指仅使用一张图片来预测场景中每个像素的深度信息。这项...新技术# diffusion-e2e-ft# 单目深度估计1年前05740
统一Transformer模型Show-o:同时处理多模态理解(如图像和文本)和生成任务新加坡国立大学和字节跳动的研究人员推出一种统一的Transformer模型Show-o,,它统一了多模态的理解和生成。不同于完全自回归模型,Show-o结合了自回归和(离散)扩散建模,以自适应地处理各...新技术# Show-o# Transformer模型1年前05740
IPAdapter-Instruct:在处理基于图像的条件化时,能够更精确地理解用户的意图Unity推出IPAdapter-Instruct,它是一种用于图像生成的新技术,特别是在处理基于图像的条件化时,能够更精确地理解用户的意图。简单来说,这个模型可以让用户通过添加指令性提示(Instr...新技术# IPAdapter-Instruct1年前05740
英伟达推出LATTE3D:快速生成3D模型英伟达推出新型大规模文本到3D合成系统LATTE3D,LATTE3D的关键在于构建可扩展的架构,并利用3D数据在优化过程中引入3D感知扩散先验、形状正则化和模型初始化,以确保对不同和复杂的训练提示具有...新技术# 3D模型# LATTE3D2年前05740
新型视频扩散模型StreamV2V:实现实时的视频到视频转换德克萨斯大学奥斯汀分校和加州大学伯克利分校的研究人员推出新型视频扩散模型StreamV2V,它能够实现实时的视频到视频(Video-to-Video,简称V2V)翻译。这项技术允许用户通过提示(pro...新技术# StreamV2V# 视频扩散模型2年前05730
CameraCtrl:为文生视频模型提供精确的摄像机控制能力来自香港中文大学、上海人工智能实验室和斯坦福大学的研究人员推出CameraCtrl,它能够为文本到视频(Text-to-Video, T2V)生成模型提供精确的摄像机控制能力。在视频创作中,摄像机的移...新技术# CameraCtrl# 文生视频模型2年前05730