MineStudio:用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包北京大学和加州大学洛杉矶分校的研究人员推出MineStudio,这是一个用于简化《我的世界(Minecraft)》中AI代理开发的开源软件包。它通过整合七个关键工程组件(模拟器、数据、模型、离线预训练...新技术# MineStudio# 我的世界9个月前03830
韩国科学技术研究院推出专门针对文生图模型的新型数据投毒攻击方法Silent Branding Attack韩国科学技术研究院和DeepAuto.ai的研究人员推出一种新型数据投毒攻击方法Silent Branding Attack ,专门针对文生图模型。该方法能够在文生图模型中隐秘地嵌入特定品牌标志或符号...新技术# Silent Branding Attack# 文生图模型# 韩国科学技术研究院9个月前03820
新型文本到图像生成技术GrounDiT:利用DiT实现了无需训练的空间定位能力,实现更精细的用户控制韩国科学技术研究院推出新型文本到图像生成技术GrounDiT(GROUNDIT),它通过利用DiT实现了无需训练的空间定位能力,用于在文本到图像生成中实现更精细的用户控制。这项技术特别关注于在图像生成...新技术# GrounDiT# 文生图模型1年前03810
ReCapture:从单个用户视频生成具有新颖摄像机轨迹的新视频最近的视频建模技术取得了显著进展,使得在生成的视频中可以控制摄像机轨迹。然而,这些方法通常不能直接应用于用户提供的视频,因为这些视频不是由视频模型生成的。为了解决这一问题,谷歌和新加坡国立大学的研究人...新技术# ReCapture# 摄像机轨迹1年前03790
Golden Noise:将随机的高斯噪声转换成能够生成更高质量、与文本提示更匹配的图像的“黄金噪声”香港科技大学(广州)、穆罕默德·本·扎耶德人工智能大学和香港浸会大学的研究人员推出一种名为“Golden Noise for Diffusion Models”的学习框架,旨在提高文生图模型的性能。这...新技术# Golden Noise# 黄金噪声1年前03780
SAMPart3D:可扩展的零样本3D部件分割框架3D部件分割是3D感知中的一项关键任务,在机器人、3D生成和3D编辑等应用中发挥着重要作用。最近的方法利用强大的视觉语言模型(VLMs)进行2D到3D的知识蒸馏,实现了零样本的3D部件分割。然而,这些...新技术# 3D部件分割框架# SAMPart3D1年前03780
ITACLIP:通过图像、文本和架构增强提升无需训练的语义分割近年来,基础视觉语言模型(VLMs)的发展彻底改变了计算机视觉领域的研究方向。这些模型,尤其是 CLIP,不仅推动了开放词汇计算机视觉任务的研究,还在多个领域取得了显著成果。然而,尽管 VLMs 在开...新技术# ITACLIP# 语义分割1年前03770
Visual SKETCHPAD 框架:为多模态语言模型提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理华盛顿大学、艾伦人工智能研究所和宾夕法尼亚大学的研究人员推出Visual SKETCHPAD 框架,为多模态语言模型(LMs)提供一个可视化的“草图板”,使其能够在解决问题时生成中间草图并进行推理。这...新技术# Visual SKETCHPAD# 多模态语言模型# 草图板8个月前03760
OpenAI调整路线图:推迟GPT-5,推出o3和o4-miniOpenAI在AI模型开发领域的每一步都备受关注。今年2月,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)曾透露了其AI模型的未来路线图,引发了广泛讨论。然而,最近萨姆·奥尔特曼宣布了计...早报# GPT-4.5# o3# o4-mini9个月前03750
华为仓颉智能体开发框架Cangjie Magic正式开源3月14日,华为仓颉社区正式发布了 Cangjie Magic,一款基于仓颉编程语言原生构建的 LLM(大语言模型)智能体(Agent)开发框架。这一框架通过三大核心技术突破,重新定义了智能体开发的范...早报# Cangjie Magic# 仓颉智能体# 华为9个月前03750
字节跳动推出人像动画技术X-Portrait 2:创建富有表现力和逼真的角色动画和视频素材人像动画技术提供了一种超低成本且高效的方式,用于创建富有表现力和逼真的角色动画和视频素材。用户只需提供一个静态人像图像和一个驱动表演视频,模型就可以使用这些输入生成视频,通过将驱动表情转移到人像中的主...新技术# X-Portrait 2# 人像动画# 字节跳动1年前03750
Pony系列模型V7版本,将带来诸多令人期待的改进和新功能Pony系列模型一直以来都是基于SDXL微调的热门绘画模型,尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今,V7版本的消息传来,带来了诸多令人期待的改进和新...早报# Pony9个月前03740