CFG-Zero*:用于提升基于流匹配模型的图像和视频生成效果南洋理工大学和普渡大学的研究人员推出 CFG-Zero*,即一种改进的分类器自由引导(CFG)方法,专门用于提升基于流匹配(Flow Matching)模型(如SD3模型)的图像和视频生成效果。流匹配...新技术# CFG-Zero*# CFG-Zero⋆# 分类器自由引导9个月前03890
Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...新技术# IMM# Luma AI# 图像生成模型9个月前03890
micro_diffusion :一种低成本训练文生图模型的方法索尼 AI和加州大学河滨分校的研究人员推出了一种低成本训练大规模文本到图像(Text-to-Image, T2I)扩散模型的方法micro_diffusion 。该方法通过创新的“延迟掩码”(defe...新技术# micro_diffusion# 文生图模型11个月前03890
Anthropic CEO:2027 年前打开 AI 模型的“黑箱”,推动行业安全与可解释性发展Anthropic 首席执行官达里奥·阿莫迪(Dario Amodei)周四发表了一篇文章,强调了当前对世界领先 AI 模型内部运作方式理解的局限性,并为 Anthropic 设定了一个雄心勃勃的目标...早报# Anthropic# Dario Amodei# 达里奥·阿莫迪8个月前03880
美国国家科学基金会与英伟达联手,斥资 1.5 亿美元推动全开源 AI 模型,加速美国科学创新美国国家科学基金会(NSF)与英伟达(NVIDIA)近日宣布达成一项重要合作,共同投资 1.52 亿美元,支持由 Allen 人工智能研究所(Ai2) 牵头的“开放多模态 AI 基础设施加速科学”(O...早报# Ai2# 美国国家科学基金会# 艾伦AI研究所4个月前03860
高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(MobileVD),该模型的目标是在保持生成视频的质量和控制力的同时,显著降低计算需求,使得在移动设备...新技术# MobileVD# 视频生成模型1年前03860
Meta推出创新方案AdaCache(自适应缓存):不进行额外训练的情况下加速视频生成视频生成是AI研究的一个热点领域,特别是在生成时间上一致、高保真的视频方面。这一领域涉及创建在帧之间保持视觉连贯性并在时间上保留细节的视频序列。近年来,机器学习模型,尤其是扩散变换器(DiTs),已成...新技术# AdaCache# Meta AI# 自适应缓存1年前03860
新型视频生成模型家族MarDini:通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法Meta AI与阿卜杜拉国王科技大学的研究人员推出了一种新型视频生成模型家族——MarDini。这一模型家族通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法。Mar...新技术# MarDini# 视频生成模型1年前03860
NotebookLM 新功能:自定义音频概述长度,满足多样化收听需求谷歌正在为 NotebookLM 开发一项新功能,允许用户自定义音频概述的长度。这一更新将为用户提供更大的灵活性,使其能够根据不同的使用场景调整音频内容的深度和时长。结合 NotebookLM 的现有...早报# NotebookLM8个月前03850
Opera 推出 AI 浏览器操作员(Browser Operator),助力高效浏览体验Opera推出了一项创新功能——AI 浏览器操作员(Browser Operator)。这款原生 AI 代理通过将 AI 技术直接集成到浏览器中,帮助用户更高效地完成各种在线任务,例如购物、预订航班或...早报# Browser Operator# Opera# 浏览器操作员10个月前03850
GS^3:从多视角点光源输入图像中实时合成高质量的新光照和视图浙江大学CAD与CG国家重点实验室推出一种新技术,用于从多视角点光源输入图像中实时合成高质量的新光照和视图。他们的方法称为 GS^3,使用基于空间和角度的高斯表示,并结合三重 splatting 过程...新技术# GS^3# 多视角点光源1年前03850
xAI 的 Grok 聊天机器人升级:开启视觉功能,拓展交互体验xAI 的 Grok 聊天机器人近日迎来了重大更新,新增的 Grok Vision 功能让机器人能够“看到”并理解用户智能手机摄像头所捕捉到的内容,进一步拓展了其交互能力。 Grok Vision:视...早报# Grok# Grok Vision# xAI8个月前03840