v0.app 正式上线:从创意到全栈应用,一个提示即可部署一个想法,如何最快变成一个真实可用的应用? 过去,这需要产品经理写文档、设计师画原型、工程师写前后端代码。而现在,只需一个自然语言提示,v0.app 就能自动生成完整的全栈应用程序——包括用户界面、内...早报# v0.app8个月前06040
Diffusion-4K:利用潜在扩散模型(如SD3、Flux)进行超高清(4K)图像生成北京航空航天大学和美团的研究人员推出 Diffusion-4K,即利用潜在扩散模型(Latent Diffusion Models)进行超高清(4K)图像合成。该研究的核心目标是直接生成高质量的4K图...新技术# Diffusion-4K# FLUX# SD31年前06040
FlashFace:允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片来自香港大学、阿里和蚂蚁的研究团队推出FlashFace,它允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片。 项目主页:https://jshilong.github.io/fla...新技术# FlashFace# 个性化2年前06040
AniClipart:根据文本提示将静态的剪贴画转换成动画香港城市大学和莫纳什大学的研究人员推出AniClipart,它能够根据文本提示将静态的剪贴画(clipart)转换成动画。剪贴画是一种预先制作的图形艺术形式,通常用于快速增强视觉内容。传统的剪贴画动画...新技术# AniClipart2年前06030
阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架阿里推出新型视频生成框架I4VGen,这是一个无需训练(training-free)且即插即用(plug-and-play)的视频扩散推理框架,它通过强化图像技术来提升文本到视频(text-to-vi...新技术# I4VGen# 视频生成框架2年前06020
Midjourney 推出全新外部图像编辑功能、图像重新纹理化以及下一代AI审查系统由前 Magic Leap 工程师 David Holz 创立的 AI 图像生成初创公司Midjourney,昨晚宣布了一项令人瞩目的新功能——AI 图像编辑。这项功能不仅让现有的2000多万用户感到...教程# Midjourney# 图像编辑1年前06010
LoRA:为解决大语言模型微调而开发微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于...新技术# Lora# 大语言模型# 微软2年前06010
Dipal D1:专为二次元爱好者打造的智能虚拟伴侣,“她”能看你能说还会撒娇你是否曾幻想过,有一个能听你说话、陪你聊天、懂你情绪的虚拟伴侣?现在,这个幻想正在变成现实。 Dipal推出的 Dipal D1,不仅是全球首款搭载曲面OLED屏幕的3D AI角色舱,更是一款集多模态...硬件# Dipal D1# 智能虚拟伴侣10个月前05990
Grok上线Grok Studio 功能:可编辑创建文档、代码、报告等今天(4月16日),Grok官方账号宣布推出了全新的Grok Studio功能,这是一款类似于OpenAI的Canvas工具,支持用户编辑和创建文档及基础应用程序。这一新功能为用户提供了更强大的创作能...早报# Grok# Grok Studio# xAI12个月前05990
大型重建模型Real3D:利用单视图真实世界图像进行3D重建德克萨斯大学奥斯汀分校的研究人员推出Real3D,它是首个能够使用单视图真实世界图像进行训练的大型重建模型(Large Reconstruction Model,简称LRM)。Real3D通过自训练框...新技术# 3D模型# Real3D2年前05990
小鹏科技推出通用视频编辑框架AiAS:将任何物体无缝插入到动态视频小鹏科技推出通用框架“Anything in Any Scene(AiAS)”,用于创建逼真视频模拟的方法,可以将任何物体无缝插入到现有的动态视频中。这种方法特别强调物理真实性,包括几何真实性、光照真...新技术# AiAS# 小鹏科技# 视频编辑2年前05990
新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...新技术# iCD# 蒸馏技术2年前05980