百科

清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10,目标检测是计算机视觉...
9小时前 10

Google Research推出CamViG(Camera Aware Image-to-Video Generation),它能够根...
2天前 20

北京大学深圳研究生院 、ARC实验室,腾讯 PCG和东京大学的研究人员推出新型视频编...
2天前 30

来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图...
2天前 22

来自苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出新型自编码器LiteVAE,它...
2天前 20

索尼推出新型音频-视觉生成模型Visual Echoes,这个模型能够根据一张图片生成与之...
2天前 20

来自北京大学、快手、电子科技大学和浙江大学的研究人员推出新型图像生成技术Recti...
2天前 12

Google Deepmind推出新型图像生成模型Semantica,Semantica的核心特点是它能够在不...
2天前 20

ComfyUI

Stability AI在经历了人员变动后,其最新基于MMDiT架构的Stable Diffusion 3是否开...
2024-04-22 458

模型

推荐SD的模型

Stable Diffusion Community是一个非官方、非盈利性质的组织,它们主要目标是尽可...
9小时前 8

ormbg是一个基于基于高度准确的二分类图像分割(DIS)的全新开源背景移除模型,它...
3天前 28

字节跳动在推出文生图模型SDXL-Lightning后,又推出了新的蒸馏模型Hyper-SD,它有...
2024-04-23 348

Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成...
2024-04-21 238

工具

作为一家AI 音乐初创企业Suno,去年就已经推出开源语音生成模型「Bark」引发热议,...
3周前 158

在《打造本地专属GPT!使用这些软件轻松运行开源大语言模型》这篇文章里,已经向大...
3周前 304

以其旗舰产品Photoshop闻名全球的Adobe,其实拥有一系列覆盖图像、视频、音频处理...
3周前 144

字节跳动推出的图像和视频生成框架StoryDiffusion,它能够生成一系列内容一致的图...
3周前 412

AI合集

在目前大语言模型方面最强的要数ChatGPT、Claude和Gemini,这些都是闭源模型,而且...
3周前 156

 

没有账号?注册  忘记密码?