小马良 - SD百科 - 第65页

新型视频重建模型Vidu4D：能够从单个生成的视频创建高保真的4D重建

新型视频重建模型Vidu4D：能够从单个生成的视频创建高保真的4D重建

清华大学、生数科技和同济大学的研究人员推出新型视频重建模型Vidu4D，它能够从单...

2024-05-28 270

新颖HDR视图合成技术HDR-GS：高效地生成新的HDR视角图像，并依据用户指定的曝光时间重建LDR图像

新颖HDR视图合成技术HDR-GS：高效地生成新的HDR视角图像，并依据用户指定的曝光时间重建LDR图像

约翰·霍普金斯大学、香港科技大学（广州）、清华大学和上海交通大学的研究人员推出...

2024-05-27 274

阿里推出新型大型多模态模型ConvLLaVA：专门设计用于处理高分辨率的视觉数据

阿里推出新型大型多模态模型ConvLLaVA：专门设计用于处理高分辨率的视觉数据

清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA，它专门设计用于处...

2024-05-27 412

SDXL系列新模型SDXL Flash：高速且保证质量的SDXL模型

SDXL系列新模型SDXL Flash：高速且保证质量的SDXL模型

Stable Diffusion Community是一个非官方、非盈利性质的组织，它们主要目标是尽可...

2024-05-26 656

新型实时端到端目标检测系统YOLOv10：快速地识别图像中的多个对象，并且告诉用户这些对象的具体位置

新型实时端到端目标检测系统YOLOv10：快速地识别图像中的多个对象，并且告诉用户这些对象的具体位置

清华大学的研究人员推出新型实时端到端目标检测系统YOLOv10，目标检测是计算机视觉...

2024-05-26 592

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

Google Research推出CamViG（Camera Aware Image-to-Video Generation），它能够根...

2024-05-25 400

新型视频编辑技术ReVideo：在视频中对特定区域进行精确的内容和运动控制编辑

新型视频编辑技术ReVideo：在视频中对特定区域进行精确的内容和运动控制编辑

北京大学深圳研究生院、ARC实验室，腾讯 PCG和东京大学的研究人员推出新型视频编...

2024-05-25 530

新型图像生成模型Diffusion Mamba（DiM）：通过结合Mamba序列模型的效率和扩散模型的表现力，来高效生成高分辨率的图像

新型图像生成模型Diffusion Mamba（DiM）：通过结合Mamba序列模型的效率和扩散模型的表现力，来高效生成高分辨率的图像

来自香港大学、华为诺亚方舟实验室、清华大学和上海交通大学的研究人员推出新型图...

2024-05-25 556

新型自编码器LiteVAE：用于提高图像生成模型中的效率和性能

新型自编码器LiteVAE：用于提高图像生成模型中的效率和性能

来自苏黎世联邦理工学院和迪士尼研究工作室的研究人员推出新型自编码器LiteVAE，它...

2024-05-25 482

索尼推出音频-视觉生成模型Visual Echoes：根据一张图片生成与之相对应的音频，或者反过来，根据一段音频生成匹配的图片

索尼推出音频-视觉生成模型Visual Echoes：根据一张图片生成与之相对应的音频，或者反过来，根据一段音频生成匹配的图片

索尼推出新型音频-视觉生成模型Visual Echoes，这个模型能够根据一张图片生成与之...

2024-05-24 524

无需训练的个性化定制RectifID：根据用户提供的参考图像定制化地生成新图像，同时保留原始图像中的身份特征

无需训练的个性化定制RectifID：根据用户提供的参考图像定制化地生成新图像，同时保留原始图像中的身份特征

来自北京大学、快手、电子科技大学和浙江大学的研究人员推出新型图像生成技术Recti...

2024-05-24 250

基于图像条件的扩散模型Semantica：根据给定的条件图像（即输入图像）的语义信息生成新的图像

基于图像条件的扩散模型Semantica：根据给定的条件图像（即输入图像）的语义信息生成新的图像

Google Deepmind推出新型图像生成模型Semantica，Semantica的核心特点是它能够在不...

2024-05-24 372

升级VIP
全屏浏览
夜间模式
返回顶部