百科 | 第150页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型视频生成技术Dr. Mo：提高视频生成的效率，同时保持或提升视频质量

新型视频生成技术Dr. Mo（Diffusion Reuse MOtion），这项技术的核心在于提高视频生成的效率，同时保持或提升视频质量。研究团队的关键发现是，在早期去噪步骤中的粗粒度噪声在连续视频...

新技术 # Dr. Mo # 视频生成

1年前

04470

基于参考的线条艺术视频上色的视频扩散框架LVCD：用于根据参考图像和线稿序列为动画视频着色

香港城市大学和腾讯的研究人员推出基于参考的线条艺术视频上色的视频扩散框架LVCD，用于根据参考图像和线稿序列为动画视频着色。这种方法能够生成长时间一致的、高质量的动画视频。LVCD在保持长时间一致性和...

新技术 # LVCD # 视频上色

1年前

04640

多模态大语言模型Oryx：专门设计用于理解和处理视觉数据，如图像、视频和3D场景

清华大学、腾讯和南洋理工大学 S-Lab的研究人员推出多模态大语言模型Oryx，它专门设计用于理解和处理视觉数据，如图像、视频和3D场景。Oryx模型的特点是能够根据需要处理任意空间大小和时间长度的视...

新技术 # Oryx # 多模态大语言模型

1年前

06030

新型图像到视频生成技术OSV：可以将单张图像仅仅一步内生成高质量视频

复旦大学、香港科技大学、香港中文大学和腾讯优图实验室的研究人员推出新型图像到视频生成技术OSV，可以将单张图像转换成视频。这项技术的目标是能够快速生成高质量的视频内容，而不需要复杂的多步骤处理。例如...

新技术 # OSV

1年前

04380

新型高品质文本音频生成器EzAudio：将文本描述转换成相应的音频内容

约翰·霍普金斯大学和腾讯人工智能实验室的研究人员推出一种新型的文本到音频（Text-to-Audio，简称T2A）生成技术EzAudio，这项技术的目标是将文本描述转换成相应的音频内容，比如将“一只狗...

新技术 # EzAudio # 文本音频生成器

1年前

06030

diffusion-e2e-ft：通过微调图像条件扩散模型来简化和提高单目深度估计的效率

亚琛工业大学和埃因霍温理工大学的研究人员推出diffusion-e2e-ft，通过微调图像条件扩散模型来简化和提高单目深度估计的效率。单目深度估计是指仅使用一张图片来预测场景中每个像素的深度信息。这项...

新技术 # diffusion-e2e-ft # 单目深度估计

1年前

05830

北京人工智能研究院推出新型图像生成模型OmniGen

北京人工智能研究院推出新型图像生成模型OmniGen，与流行的扩散模型（例如，Stable Diffusion）不同，OmniGen不再需要额外的模块，如ControlNet或IP-Adapter来处...

新技术 # OmniGen # 图像生成模型

1年前

04460

Jina AI推出新型文本嵌入模型 jina-embeddings-v3：专为多语言数据和长文本检索任务优化

Jina AI推出文本嵌入模型 jina-embeddings-v3，这是一个具有 5.7 亿参数的新型文本嵌入模型，它在多语言数据和长上下文检索任务上实现了最先进的性能，支持的最大上下文长度达到 8...

新技术 # jina-embeddings-v3 # 文本嵌入模型

1年前

04420

音乐生成系统Seed-Music：能够创作出高质量的音乐，并且可以根据用户的细致要求来调整音乐的风格和内容

字节跳动旗下豆包团队推出音乐生成系统Seed-Music，能够创作出高质量的音乐，并且可以根据用户的细致要求来调整音乐的风格和内容。Seed-Music结合了自回归语言建模和扩散方法，支持两种关键的音...

新技术 # Seed-Music # 音乐生成

1年前

04600

图像编辑方法Click2Mask：通过简单的点击来实现对图片的局部编辑，而不需要复杂的遮罩或详细的描述

耶路撒冷希伯来大学的研究人员推出图像编辑方法Click2Mask，它能够让用户通过简单的点击来实现对图片的局部编辑，而不需要复杂的遮罩或详细的描述。总的来说，Click2Mask提供了一种直观且高效的...

新技术 # Click2Mask # 图像编辑

1年前

04540

DrawingSpinUp：将单一的平面角色绘画转换成三维动画，同时保留了原始艺术作品的风格和特征

香港城市大学的研究人员推出创新系统DrawingSpinUp，它能够将单一的平面角色绘画转换成三维动画，同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命，让它动起来，比如让一个纸上的...

新技术 # DrawingSpinUp

1年前

04250

图像编辑框架InstantDrag：通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速

首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag，它能够让用户通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速。例如，你有一张图片，你想要移动图片中的某个部...

新技术 # InstantDrag # 图像编辑

1年前

04450

加载更多

百科