百科 | 第169页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

Adobe推出新版Photoshop：引入全新 Firefly Image 3模型，“调整刷”与“字体浏览器”带来新体验

在昨天的Adobe Max大会上，Adobe带来了重磅更新：Photoshop迎来全新升级，并集成了图像生成模型Firefly Image 3。这一组合不仅为设计师和创意工作者带来了前所未有的AI图像...

2年前

06930

Adobe推出图像生成模型Firefly Image 3：逼真度、造型能力、细节和精确度方面均取得了显著进步

Adobe在昨天的Adobe Max大会上正式发布了图像生成模型Firefly Image 3。这款模型在逼真度、造型能力、细节和精确度方面均取得了显著进步，同时提供了更加丰富的多样性，为创意人士带来...

早报 # Adobe # Firefly Image 3

2年前

07650

多概念定制技术MultiBooth：根据用户的文本描述生成包含多个特定元素的图像

清华大学和Meta的研究人员推出新颖且高效的多概念定制技术MultiBooth，此技术用于从文本生成图像时实现多概念定制。简单来说，MultiBooth能够根据用户的文本描述生成包含多个特定元素的图像...

新技术 # MultiBooth # 多概念定制技术

2年前

07670

腾讯推出多模态基础模型SEED-X：结合视觉和语言理解的能力，可以处理和生成各种类型的数据，包括图像和文本

腾讯AI实验室和ARC实验室共同开发的多模态基础模型SEED-X，这是一个先进的人工智能系统，它结合了视觉和语言理解的能力，可以处理和生成各种类型的数据，包括图像和文本。简单来说，SEED-X就像一个...

新技术 # SEED-X # 多模态基础模型

2年前

05590

基于物理的交互式3D对象动态生成方法PhysDreamer：利用视频生成技术实现与3D物体进行物理交互

来自麻省理工学院、斯坦福大学、哥伦比亚大学和康奈尔大学的研究人员推出PhysDreamer系统，这是一个基于物理的交互式3D对象动态生成方法。PhysDreamer能够使静态的3D对象通过视频生成模...

新技术 # 3D对象 # PhysDreamer

2年前

04810

多模态大语言模型Groma：具备精细化和定位化的视觉感知能力

来自香港大学和字节跳动的研究人员推出多模态大语言模型Groma，它具备精细化和定位化的视觉感知能力。Groma不仅能够理解整个图像的内容，还能处理区域级别的任务，比如区域字幕（region capti...

新技术 # Groma # 多模态大语言模型

2年前

06490

微软亚洲研究院推出新框架VASA-1：基于一张静态图片和一个语音音频片段，实时生成逼真的会说话的面孔

微软亚洲研究院推出新框架VASA-1，它可以根据单张静态图像和语音音频片段，生成具有吸引力的视觉情感技能（VAS）的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...

新技术 # VASA-1

2年前

04800

AniClipart：根据文本提示将静态的剪贴画转换成动画

香港城市大学和莫纳什大学的研究人员推出AniClipart，它能够根据文本提示将静态的剪贴画（clipart）转换成动画。剪贴画是一种预先制作的图形艺术形式，通常用于快速增强视觉内容。传统的剪贴画动画...

新技术 # AniClipart

2年前

05880

动态排版Dynamic Typography：将文字通过动画效果生动呈现的技术

来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography（动态排版），它是一种将文字通过动画效果生动呈现的技术。简单来说，就是让文字动起来，通过变形和运动来表达文字的含义，从而...

新技术 # Dynamic Typography # 动态排版

2年前

06110

EdgeFusion：能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像

来自韩国Nota AI和三星电子的研究人员推出EdgeFusion，它能够在资源受限的移动设备上快速生成与文本描述相匹配的高质量图像。这项技术的核心是优化了文生图模型Stable Diffusion...

新技术 # EdgeFusion # LCM # 文生图模型

2年前

06610

3D重建模型MeshLRM：基于LRM的方法，能够从极少量的输入图像（仅需四张）快速重建出高质量的3D网格模型

来自加州大学圣地亚哥分校和Adobe的研究人员推出大型3D重建模型MeshLRM，这是一种新颖的基于LRM的方法，它能在不到一秒的时间内，能够从极少量的输入图像（仅需四张）快速重建出高质量的3D网...

新技术 # 3D重建模型 # MeshLRM

2年前

05660

Stable Diffusion 3 API正式发布，还计划在不久的将来通过会员资格提供模型

Stability AI宣布Stable Diffusion 3及其增强版Stable Diffusion 3 Turbo API已经正式在其开发者平台上线。根据Stability AI的声明，Sta...

早报 # Stable Diffusion 3 API

2年前

07760

加载更多

百科