百科 | 第68页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

Chipmunk：无需训练的动态稀疏性加速DiT模型的推理过程

扩散模型（Diffusion Models）近年来在图像生成和视频生成领域表现出色，但其计算复杂度也成为了性能瓶颈。特别是基于DiT架构的模型，如FLUX、HunyuanVideo 等，其注意力层和多...

8个月前

03230

新型图像编辑框架PixelMan：基于扩散模型，通过像素操作和生成来实现一致性的对象编辑

阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型图像编辑框架PixelMan，它基于扩散模型（Diffusion Models, DMs），通过像素操作和生成来实...

新技术 # PixelMan # 图像编辑

1年前

03230

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

文本到图像（T2I）生成任务的目标是从文本提示生成逼真的图像。尽管扩散模型在这一领域取得了显著进展，但现有方法在处理复杂的多步推理和组合性提示时仍面临挑战。特别是，当文本提示包含多个对象及其属性之间的...

新技术 # GraPE # 文生图

1年前

03230

无需训练的视频细化框架VideoRepair：自动识别和修复文生视频模型生成中的细粒度不对齐问题

最近的文生视频模型在生成高质量视频方面取得了显著进展，但这些模型生成的视频往往与文本提示存在不对齐的情况，尤其是在处理包含多个对象和属性的复杂场景时。为了解决这一问题，北卡罗来纳大学教堂山分校的研究人...

新技术 # VideoRepair # 视频生成模型

1年前

03230

新型视觉生成模型RAR：在通过自回归建模提高图像生成任务的性能，同时保持与语言模型框架的完全兼容性

字节跳动推出一种新型视觉生成模型——随机自回归视觉生成（Randomized AutoRegressive Visual Generation，简称RAR）。该模型旨在通过自回归建模提高图像生成任务的...

新技术 # RAR模型 # 随机自回归视觉生成

1年前

03230

谷歌自主编码智能体 Jules 正式开放公测：写代码也能“异步执行”

谷歌正式宣布其自主编码智能体 Jules 进入公开测试阶段，向全球支持 Gemini 模型的地区全面开放。与传统代码补全工具不同，Jules 不是辅助你写代码，而是代替你写代码。它是一个真正意义上的...

早报 # Jules # 编码智能体 # 谷歌

7个月前

03220

Meta强化AI年龄检测，Instagram青少年保护再升级

Meta正在加大其在Instagram上使用AI检测青少年用户的方式，甚至会覆盖账户设置。这一举措旨在更好地保护青少年用户，确保他们在平台上的安全和隐私。早在2024年，Instagram就宣布引入...

早报 # Instagram # Meta

8个月前

03220

AMD CEO 苏姿丰加入穆罕默德·本·扎耶德人工智能大学董事会

穆罕默德·本·扎耶德人工智能大学（MBZUAI）近日宣布重组其董事会，任命了一批新成员，其中包括 AMD 首席执行官苏姿丰。这一举措不仅标志着该大学与阿联酋经济和技术发展的深度融合，也进一步加强了其在...

早报 # AMD # MBZUAI # 穆罕默德·本·扎耶德人工智能大学

10个月前

03220

新型文本到图像生成系统NIRVANA：利用近似缓存技术，高效地服务基于扩散模型的文本到图像生成任务

Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到图像生成系统，它利用了一种称为近似缓存（Approximate Caching）的技术，旨在高效地服务基于扩散...

新技术 # NIRVANA # 文生图

1年前

03220

数据增强方法MaskRIS：用于改进指代表像分割任务的性能

延世大学、NAVER AI LAB和韩国科学技术研究院的研究人员推出一种新的数据增强方法，名为MaskRIS（Masked Referring Image Segmentation），它用于改进指代表...

新技术 # MaskRIS

1年前

03220

KREA AI 推出实时视频生成模型：让 AI 视频像绘画一样自然

KREA AI 宣布开启其首个实时视频生成模型的测试通道。该模型支持 12+ fps 的生成速度，快于常规播放速度，能够在用户调整输入时提供即时反馈，同时保持帧间运动、身份与风格的高度一致性。这意味...

早报 # Krea AI # 实时视频生成模型

4个月前

03210

英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

英伟达（NVIDIA）宣布与 OpenAI 深度合作，将后者最新发布的开放权重模型 gpt-oss-20b 和 gpt-oss-120b 带入消费级与专业级设备端，依托 GeForce RTX 与 R...

早报 # gpt-oss # OpenAI # 英伟达

5个月前

03210

加载更多

百科

Chipmunk：无需训练的动态稀疏性加速DiT模型的推理过程

新型图像编辑框架PixelMan：基于扩散模型，通过像素操作和生成来实现一致性的对象编辑

用于组合式文生图新框架GraPE：将复杂的多步生成任务分解为三个独立的步骤

无需训练的视频细化框架VideoRepair：自动识别和修复文生视频模型生成中的细粒度不对齐问题

新型视觉生成模型RAR：在通过自回归建模提高图像生成任务的性能，同时保持与语言模型框架的完全兼容性

谷歌自主编码智能体 Jules 正式开放公测：写代码也能“异步执行”

Meta强化AI年龄检测，Instagram青少年保护再升级

AMD CEO 苏姿丰加入穆罕默德·本·扎耶德人工智能大学董事会

新型文本到图像生成系统NIRVANA：利用近似缓存技术，高效地服务基于扩散模型的文本到图像生成任务

数据增强方法MaskRIS：用于改进指代表像分割任务的性能

KREA AI 推出实时视频生成模型：让 AI 视频像绘画一样自然

英伟达 RTX显卡实现 OpenAI 最新开源模型 gpt-oss最快推理速度

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

ITELLOU

Google AI Studio

百科

网址

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

ITELLOU

Google AI Studio