百科 | 第51页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

微软生成式AI模型WHAMM，让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》

微软昨天推出了一项令人瞩目的技术——WHAMM（World and Human Action MaskGIT Model），这是一个专门用于实时游戏的生成式AI模型。为了展示其强大功能，微软选择了28...

早报 # WHAMM # 微软 # 雷神之锤2

1年前

05030

Poe 推出新功能Poe Apps,用户可创建和共享自定义 AI 驱动的AI应用

Quora 旗下的 Poe 平台，作为汇集众多 AI 模型的中心枢纽，近日推出了一项新功能——Poe Apps。这项功能允许用户在任意模型组合的基础上构建可视化界面，从而创建自定义的应用程序。通过这一...

早报 # Poe # Poe Apps # Quora

1年前

05030

微软亚洲研究院推出新框架VASA-1：基于一张静态图片和一个语音音频片段，实时生成逼真的会说话的面孔

微软亚洲研究院推出新框架VASA-1，它可以根据单张静态图像和语音音频片段，生成具有吸引力的视觉情感技能（VAS）的虚拟角色栩栩如生的说话面孔。这个技术的核心在于它能够精确地捕捉到人脸的微妙动态和头部...

新技术 # VASA-1

2年前

05030

群核科技发布新一代空间大模型：SpatialLM 1.5 与 SpatialGen 正式亮相

在首届技术开放日（TechDay）上，群核科技正式推出空间大模型体系的两大核心更新——新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen，并明确了后续开源节奏。作为业界首个...

早报 # SpatialGen # SpatialLM 1.5 # 群核科技

8个月前

05000

为了AI的“福祉”？Anthropic 让 Claude 能主动结束有害对话

Anthropic宣布，其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力：在极端情况下，主动终止与用户的对话。这并非因为用户“说错话”，而是当对话持续涉及严重滥用内容——如...

早报 # Anthropic # Claude

8个月前

05000

谷歌自主编码智能体 Jules 正式开放公测：写代码也能“异步执行”

谷歌正式宣布其自主编码智能体 Jules 进入公开测试阶段，向全球支持 Gemini 模型的地区全面开放。与传统代码补全工具不同，Jules 不是辅助你写代码，而是代替你写代码。它是一个真正意义上的...

早报 # Jules # 编码智能体 # 谷歌

11个月前

04990

新型参考式人类图像补全框架CompleteMe：通过参考图像来补全被遮挡或缺失的人类图像区域，同时保留独特的细节信息

加州大学默塞德分校和Adobe Research的研究人员推出新型参考式人类图像补全框架CompleteMe，旨在通过参考图像来补全被遮挡或缺失的人类图像区域，同时保留独特的细节信息，如特定的服装图案...

新技术 # CompleteMe

11个月前

04990

Google Vids更新：AI化身功能正式上线，同步推出免费消费者版本

去年面向Google Workspace生产力套件推出的视频编辑器Google Vids，近日迎来重要更新：不仅新增AI化身、自动转录修剪、图像到视频等实用功能，还首次推出免费的消费者版本。此次调整既...

早报 # Google Vids # 视频编辑器 # 谷歌

8个月前

04980

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

在信息过载的时代，获取“更多”并不等于“更有效”。真正制约效率的，往往不是找不到某个具体答案，而是面对海量目标时的系统性整理能力——比如，为一个行业筛选出上百家公司数据，或从成千上万条招聘信息中精准匹...

新技术 # WideSearch # 字节跳动 # 智能体评估基准

8个月前

04980

帧感知视频扩散模型FVDM：时间步向量化方法，提高了视频生成任务的质量和灵活性

香港城市大学、大湾区大学、国防科技大学、香港中文大学和岭南大学的研究人员推出了一种新的视频扩散模型，称为帧感知视频扩散模型（Frame-Aware Video Diffusion Model，简称FV...

新技术 # FVDM # 帧感知视频扩散模型

2年前

04980

自适应投影引导APG：不牺牲图像质量的前提下，使用更高的指导尺度，从而生成更丰富、更真实的图像

苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导（APG），保留了CFG提高质量的优势，同时允许使用更高的引导比例而不产生过饱和。APG易于实现，并且实际上不会给采样过程带来额外的计算开销...

新技术 # APG # 自适应投影引导

2年前

04970

E2GAN：用于图像到图像翻译的高效训练和推理的生成对抗网络（GAN）模型

Snap和东北大学的研究人员推出E2GAN，这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络（GAN）模型。简单来说，E2GAN的目标是让计算机能够通过学习大量图像数据，快速生成或编辑出符合特...

新技术 # E2GAN # 生成对抗网络（GAN）模型

2年前

04970

加载更多

百科

微软生成式AI模型WHAMM，让你现在可以在浏览器中玩实时AI渲染的《雷神之锤2》

Poe 推出新功能Poe Apps,用户可创建和共享自定义 AI 驱动的AI应用

微软亚洲研究院推出新框架VASA-1：基于一张静态图片和一个语音音频片段，实时生成逼真的会说话的面孔

群核科技发布新一代空间大模型：SpatialLM 1.5 与 SpatialGen 正式亮相

为了AI的“福祉”？Anthropic 让 Claude 能主动结束有害对话

谷歌自主编码智能体 Jules 正式开放公测：写代码也能“异步执行”

新型参考式人类图像补全框架CompleteMe：通过参考图像来补全被遮挡或缺失的人类图像区域，同时保留独特的细节信息

Google Vids更新：AI化身功能正式上线，同步推出免费消费者版本

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

帧感知视频扩散模型FVDM：时间步向量化方法，提高了视频生成任务的质量和灵活性

自适应投影引导APG：不牺牲图像质量的前提下，使用更高的指导尺度，从而生成更丰富、更真实的图像

E2GAN：用于图像到图像翻译的高效训练和推理的生成对抗网络（GAN）模型

S.H.I.T

ljg-skills

同事.skill

Tripo

ITELLOU

BuildCores

百科

网址

S.H.I.T

ljg-skills

同事.skill

Tripo

ITELLOU

BuildCores