百科 | 第48页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

苹果推出新预训练方法CLOC：提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面

苹果推出新预训练方法CLOC（对比定位语言-图像预训练），旨在提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面。CLOC模型可以生成高分辨率、细节丰富的深度图，这些深度图不仅包含整体图像...

2年前

05230

新型视频扩展方法Follow-Your-Canvas：能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容

腾讯混元、香港科技大学、中国科学技术大学和清华大学的研究人员推出新型视频扩展方法Follow-Your-Canvas，它能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容。这种方法特...

新技术 # Follow-Your-Canvas # 视频扩展

2年前

05230

图像生成评估基准DREAMBENCH++：与人类偏好对齐的自动化评估系统，专门用于个性化图像生成

清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++，它是一个与人类偏好对齐的自动化评估系统，专门用于个性化图像生成。简单来说...

新技术 # DREAMBENCH++# 图像生成评估基准

2年前

05230

新型图像编辑工具StyleFeatureEditor：结合了AI的最新进展，使用户能够以前所未有的细节级别和灵活性来编辑图像

俄罗斯高等经济大学、AIRI和德国不来梅建筑大学的研究人员推出新型图像编辑工具StyleFeatureEditor，它是基于一种名为StyleGAN的生成对抗网络（GAN）的。StyleGAN是一种特...

新技术 # StyleFeatureEditor # 图像编辑

2年前

05230

Bolt与 AnimaApp 合作：将 Figma 设计无缝转化为像素级完美的全栈应用程序

Bolt 推出了一项强大的新功能，通过与 AnimaApp 合作，将 Figma 设计无缝转化为像素级完美的全栈应用程序。这一创新工具让设计师无需编写代码，即可将创意快速转化为真实、可运行的应用程序...

早报 # Bolt # Figma

1年前

05220

非自回归扩散框架的动态帧化身DAWN：根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

中国科学技术大学和科大讯飞研究院的研究人员推出新框架DAWN，它能够根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频。这项技术的核心在于使用非自回归（NAR）扩散模型来一次性生成动态长度的...

新技术 # DAWN # 头部动画

1年前

05200

新型高分辨率图像到3D生成框架Hi3D：将单张2D图片转换成具有高分辨率纹理细节的3D模型

复旦大学计算机学院、新加坡管理大学和智象未来的研究人员推出新型高分辨率图像到3D生成框架Hi3D，Hi3D 的目标是将单张2D图片转换成具有高分辨率纹理细节的3D模型。这就像给一个平面的照片施魔法，让...

新技术 # 3D # 3D模型 # Hi3D

2年前

05190

CFG-Zero*：用于提升基于流匹配模型的图像和视频生成效果

南洋理工大学和普渡大学的研究人员推出 CFG-Zero*，即一种改进的分类器自由引导（CFG）方法，专门用于提升基于流匹配（Flow Matching）模型（如SD3模型）的图像和视频生成效果。流匹配...

新技术 # CFG-Zero*# CFG-Zero⋆# 分类器自由引导

1年前

05180

用于长视频生成的双速学习系统SLOWFAST-VGEN：模仿了人类大脑中慢速学习和快速学习相结合的互补学习系统

人类拥有一个独特的学习系统，它既能从普遍的世界规律中缓慢学习，也能迅速地将新的经历转化为情景记忆。这种能力使我们在面对新情况时能灵活应对，同时保持对已知世界的深刻理解。然而，现有的视频生成技术大多聚焦...

新技术 # SLOWFAST-VGEN # 长视频生成

1年前

05180

3D立体视频生成新方法SVG：利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG，它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实（VR）和增强现实（AR）领域尤为重要，因为它可以提供...

新技术 # 3D立体视频 # SVG

2年前

05170

Anthropic 推出新一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4

今天，Anthropic 宣布推出下一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准，为开发者和...

早报 # Claude # Claude Code # Claude Opus 4

11个月前

05160

新型个性化图像生成方法Infinite-ID：保持特定身份特征的同时，根据用户的文本描述生成高质量的图像

来自中国科学技术大学和悉尼大学的研究人员推出新型个性化图像生成方法Infinite-ID，它能够在保持特定身份特征的同时，根据用户的文本描述生成高质量的图像。这是一个全新的ID-语义解耦范式，专门用于...

新技术 # Infinite-ID # 个性化图像生成

2年前

05160

加载更多

百科

苹果推出新预训练方法CLOC：提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面

新型视频扩展方法Follow-Your-Canvas：能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容

图像生成评估基准DREAMBENCH++：与人类偏好对齐的自动化评估系统，专门用于个性化图像生成

新型图像编辑工具StyleFeatureEditor：结合了AI的最新进展，使用户能够以前所未有的细节级别和灵活性来编辑图像

Bolt与 AnimaApp 合作：将 Figma 设计无缝转化为像素级完美的全栈应用程序

非自回归扩散框架的动态帧化身DAWN：根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

新型高分辨率图像到3D生成框架Hi3D：将单张2D图片转换成具有高分辨率纹理细节的3D模型

CFG-Zero*：用于提升基于流匹配模型的图像和视频生成效果

用于长视频生成的双速学习系统SLOWFAST-VGEN：模仿了人类大脑中慢速学习和快速学习相结合的互补学习系统

3D立体视频生成新方法SVG：利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

Anthropic 推出新一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4

新型个性化图像生成方法Infinite-ID：保持特定身份特征的同时，根据用户的文本描述生成高质量的图像

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊）

MaxClaw

ITELLOU

百科

网址

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊 ）

MaxClaw

ITELLOU

Joker of Academics（小丑学术期刊）