百科 | 第38页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

CleanDIFT：从大规模预训练的扩散模型中提取无噪声、与时间步无关的通用特征表示

慕尼黑大学的研究人员推出一种名为CleanDIFT的新方法，用于从大规模预训练的扩散模型中提取无噪声、与时间步无关的通用特征表示。这种方法特别针对的是，以往在使用扩散模型提取特征时需要向图像添加噪声...

新技术 # CleanDIFT

1年前

05920

个性化图像生成新方法ViPer: 通过个体偏好学习实现生成模型的视觉个性化

瑞士联邦理工学院的研究人员推出一种个性化生成模型输出的方法ViPer，它可以让生成模型（比如用来生成图片的AI）根据个人的喜好来定制生成的内容。这是通过一次性捕捉用户的总体偏好，并在无需详细工程化提示...

新技术 # ViPer # 个性化图像生成

2年前

05920

新型视频扩散模型StreamV2V：实现实时的视频到视频转换

德克萨斯大学奥斯汀分校和加州大学伯克利分校的研究人员推出新型视频扩散模型StreamV2V，它能够实现实时的视频到视频（Video-to-Video，简称V2V）翻译。这项技术允许用户通过提示（pro...

新技术 # StreamV2V # 视频扩散模型

2年前

05910

OPPO推出多步潜在一致性模型MLCM：用于加速生成图像

OPPO推出多步潜在一致性模型MLCM，它用于加速生成图像的潜在扩散模型（LDMs）。简而言之，MLCM能够快速生成高质量的图像，同时保持较低的计算成本。MLCM仅需2-8步采样即可生成高质量、令人愉...

新技术 # MLCM # OPPO # 多步潜在一致性模型

2年前

05900

FlexiDreamer：从单张图片生成三维（3D）模型

来自中国科学院大学、清华大学、西安电子科技大学和生数科技的研究人员推出FlexiDreamer，它能够从单张图片生成三维（3D）模型。项目主页 GitHub 例如，你有一张你喜欢的动漫角色的照片，F...

新技术 # 3D生成模型 # FlexiDreamer

2年前

05900

图像复制检测模型ICDiff：解决扩散模型生成图像的版权和原创性问题

悉尼科技大学、百度和浙江大学的研究人员推出图像复制检测模型ICDiff，这是第一个专门针对扩散模型的ICD（图像复制检测）。为此，研究人员构建了一个扩散-复制（D-Rep）数据集，并相应地提出了一种新...

新技术 # ICDiff # PDF-Embedding # 图像复制检测

2年前

05890

Windsurf Editor 发布重大跟新Wave 4，引入了多项新功能，包括预览功能、Cascade 自动 Linter 和全新的推荐计划

Windsurf Editor 发布了其最新重大更新——Wave 4，引入了多项新功能，包括预览功能、Cascade 自动 Linter 和全新的推荐计划。预览功能允许开发者通过将元素和控制台错误发送...

早报 # AI编程 # Wave 4 # Windsurf Editor

1年前

05880

英伟达推出LATTE3D：快速生成3D模型

英伟达推出新型大规模文本到3D合成系统LATTE3D，LATTE3D的关键在于构建可扩展的架构，并利用3D数据在优化过程中引入3D感知扩散先验、形状正则化和模型初始化，以确保对不同和复杂的训练提示具有...

新技术 # 3D模型 # LATTE3D

2年前

05880

大型文本到图像提示数据集StyleBreeder：包含680万张图片及180万个提示词

弗吉尼亚理工大学、苏黎世联邦理工学院、慕尼黑工业大学、谷歌和Artbreeder的研究人员推出大型文本到图像提示数据集StyleBreeder，它通过使用文本到图像的生成模型，探索和推广了艺术风格的多...

新技术 # StyleBreeder # 文生图提示数据集

2年前

05870

多模态问答系统Lumos：结合场景文本识别和多模态大语言模型

来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos，这是一个结合了场景文本识别（Scene Text Recognition, STR）和多模态大语言模型（Multimod...

新技术 # Lumos # 场景文本识别 # 多模态大语言模型

2年前

05870

TextCraftor：通过微调文本编码器来提高文本到图像生成模型的性能，使得生成的图像更加精确地反映文本描述的内容

来自Snap和美国东北大学的研究人员推出文本编码器TextCraftor，它通过微调文本编码器来提高文本到图像生成模型的性能，使得生成的图像更加精确地反映文本描述的内容。这种方法减少了对大量数据集的依...

新技术 # TextCraftor # 文本编码器

2年前

05860

FaceChain-SuDe：提高个性化图像生成的属性相关性

来自北京大学、阿里巴巴、清华大学和鹏程实验室的研究团队推出FaceChain-SuDe，这是一种用于个性化文本到图像生成的方法，旨在提高个性化图像生成（subject-driven generatio...

新技术 # FaceChain-SuDe # 个性化图像生成

2年前