百科 | 第40页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

图像风格化技术B-LoRA：将单张图片中的风格和内容分离，从而实现高质量的图像风格化处理

来自特拉维夫大学和赖希曼大学的研究团队推出B-LoRA（Block Low-Rank Adaptation），它能够将单张图片中的风格和内容分离，从而实现高质量的图像风格化处理。图像风格化是指在保持图...

新技术 # B-LoRA # 图像风格化

2年前

05810

苹果推出开源图像编辑模型MGIE：通过文字提示来编辑任何图像

来自苹果的团队推出开源图像编辑模型MGIE（MLLM-Guided Image Editing），它旨在通过使用多模态大语言模型（MLLMs）来提升基于指令的图像编辑能力。简单来说，MGIE可以帮助用...

新技术 # MGIE # 图像编辑 # 苹果

2年前

05810

谷歌推出首尾帧图生视频新方法Generative Inbetweening：在两个关键帧之间产生连贯的运动

华盛顿大学、谷歌 DeepMind和加州大学伯克利分校的研究人员推出一种用于生成视频序列的方法Generative Inbetweening，能够在两个关键帧之间产生连贯的运动。简单来说，就是给定视频...

新技术 # Generative Inbetweening # 插帧 # 视频序列

2年前

05800

Canva全面拥抱AI：新增图像生成、交互式编程与电子表格功能

设计工具领域的领军企业Canva近日宣布推出一系列全新AI功能，进一步扩展其平台的能力。这些新功能包括AI助手（Canva AI）、通过提示创建交互式应用程序的能力（Canva Code）、AI驱动的...

早报 # AI # Canva

1年前

05790

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

本周一，OpenAI发布了全新的模型系列——GPT-4.1，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色，标志着OpenAI在打造“代理...

大语言模型早报 # GPT-4.1 # GPT-4.1 mini # GPT-4.1 nano

1年前

05770

Adobe MAX大会亮点！Adobe旗下多个应用发布新功能，视频生成功能已上线Adobe Premiere Pro和Adobe Firefly

今天，在美国迈阿密海滩举行的Adobe MAX大会上，Adobe发布了最新版本的Adobe Creative Cloud，其中包括超过100项新功能，涵盖了Photoshop、Illustrator...

早报 # Adobe Firefly # Adobe MAX # Adobe Premiere Pro

2年前

05770

分布式长视频生成框架Video-Infinity：能够利用多个GPU并行工作，快速生成长时间的视频内容

新加坡国立大学的研究人员推出Video-Infinity系统，它是一个分布式的长视频生成框架。简单来说，Video-Infinity能够利用多个GPU（显卡）并行工作，快速生成长时间的视频内容。这对于...

新技术 # Video-Infinity # 长视频生成框架

2年前

05770

3D重建模型MeshLRM：基于LRM的方法，能够从极少量的输入图像（仅需四张）快速重建出高质量的3D网格模型

来自加州大学圣地亚哥分校和Adobe的研究人员推出大型3D重建模型MeshLRM，这是一种新颖的基于LRM的方法，它能在不到一秒的时间内，能够从极少量的输入图像（仅需四张）快速重建出高质量的3D网...

新技术 # 3D重建模型 # MeshLRM

2年前

05770

Scaling (Down) CLIP：从数据、架构和训练策略三个维度对CLIP进行了详细探究

来自加州大学圣克鲁斯分校和Google Deepmind的研究人员发布论文探讨如何有效地缩减对比语言-图像预训练（CLIP）模型的规模，以适应计算资源有限的情况。研究团队从数据、架构和训练策略三个维度...

新技术 # CLIP模型

2年前

05760

图像编辑框架StableDrag：通过点（handle points）来精确控制图像编辑

南京大学软件新技术国家重点实验室和腾讯公司研究团队推出图像编辑框架StableDrag，它专注于通过点（handle points）来精确控制图像编辑。项目主页论文地址 StableDrag提供了...

新技术 # StableDrag # 图像编辑

2年前

05760

新型高效微调方法SaRA：用于提升预训练扩散模型（SD 1.5、SD 2.0和SD 3.0）在新任务上的表现

上海交通大学和腾讯优图实验室的研究人员推出新型高效微调方法SaRA，用于提升预训练扩散模型在新任务上的表现。扩散模型是一种强大的生成模型，能够生成图像、视频和3D模型等。但这些模型通常需要大量的参数...

新技术 # SaRA # 微调模型

2年前

05750

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

宾夕法尼亚大学和加州大学圣塔芭芭拉分校的研究人员推出基准测试CommonsensenT2I，用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力。简单来说，就是研究这些模型是否能够根据文字描述...

新技术 # CommonsensenT2I # 基准测试 # 文生图模型

2年前

05750

加载更多

百科

图像风格化技术B-LoRA：将单张图片中的风格和内容分离，从而实现高质量的图像风格化处理

苹果推出开源图像编辑模型MGIE：通过文字提示来编辑任何图像

谷歌推出首尾帧图生视频新方法Generative Inbetweening：在两个关键帧之间产生连贯的运动

Canva全面拥抱AI：新增图像生成、交互式编程与电子表格功能

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

Adobe MAX大会亮点！Adobe旗下多个应用发布新功能，视频生成功能已上线Adobe Premiere Pro和Adobe Firefly

分布式长视频生成框架Video-Infinity：能够利用多个GPU并行工作，快速生成长时间的视频内容

3D重建模型MeshLRM：基于LRM的方法，能够从极少量的输入图像（仅需四张）快速重建出高质量的3D网格模型

Scaling (Down) CLIP：从数据、架构和训练策略三个维度对CLIP进行了详细探究

图像编辑框架StableDrag：通过点（handle points）来精确控制图像编辑

新型高效微调方法SaRA：用于提升预训练扩散模型（SD 1.5、SD 2.0和SD 3.0）在新任务上的表现

基准测试CommonsensenT2I：用于评估文生图模型（T2I）生成符合现实生活常识的图像的能力

S.H.I.T

同事.skill

新Claude Managed Agents

Tripo

即梦 CLI

ITELLOU

百科

网址

S.H.I.T

同事.skill

新Claude Managed Agents

Tripo

即梦 CLI

ITELLOU