百科 | 第56页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

图像编辑框架InstantDrag：通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速

首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag，它能够让用户通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速。例如，你有一张图片，你想要移动图片中的某个部...

新技术 # InstantDrag # 图像编辑

2年前

04710

谷歌Bug大放送：免费领取一年Gemini Advanced和2TB云端存储

近日，谷歌的一项活动出现了意外漏洞，原本仅限美国学生的 Gemini Advanced 会员计划现在对任何人开放。通过切换到美国IP地址，用户可以免费领取一年的 Gemini Advanced 高级...

早报 # Gemini Advanced # 谷歌

11个月前

04700

3D纹理生成框架MVPaint：根据文本指令自动生成高分辨率、无缝的3D纹理

腾讯PCG、上海人工智能实验室、南洋理工大学S-Lab和清华大学的研究人员推出3D纹理生成框架MVPaint，它能够根据文本指令自动生成高分辨率、无缝的3D纹理。MVPaint通过同步多视图扩散模型来...

新技术 # 3D纹理生成 # MVPaint

1年前

04700

结合了大语言模型与文生图模型的新框架SGEdit：用于基于场景图的精确和灵活的图像编辑

场景图提供了一种结构化、层次化的图像表示方式，其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容，还能作为图像编辑的有效接口，极大提升了编辑工作的准确性和灵活性...

新技术 # SGEdit # 图像编辑 # 大语言模型

1年前

04700

苹果推出一个用于零样本度量单目深度估计的基础模型Depth Pro

苹果推出一个用于零样本度量单目深度估计的基础模型Depth Pro，它用于提高单目深度估计的准确性和细节表现。单目深度估计是指仅使用一个摄像头拍摄的单张图片来预测场景中每个像素的深度信息。例如，你用手...

新技术 # Depth Pro # 苹果

2年前

04700

Pony系列模型V7版本，将带来诸多令人期待的改进和新功能

Pony系列模型一直以来都是基于SDXL微调的热门绘画模型，尤其在Civitai平台上备受关注。其在二次元和真人绘画领域都展现出了出色的表现力。而如今，V7版本的消息传来，带来了诸多令人期待的改进和新...

早报 # Pony

1年前

04690

OpenAI 将 GPT-4.1 引入 ChatGPT，编码与指令遵循能力显著提升

OpenAI在 X 平台宣布，其最新 AI 模型 GPT-4.1 和 GPT-4.1 mini 已正式集成到 ChatGPT 中。这一更新不仅为用户带来了更强的性能，还进一步优化了特定任务的表现，尤其...

早报 # ChatGPT # GPT-4.1 # OpenAI

11个月前

04680

Impossible Videos：通过创建和评估“不可能视频”来挑战和推进视频理解和生成模型的能力

新加坡国立大学的研究人员推出Impossible Videos项目，即“不可能视频”。这项研究旨在通过创建和评估“不可能视频”来挑战和推进视频理解和生成模型的能力。不可能视频是指那些在现实世界中不可能...

新技术 # AI视频 # Impossible Videos # 不可能视频

1年前

04680

Fluid: 基于连续令牌和随机顺序生成的文生图模型

在视觉领域，自回归模型的扩展并没有像在大语言模型中那样取得显著的成功。为了探索这一问题，Google DeepMind 和麻省理工学院的研究人员进行了一项研究，重点探讨了两个关键因素：模型是使用离散还...

新技术 # Fluid:# 文生图模型

1年前

04680

音乐生成系统Seed-Music：能够创作出高质量的音乐，并且可以根据用户的细致要求来调整音乐的风格和内容

字节跳动旗下豆包团队推出音乐生成系统Seed-Music，能够创作出高质量的音乐，并且可以根据用户的细致要求来调整音乐的风格和内容。Seed-Music结合了自回归语言建模和扩散方法，支持两种关键的音...

新技术 # Seed-Music # 音乐生成

2年前

04680

Compress3D：从单张图片生成三维模型

来自西安交通大学的研究团队推出Compress3D，它是一种从单张图片生成三维模型的方法。想象一下，你有一张你最喜欢的动漫角色的图片，你想在虚拟现实游戏中使用这个角色的三维模型。传统上，这需要3D艺术...

新技术 # Compress3D # 三维模型

2年前

04680

微软加入Anthropic的MCP指导委员会，Windows 11 引入原生MCP支持

在2025年微软Build大会上，微软宣布正式加入 Anthropic 的模型上下文协议（MCP）指导委员会。这一消息标志着MCP在人工智能行业中的重要性日益提升。今年早些时候，OpenAI和谷歌均表...

早报 # MCP # Windows 11 # 微软

11个月前

04670

加载更多

百科

图像编辑框架InstantDrag：通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速

谷歌Bug大放送：免费领取一年Gemini Advanced和2TB云端存储

3D纹理生成框架MVPaint：根据文本指令自动生成高分辨率、无缝的3D纹理

结合了大语言模型与文生图模型的新框架SGEdit：用于基于场景图的精确和灵活的图像编辑

苹果推出一个用于零样本度量单目深度估计的基础模型Depth Pro

Pony系列模型V7版本，将带来诸多令人期待的改进和新功能

OpenAI 将 GPT-4.1 引入 ChatGPT，编码与指令遵循能力显著提升

Impossible Videos：通过创建和评估“不可能视频”来挑战和推进视频理解和生成模型的能力

Fluid: 基于连续令牌和随机顺序生成的文生图模型

音乐生成系统Seed-Music：能够创作出高质量的音乐，并且可以根据用户的细致要求来调整音乐的风格和内容

Compress3D：从单张图片生成三维模型

微软加入Anthropic的MCP指导委员会，Windows 11 引入原生MCP支持

S.H.I.T

ITELLOU

Tripo

BuildCores

同事.skill

waoo

百科

网址

S.H.I.T

ITELLOU

Tripo

BuildCores

同事.skill

waoo