百科 | 第43页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

JINA AI推出新型多任务对比训练方法及其模型JINA CLIP：解决现有CLIP模型在文本检索任务中性能不佳的问题

JINA AI推出新型多任务对比训练方法及其模型JINA CLIP，旨在解决现有CLIP（Contrastive Language-Image Pretraining，对比语言-图像预训练）模型在文本...

2年前

05650

D-Flow框架：更加精确地控制生成模型的输出

D-Flow框架是一种用于控制生成过程的方法，通过在流中进行微分来控制生成过程，以优化源（噪声）点。该方法的主要局限是生成时间相对较长（通常需要5-15分钟），这可能会在某些应用中限制其使用。论文地...

新技术 # D-Flow框架 # 生成模型

2年前

05650

图像生成框架OmniBooth：根据用户的多模态指令（如文本提示或图像参考）来生成具有空间控制和实例级定制化的图像

香港科技大学和华为诺亚方舟实验室的研究人员推出图像生成框架OmniBooth，它可以根据用户的多模态指令（如文本提示或图像参考）来生成具有空间控制和实例级定制化的图像。简单来说，用户可以指定多个对象的...

新技术 # OmniBooth # 图像生成框架

2年前

05640

新型视频生成框架Tora：基于DiT框架构建，专门用于生成受轨迹指导的视频内容

阿里巴巴推出新型视频生成框架Tora，它基于DiT（Diffusion Transformer）框架构建，专门用于生成受轨迹指导的视频内容。简而言之，Tora能够根据文本、图像、轨迹或这些元素的组合来...

新技术 # Tora # 视频生成

2年前

05640

TGATE：减少不必要的计算来提高效率，同时保持生成图像的质量

来自阿卜杜拉国王科技大学、新加坡国立大学和瑞士人工智能实验室的研究人员推出一种简单且无需训练的方法TGATE，通过减少不必要的计算来提高效率，同时保持生成图像的质量，这对于各种需要快速高质量图像生成的...

新技术 # TGATE

2年前

05640

新型实时目标检测系统YOLOv9：通过创新的网络设计和梯度信息处理来提高目标检测的准确性和效率

来自中国台湾的研究人员推出新型实时目标检测系统YOLOv9，通过引入可编程梯度信息（Programmable Gradient Information, PGI）和一种新的轻量级网络架构——广义高效层...

新技术 # YOLOv9 # 目标检测系统

2年前

05640

Adobe推出Magic Fixup：用于图像编辑的生成模型

来自Adobe和马里兰大学的研究团队推出用于图像编辑的生成模型Magic Fixup，该模型能够根据粗略编辑的图像，合成遵循特定布局的逼真输出。该模型能够转移原始图像的精细细节，同时保留其各部分特...

新技术 # Magic Fixup # 图像编辑

2年前

05630

豆包“AI编程”功能重大升级：HTML预览、Python运行以及生成完整项目的能力，进一步提升了用户的开发体验

今年初，豆包网页版和电脑版推出了备受欢迎的“AI编程”功能，为用户解决代码难题提供了极大的便利。现在，这一功能迎来了三项重要升级：HTML预览、Python运行以及生成完整项目的能力，进一步提升了用户...

早报 # 豆包

1年前

05620

MCP（开源模型上下文协议）迎来重大更新，还获得了行业巨头OpenAI和微软的支持

开源模型上下文协议（MCP）的最新更新标志着AI代理与工具、数据和接口无缝交互的一个重要里程碑。这一更新不仅引入了关键升级，还获得了行业巨头OpenAI和微软的支持，显示出其在AI领域的巨大潜力和影响...

百科 # MCP # OpenAI # 开源模型上下文协议

1年前

05610

图像逆向技术ReNoise：可能图像内容进行编辑重建

来自特拉维夫大学和谷歌的研究团队推出图像逆向技术ReNoise，这是一种通过迭代噪声处理来实现真实图像在预训练扩散模型域内重建的方法。简单来说，就像我们有时候需要从一张已经损坏或者风格化的照片恢复出原...

新技术 # ReNoise # 图像编辑 # 谷歌

2年前

05610

基于多模态扩散模型的创新框架CreativeSynth：用于创意融合和合成视觉艺术

来自字节跳动、中科院自动化研究所、中国科学院大学人工智能学院等机构的研究人员，提出了一个名为CreativeSynth的创新框架，它基于多模态扩散模型，能够协调多模态输入并在艺术图像生成领域实现多任务...

新技术 # CreativeSynth # 多模态扩散模型

2年前

05600

Grok新功能升级：“Tasks”任务调度更便捷，AI自动化再进一步

xAI团队正在持续推进Grok即将上线的“Tasks”功能更新。最新版本带来了用户界面的多项改进，标志着该功能正逐步走向成熟。更加直观的任务入口在此次更新中，左侧导航栏新增了专属的“Tasks”按...

早报 # Grok # Tasks

10个月前

05590

加载更多

百科

JINA AI推出新型多任务对比训练方法及其模型JINA CLIP：解决现有CLIP模型在文本检索任务中性能不佳的问题

D-Flow框架：更加精确地控制生成模型的输出

图像生成框架OmniBooth：根据用户的多模态指令（如文本提示或图像参考）来生成具有空间控制和实例级定制化的图像

新型视频生成框架Tora：基于DiT框架构建，专门用于生成受轨迹指导的视频内容

TGATE：减少不必要的计算来提高效率，同时保持生成图像的质量

新型实时目标检测系统YOLOv9：通过创新的网络设计和梯度信息处理来提高目标检测的准确性和效率

Adobe推出Magic Fixup：用于图像编辑的生成模型

豆包“AI编程”功能重大升级：HTML预览、Python运行以及生成完整项目的能力，进一步提升了用户的开发体验

MCP（开源模型上下文协议）迎来重大更新，还获得了行业巨头OpenAI和微软的支持

图像逆向技术ReNoise：可能图像内容进行编辑重建

基于多模态扩散模型的创新框架CreativeSynth：用于创意融合和合成视觉艺术

Grok新功能升级：“Tasks”任务调度更便捷，AI自动化再进一步

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊）

MaxClaw

Skills.sh

百科

网址

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊 ）

MaxClaw

Skills.sh

Joker of Academics（小丑学术期刊）