百科 | 第60页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

图像超分辨率技术InvSR：基于扩散反转（Diffusion Inversion）来提高图像的分辨率

南洋理工大学（NTU）S-Lab提出了一种新的图像超分辨率（Super-Resolution, SR）技术——InvSR，旨在利用大型预训练扩散模型中封装的丰富图像先验来提高SR性能。传统的超分辨率方...

新技术 # InvSR # 图像超分辨率

1年前

03650

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

游戏的未来不再依赖专业设计师逐帧构建，而是由每一位玩家通过想象、生成与体验来共同塑造。今天，Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容（UGC...

新技术 # Dynamics Lab # Mirage

6个月前

03630

MiniMax 发布其首个文本到图像生成模型 Image-01

MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01，标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能，还为全球用户带来了极具创意和...

早报 # Image-01 # MiniMax # 图像生成模型

10个月前

03630

强化学习新范式OREAL：基于结果奖励的强化学习（RL）提升大语言模型在数学推理任务中的表现

上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL，通过基于结果奖励的强化学习（RL）提升大语言模型（LLMs）在数学推理任务中的表现。该框架...

新技术 # OREAL # 大语言模型 # 强化学习

10个月前

03630

Ollama v0.7.0发布：添加新多模态模型引擎，多模态模型支持全面升级

Ollama 最新发布的 v0.7.0 版本带来了对多模态模型的支持，标志着其在本地推理和模型集成能力上的重要突破。此次更新不仅扩展了视觉多模态模型的支持范围，还通过全新的多模态引擎提升了性能、准确性...

早报 # Ollama # 多模态模型 # 多模态模型引擎

7个月前

03620

新型虚拟试穿技术FitDiT：专为优化DiT模型的虚拟试穿性能而设计

尽管基于图像的虚拟试穿技术已取得显著进展，但在生成高保真度和适应性强的拟合图像上仍面临诸多挑战。尤其在纹理感知维护和尺寸感知拟合等关键领域，现有方法往往难以达到理想效果，这限制了技术的整体实用性。为应...

新技术 # FitDiT # 虚拟试穿

11个月前

03610

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

本周一，OpenAI发布了全新的模型系列——GPT-4.1，包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色，标志着OpenAI在打造“代理...

大语言模型早报 # GPT-4.1 # GPT-4.1 mini # GPT-4.1 nano

8个月前

03600

MotiF：通过引导模型关注更多运动区域来改善文本对齐和运动生成

文本-图像到视频生成（TI2V）是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展，但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战，尤其是在指定运动细节方面...

新技术 # MotiF # 图生视频

12个月前

03600

Grammarly 推出九大人机协作写作智能体，可预测论文评分

Grammarly 今日正式推出九个全新人工智能智能体（AI Agents），集成于其“AI 原生写作界面”中，旨在为学生和教育工作者提供更智能、更精准的写作支持。这些智能体覆盖从构思、写作到反馈的...

早报 # Grammarly # 写作智能体

4个月前

03590

为了AI的“福祉”？Anthropic 让 Claude 能主动结束有害对话

Anthropic宣布，其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力：在极端情况下，主动终止与用户的对话。这并非因为用户“说错话”，而是当对话持续涉及严重滥用内容——如...

早报 # Anthropic # Claude

4个月前

03590

大规模视频动作数据集EgoVid-5M：专为第一人称视角（egocentric）视频生成而设计

阿里巴巴集团智能计算研究院、中国科学院自动化研究所、清华大学和中国科学院大学的研究人员推出大规模视频动作数据集EgoVid-5M，专为第一人称视角（egocentric）视频生成而设计。该数据集包含了...

新技术 # EgoVid-5M # 视频动作数据集

1年前

03580

Anthropic 推出新一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4

今天，Anthropic 宣布推出下一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准，为开发者和...

早报 # Claude # Claude Code # Claude Opus 4

7个月前

03560

加载更多

百科

图像超分辨率技术InvSR：基于扩散反转（Diffusion Inversion）来提高图像的分辨率

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

MiniMax 发布其首个文本到图像生成模型 Image-01

强化学习新范式OREAL：基于结果奖励的强化学习（RL）提升大语言模型在数学推理任务中的表现

Ollama v0.7.0发布：添加新多模态模型引擎，多模态模型支持全面升级

新型虚拟试穿技术FitDiT：专为优化DiT模型的虚拟试穿性能而设计

OpenAI发布全新GPT-4.1系列模型：GPT-4.1、GPT-4.1 mini和GPT-4.1 nano

MotiF：通过引导模型关注更多运动区域来改善文本对齐和运动生成

Grammarly 推出九大人机协作写作智能体，可预测论文评分

为了AI的“福祉”？Anthropic 让 Claude 能主动结束有害对话

大规模视频动作数据集EgoVid-5M：专为第一人称视角（egocentric）视频生成而设计

Anthropic 推出新一代 Claude 模型：Claude Opus 4 和 Claude Sonnet 4

Fogsight (雾象)

朱雀大模型检测

Tripo

ITELLOU

新人生 K 线

Google AI Studio

百科

网址

Fogsight (雾象)

朱雀大模型检测

Tripo

ITELLOU

新人生 K 线

Google AI Studio