图像超分辨率技术InvSR:基于扩散反转(Diffusion Inversion)来提高图像的分辨率南洋理工大学(NTU)S-Lab提出了一种新的图像超分辨率(Super-Resolution, SR)技术——InvSR,旨在利用大型预训练扩散模型中封装的丰富图像先验来提高SR性能。传统的超分辨率方...新技术# InvSR# 图像超分辨率1年前03650
Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...新技术# Dynamics Lab# Mirage6个月前03630
MiniMax 发布其首个文本到图像生成模型 Image-01MiniMax 近日正式发布了其首个文本到图像生成模型 Image-01,标志着其在多模态视觉领域的重大突破。Image-01 不仅扩展了 MiniMax 的 AI 功能,还为全球用户带来了极具创意和...早报# Image-01# MiniMax# 图像生成模型10个月前03630
强化学习新范式OREAL:基于结果奖励的强化学习(RL)提升大语言模型在数学推理任务中的表现上海AI实验室、上海交通大学、香港中文大学和InnoHK的研究人员提出基于结果奖励的强化学习新范式OREAL,通过基于结果奖励的强化学习(RL)提升大语言模型(LLMs)在数学推理任务中的表现。该框架...新技术# OREAL# 大语言模型# 强化学习10个月前03630
Ollama v0.7.0发布:添加新多模态模型引擎,多模态模型支持全面升级Ollama 最新发布的 v0.7.0 版本带来了对多模态模型的支持,标志着其在本地推理和模型集成能力上的重要突破。此次更新不仅扩展了视觉多模态模型的支持范围,还通过全新的多模态引擎提升了性能、准确性...早报# Ollama# 多模态模型# 多模态模型引擎7个月前03620
新型虚拟试穿技术FitDiT:专为优化DiT模型的虚拟试穿性能而设计尽管基于图像的虚拟试穿技术已取得显著进展,但在生成高保真度和适应性强的拟合图像上仍面临诸多挑战。尤其在纹理感知维护和尺寸感知拟合等关键领域,现有方法往往难以达到理想效果,这限制了技术的整体实用性。为应...新技术# FitDiT# 虚拟试穿11个月前03610
OpenAI发布全新GPT-4.1系列模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano本周一,OpenAI发布了全新的模型系列——GPT-4.1,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这些模型在编程和指令遵循方面表现出色,标志着OpenAI在打造“代理...大语言模型早报# GPT-4.1# GPT-4.1 mini# GPT-4.1 nano8个月前03600
MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成文本-图像到视频生成(TI2V) 是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展,但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战,尤其是在指定运动细节方面...新技术# MotiF# 图生视频12个月前03600
Grammarly 推出九大人机协作写作智能体,可预测论文评分Grammarly 今日正式推出九个全新人工智能智能体(AI Agents),集成于其“AI 原生写作界面”中,旨在为学生和教育工作者提供更智能、更精准的写作支持。 这些智能体覆盖从构思、写作到反馈的...早报# Grammarly# 写作智能体4个月前03590
为了AI的“福祉”?Anthropic 让 Claude 能主动结束有害对话Anthropic宣布,其最新一代大模型 Claude Opus 4 和 4.1 获得了一项新能力:在极端情况下,主动终止与用户的对话。 这并非因为用户“说错话”,而是当对话持续涉及严重滥用内容——如...早报# Anthropic# Claude4个月前03590
大规模视频动作数据集EgoVid-5M:专为第一人称视角(egocentric)视频生成而设计阿里巴巴集团智能计算研究院、中国科学院自动化研究所、清华大学和中国科学院大学的研究人员推出大规模视频动作数据集EgoVid-5M,专为第一人称视角(egocentric)视频生成而设计。该数据集包含了...新技术# EgoVid-5M# 视频动作数据集1年前03580
Anthropic 推出新一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4今天,Anthropic 宣布推出下一代 Claude 模型:Claude Opus 4 和 Claude Sonnet 4。这两个模型在编码、高级推理和 AI 代理方面设定了新的行业标准,为开发者和...早报# Claude# Claude Code# Claude Opus 47个月前03560