Long Volumetric Video:高效地表示和渲染长时间的体积视频浙江大学、斯坦福大学和香港科技大学的研究人员发布论文,主题是关于如何高效地表示和渲染长时间的体积视频(Long Volumetric Video)。体积视频是一种能够从多个视角捕捉动态场景并提供自由视...新技术# EasyVolcap# longvolcap# 体积视频1年前03690
WikiAutoGen:用于自动化生成多模态维基百科风格文章的系统阿卜杜拉国王科技大学、兰州大学、悉尼大学的研究人员推出WikiAutoGen,这是一个用于自动化生成多模态维基百科风格文章的系统。它通过整合文本和图像信息,生成高质量、多模态的维基百科风格文章,同时引...新技术# WikiAutoGen# 多模态# 维基百科9个月前03680
新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频...新技术# VidCRAFT3# 视频生成10个月前03670
ReferEverything:专为视频中通过自然语言描述的概念进行分割而设计来自卡内基梅隆大学、伊利诺伊大学香槟分校和丰田研究所的研究者们共同提出了一种名为ReferEverything(Reference Expression Modeling)的创新框架,专为视频中通过自...新技术# ReferEverything# 分割模型1年前03670
Flow-GRPO:将在线强化学习与流匹配模型相结合,用于提升文生图模型生成任务的性能香港中文大学MM实验室、清华大学、快手科技、南京大学和上海人工智能实验室推出新方法Flow-GRPO,它将在线强化学习(Reinforcement Learning, RL)与流匹配(Flow Mat...新技术# Flow-GRPO# 强化学习# 流匹配7个月前03660
超分辨率渲染新技术框架DFASRR:实现任意比例的超分辨率渲染,以实时生成高清晰度图像南京大学计算机软件新技术国家重点实验室的研究人员介绍了一种名为“DFASRR(Deep Fourier-based Arbitrary-scale Super-resolution for Real...新技术# DFASRR# 超分辨率渲染1年前03660
FlipSketch:将静态绘图转换为文本引导的草图动画草图动画作为一种强大的视觉叙事工具,从简单的手工翻页涂鸦发展到了专业的工作室制作,为创作者提供了无限的想象空间。然而,传统的动画制作过程复杂,不仅需要一支熟练的艺术家团队来绘制关键帧和中间帧,还要求艺...新技术# FlipSketch# 草图动画1年前03660
Anthropic 回应 OpenAI:1 美元向美国政府机构提供 Claude在 OpenAI 宣布以每年 1 美元的价格向美国联邦行政部门提供 ChatGPT Enterprise 仅一周后,Anthropic 迅速出手,将这场“AI 入政”竞赛推向新高度。 周二,Anthr...早报# Anthropic# Claude4个月前03650
Anthropic 推出百万 tokens 上下文:Claude Sonnet 4 支持 75 万字输入Anthropic 正在将其 AI 模型的上下文窗口推向新高度。近日,公司宣布其主力模型 Claude Sonnet 4 现已支持 100 万个 tokens 的上下文长度,相当于可一次性处理 75 ...早报# Anthropic# Claude Sonnet 44个月前03650
SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...新技术# SimpleGVR# 视频超分辨率模型6个月前03650
OpenAI即将推出GPT-4o的升级版GPT-4.1:更智能、更小巧OpenAI正准备推出其旗舰模型GPT-4o的升级版——GPT-4.1,同时还将发布一系列轻量级变体,如GPT-4.1 mini和nano。这一战略调整旨在提升AI的可扩展性和可访问性,让高级AI能力...早报# GPT-4.1# GPT-4o# OpenAI8个月前03650
Grok上线全新语音交互模式,支持18+模式xAI 最近为其AI助手Grok推出了一种新的语音交互模式,这种模式目前仅面向高级订阅用户开放。该功能与 OpenAI 的 ChatGPT 高级语音模式类似,但在内容上却有着显著的不同——Grok 提...早报# Grok# 语音10个月前03650