视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster,能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频(t...新技术# ReCamMaster# 动态场景# 视频生成10个月前04030
开启大语言模型的新篇章:《大语言模型的后训练技术:全面综述》在AI领域,大语言模型(LLMs)的发展正以前所未有的速度重塑自然语言处理(NLP)的边界。从聊天机器人到科学探索,LLMs 已经成为不可或缺的工具。然而,这些模型在预训练阶段往往暴露出在特定领域的局...新技术# 后训练# 大语言模型10个月前02560
Jasper Research推出新型图像到图像转换方法LBM:可以实现对象移除、调整光照等效果Jasper Research推出一种新型图像到图像转换方法Latent Bridge Matching (LBM) ,这种方法通过在潜在空间中进行“桥匹配”(Bridge Matching)来实现快...新技术# Jasper Research# LBM# 图像转换10个月前04250
长上下文调优训练范式LCT:通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致性的多镜头视频内容香港中文大学和字节跳动的研究人员提出了一种名为 Long Context Tuning(LCT,长上下文调优)的训练范式,通过将预训练的单镜头视频扩散模型扩展到场景级视频生成,以生成具有视觉和动态一致...新技术# LCT# 训练范式# 长上下文调优10个月前03310
清华大学与清程极智开源大模型推理引擎“赤兔 Chitu”,实现 DeepSeek 推理成本降低一半、性能翻番清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,大模型推理引擎“赤兔 Chitu”现已正式开源。该引擎首次实现了在非英伟达 Hopper 架构 GPU 及各类国产芯片上原生运行...新技术# Chitu# DeepSeek# 大模型推理引擎10个月前03490
加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG):可实现2 倍加速和高保真度来加速视频生成加州大学伯克利分校、麻省理工学院、英伟达和清华大学的研究人员推出一个用于加速DiT架构模型的无需训练训练框架Sparse VideoGen(SVG),通过利用三维全注意力(3D full attent...新技术# Sparse VideoGen# SVG# 加速10个月前04120
用于复杂任务自动化的分层多智能体协作框架PC-Agent:专门针对个人电脑(PC)场景设计中国科学院自动化研究所自动化智能系统研究所、中国科学院大学人工智能学院、阿里巴巴集团、北京交通大学和上海科技大学信息科学与技术学院的研究人员推出PC-Agent,这是一个用于复杂任务自动化的分层多智能...新技术# PC-Agent# 分层多智能体协作框架10个月前02030
Luma AI推出新型生成模型框架IMM:实现仅 8 步 内生成高质量图像Luma AI和斯坦福大学的研究人员推出新型生成模型框架 Inductive Moment Matching (IMM) ,旨在解决扩散模型(Diffusion Models)和流匹配(Flow Ma...新技术# IMM# Luma AI# 图像生成模型10个月前04010
全新LoRA训练方法ADDifT(交替直接差分训练)背景与动机 LoRA(低秩适应)是一种参数高效的微调技术,广泛用于大语言模型和扩散模型(如Stable Diffusion)的定制化训练。然而,传统LoRA训练方法存在效率低和易学到无关特征(如背景或...新技术# ADDifT# Lora# LoRA模型10个月前05100
西湖大学推出一款具备自我进化能力的 GUI 代理AppAgentX西湖大学 AGI 实验室张驰团队近日推出一款具备自我进化能力的 GUI 代理——AppAgentX,它能够在持续执行任务的过程中不断学习并优化自身行为模式,从而实现更高效的操作,为自动化任务执行带来了...新技术# AI智能体# AppAgentX# GUI 代理10个月前03400
阿里巴巴提出START:显著提升大语言模型推理能力的创新工具在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...新技术# START# 大语言模型# 推理10个月前02280
TheoremExplainAgent:用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化滑铁卢大学和Vector 研究所的研究人员推出代理系统TheoremExplainAgent,用于生成长篇幅的定理解释视频(超过5分钟),并使用 Manim 动画工具实现可视化。 项目主页:https...新技术# Manim 动画# TheoremExplainAgent# 定理解释视频10个月前02360