OpenAI公开AI视频生成模型Sora:可创建长达 60 秒的视频OpenAI公开了AI视频生成(文生视频)模型Sora,它可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。 官方介绍 以下是官方介绍全文翻译: 我们正在...新技术# AI视频生成模型# OpenAI# Sora2年前07400
多模态问答系统Lumos:结合场景文本识别和多模态大语言模型来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景文本识别(Scene Text Recognition, STR)和多模态大语言模型(Multimod...新技术# Lumos# 场景文本识别# 多模态大语言模型2年前05790
连续3D词(Continuous 3D Words):通过文本提示来精细控制图像生成过程中的多个属性来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词(Continuous 3D Words)”的新方法,使得用户能够通过文本提示来精细控制图像生成过程中的多个属性,比如照明方向...新技术# AI绘画# Continuous 3D Words# 连续3D词2年前06850
AI动画生成框架Keyframer:利用GPT4生成动画来自苹果的研究人员推出一款利用大语言模型(LLMs)生成动画的框架Keyframer,它利用大语言模型(LLMs)来帮助设计师通过自然语言描述来创建动画。 论文地址 Keyframer的主要功能包括从...新技术# AI动画# CSS动画# Keyframer2年前05160
深度估算模型Depth Anything:让照片自动感知空间距离来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything,它是一个用于单目深度估计(Monocular Depth Estimation, MDE)的实...新技术# Depth Anything# 深度估算模型2年前05970
AI视频生成模型Animated Stickers:让静态表情包动起来来自Meta的研究人员推出了AI视频生成模型Animated Stickers,它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像(Text-to-Image)模型,通过添加时间层...新技术# AI视频生成模型# Animated Stickers# 表情包2年前06050
AI视频生成系统Direct-a-Video:像导演拍摄视频一样生成视频Direct-a-Video是一个AI视频生成系统,该系统允许用户独立地为一个或多个对象和/或相机运动指定运动,就像导演拍摄视频一样。 项目主页 开发者提出了一种简单而有效的策略,用于分别控制对象运动...新技术# AI视频生成# Direct-a-Video2年前06020
微软将在Windows 11 Build 26052 预览版引入新功能,将原生支持 Sudo 命令微软已经在Windows 11 预览版 26052中引入了新功能Sudo for Windows。对于熟悉macOS和Linux系统的用户来说,sudo命令一定不会陌生。 官方文档 GitHub su...教程# Sudo# Windows 11# 微软2年前08770
基于IMUs的面部捕捉系统IMUSIC:适用于多种场景,尤其是在视觉捕捉受限的情况下来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC,它基于惯性测量单元(IMUs)来捕捉面部表情,而不是依赖于传统的视觉输入。IMUSIC的设计旨在...新技术# IMUSIC# 影眸科技# 灵秘科技2年前07510
AI音乐模型Stable Audio:结合文本提示和时间控制长音频生成Stability AI发布AI音乐模型Stable Audio,它专注于从文本提示生成高质量、可变长度的立体声音乐和音效。这个模型特别适用于需要快速生成长形式音频内容的场景,如音乐制作、游戏音效设计...新技术# AI音乐# Stability AI# Stable Audio2年前06010
专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量来自斯坦福大学和Stability AI的研究人员推出了一个专门解读胸部X光片的图像模型CheXagent,这个模型的目的是帮助医生更准确地分析和理解X光片,从而提高临床决策的效率和质量。 项目主页 ...新技术# CheXagent# Stability AI# X光片2年前07130
阿里推出AI视频生成模型I2VGen-XL阿里旗下达摩院推出AI视频生成模型I2VGen-XL,可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频,生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...新技术# AI视频# I2VGen-XL# 阿里2年前06570