百科 | 第183页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

OpenAI公开AI视频生成模型Sora：可创建长达 60 秒的视频

OpenAI公开了AI视频生成（文生视频）模型Sora，它可以创建长达 60 秒的视频，其中包含高度详细的场景、复杂的摄像机运动和具有生动情感的多个角色。官方介绍以下是官方介绍全文翻译：我们正在...

2年前

07400

多模态问答系统Lumos：结合场景文本识别和多模态大语言模型

来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos，这是一个结合了场景文本识别（Scene Text Recognition, STR）和多模态大语言模型（Multimod...

新技术 # Lumos # 场景文本识别 # 多模态大语言模型

2年前

05790

连续3D词（Continuous 3D Words）：通过文本提示来精细控制图像生成过程中的多个属性

来自牛津大学、Adobe Research的研究人员提出了一种“连续3D词（Continuous 3D Words）”的新方法，使得用户能够通过文本提示来精细控制图像生成过程中的多个属性，比如照明方向...

新技术 # AI绘画 # Continuous 3D Words # 连续3D词

2年前

06850

AI动画生成框架Keyframer：利用GPT4生成动画

来自苹果的研究人员推出一款利用大语言模型（LLMs）生成动画的框架Keyframer，它利用大语言模型（LLMs）来帮助设计师通过自然语言描述来创建动画。论文地址 Keyframer的主要功能包括从...

新技术 # AI动画 # CSS动画 # Keyframer

2年前

05160

深度估算模型Depth Anything：让照片自动感知空间距离

来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything，它是一个用于单目深度估计（Monocular Depth Estimation, MDE）的实...

新技术 # Depth Anything # 深度估算模型

2年前

05970

AI视频生成模型Animated Stickers：让静态表情包动起来

来自Meta的研究人员推出了AI视频生成模型Animated Stickers，它可以让普通表情包图片“动”起来。这项技术的核心是利用先进的文本到图像（Text-to-Image）模型，通过添加时间层...

新技术 # AI视频生成模型 # Animated Stickers # 表情包

2年前

06050

AI视频生成系统Direct-a-Video：像导演拍摄视频一样生成视频

Direct-a-Video是一个AI视频生成系统，该系统允许用户独立地为一个或多个对象和/或相机运动指定运动，就像导演拍摄视频一样。项目主页开发者提出了一种简单而有效的策略，用于分别控制对象运动...

新技术 # AI视频生成 # Direct-a-Video

2年前

06020

微软将在Windows 11 Build 26052 预览版引入新功能，将原生支持 Sudo 命令

微软已经在Windows 11 预览版 26052中引入了新功能Sudo for Windows。对于熟悉macOS和Linux系统的用户来说，sudo命令一定不会陌生。官方文档 GitHub su...

教程 # Sudo # Windows 11 # 微软

2年前

08770

基于IMUs的面部捕捉系统IMUSIC：适用于多种场景，尤其是在视觉捕捉受限的情况下

来自上海科技大学、灵秘科技、影眸科技和ElanTech的研究人员推出了一种创新面部捕捉系统IMUSIC，它基于惯性测量单元（IMUs）来捕捉面部表情，而不是依赖于传统的视觉输入。IMUSIC的设计旨在...

新技术 # IMUSIC # 影眸科技 # 灵秘科技

2年前

07510

AI音乐模型Stable Audio：结合文本提示和时间控制长音频生成

Stability AI发布AI音乐模型Stable Audio，它专注于从文本提示生成高质量、可变长度的立体声音乐和音效。这个模型特别适用于需要快速生成长形式音频内容的场景，如音乐制作、游戏音效设计...

新技术 # AI音乐 # Stability AI # Stable Audio

2年前

06010

专门解读胸部X光片的图像模型CheXagent：帮助医生提高临床决策的效率和质量

来自斯坦福大学和Stability AI的研究人员推出了一个专门解读胸部X光片的图像模型CheXagent，这个模型的目的是帮助医生更准确地分析和理解X光片，从而提高临床决策的效率和质量。项目主页 ...

新技术 # CheXagent # Stability AI # X光片

2年前

07130

阿里推出AI视频生成模型I2VGen-XL

阿里旗下达摩院推出AI视频生成模型I2VGen-XL，可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频，生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...

新技术 # AI视频 # I2VGen-XL # 阿里

2年前

06570

加载更多

百科