百科 | 第71页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型视频生成框架GS-DiT：通过伪4D高斯场实现对视频内容的精确4D控制

香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT，旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...

新技术 # GS-DiT # 视频生成

12个月前

03170

Genesis：用于机器人技术及更广泛领域的生成式和通用物理引擎

Genesis 是一个为通用机器人、具身AI和物理AI应用设计的综合性物理仿真平台。它结合了多种功能，旨在提供一个高效、灵活且用户友好的工具，帮助研究人员和开发者在虚拟环境中模拟复杂的物理现象、生成高...

新技术 # Genesis # 通用物理引擎

1年前

03170

ViewExtrapolator：于在新视角合成领域中进行新视角外推

南洋理工大学和中国科学院大学的研究人员推出一个名为ViewExtrapolator的新方法，它用于在新视角合成（novel view synthesis, NVS）领域中进行新视角外推（novel v...

新技术 # ViewExtrapolator

1年前

03170

新型故事视频生成框架DreamRunner：根据文本脚本生成长篇、多动作、多场景的视频，适用于CogVideoX模型

故事讲述视频生成（SVG）是一项旨在从文本脚本创建长时间、多动作、多场景视频的任务。这种技术在媒体和娱乐领域的内容创作中具有巨大潜力，但同时也面临着诸多挑战，包括但不限于：物体需要展示一系列精细、复...

新技术 # DreamRunner # 视频生成

1年前

03170

基于FLUX模型的图像定制框架DreamO官方原生ComfyUI节点：DreamO Comfyui

之前介绍过的基于FLUX模型的图像定制框架DreamO，官方团队在近期推出了ComfyUI 原生实现插件，DreamO支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成该...

百科 # DreamO # DreamO Comfyui # FLUX模型

7个月前

03160

阿里巴巴宣布夸克升级：打造无边界的“AI超级框”

阿里巴巴今日宣布，夸克正式升级为无边界的“AI超级框”，基于阿里通义领先的推理及多模态大模型，为用户提供一站式、全能化的AI服务。从对话式AI到“AI超级框” 与传统的对话式AI不同，夸克此次升级将...

早报 # AI超级框 # 夸克 # 阿里巴巴

9个月前

03160

谷歌发布 Gemma 3：您可以在单个 GPU 或 TPU 上运行的最强大模型

谷歌在今天宣布推出 Gemma 3，声称这是目前可以在单个 GPU 上运行的最强大的 AI 模型。这款全新升级的“开放”AI 模型不仅能够处理文本，还能解读图像和短视频，进一步拓展了其应用场景。 Ge...

早报 # Gemma 3 # Gemmaverse # 大语言模型

9个月前

03160

OpenAI推出Flex处理：更便宜、更慢的API新选择

为了在激烈的市场竞争中更好地应对谷歌等竞争对手，OpenAI近日推出了名为“Flex处理模式”的新API服务。这一服务通过牺牲响应速度和资源稳定性，为用户提供更优惠的模型使用价格。定价策略： o3模...

早报 # API # Flex # OpenAI

8个月前

03150

谷歌从负责AI团队网页中删除“多样性”和“公平”等词语

谷歌近期对其负责AI和以人为中心技术（RAI-HCT）团队的网页进行了更新，删除了“多样性”和“公平”等词语的提及。这一变化引发了外界的关注，因为它涉及到该公司在AI伦理和社会影响方面的立场调整。谷...

早报 # AI # DEI # 谷歌

10个月前

03150

腾讯推出新型视频分词器Divot：统一视频的理解和生成

近年来，大语言模型（LLMs）在图像理解和生成方面取得了显著进展，尤其是在将图像编码为离散标记并结合LLMs进行多模态任务时。然而，将这一成功扩展到视频领域面临着更大的挑战，因为视频不仅包含空间信息...

新技术 # Divot # 视频分词器

1年前

03150

百度发布GenFlow3.0：文库与网盘升级多模态AI办公系统

2025年11月13日，百度世界2025大会在北京召开。会上，百度正式发布 GenFlow3.0，作为百度文库与百度网盘的底层智能体平台，该版本已完成全端上线，并同步推出两大核心智能体：Office ...

早报 # GenFlow3.0 # 百度 # 百度文库

1个月前

03140

谷歌确认将在Windows 11的Chrome浏览器中集成Gemini，并预告重大AI升级

谷歌近日在反垄断诉讼中的一份幻灯片意外曝光了其在Windows平台上的AI战略蓝图。谷歌计划将 Gemini Live 集成到 Windows 11 和 Windows 10 的 Chrome 浏览器...

百科 # Gemini # Windows 11 # 谷歌

7个月前

03140

加载更多

百科

新型视频生成框架GS-DiT：通过伪4D高斯场实现对视频内容的精确4D控制

Genesis：用于机器人技术及更广泛领域的生成式和通用物理引擎

ViewExtrapolator：于在新视角合成领域中进行新视角外推

新型故事视频生成框架DreamRunner：根据文本脚本生成长篇、多动作、多场景的视频，适用于CogVideoX模型

基于FLUX模型的图像定制框架DreamO官方原生ComfyUI节点：DreamO Comfyui

阿里巴巴宣布夸克升级：打造无边界的“AI超级框”

谷歌发布 Gemma 3：您可以在单个 GPU 或 TPU 上运行的最强大模型

OpenAI推出Flex处理：更便宜、更慢的API新选择

谷歌从负责AI团队网页中删除“多样性”和“公平”等词语

腾讯推出新型视频分词器Divot：统一视频的理解和生成

百度发布GenFlow3.0：文库与网盘升级多模态AI办公系统

谷歌确认将在Windows 11的Chrome浏览器中集成Gemini，并预告重大AI升级

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

Tripo

ITELLOU

百科

网址

人生 K 线

Fogsight (雾象)

朱雀大模型检测

新PDF Craft

Tripo

ITELLOU