SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2231 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...
    新技术# GS-DiT# 视频生成
    12个月前
    03170
    Genesis:用于机器人技术及更广泛领域的生成式和通用物理引擎

    Genesis:用于机器人技术及更广泛领域的生成式和通用物理引擎

    Genesis 是一个为通用机器人、具身AI和物理AI应用设计的综合性物理仿真平台。它结合了多种功能,旨在提供一个高效、灵活且用户友好的工具,帮助研究人员和开发者在虚拟环境中模拟复杂的物理现象、生成高...
    新技术# Genesis# 通用物理引擎
    1年前
    03170
    ViewExtrapolator:于在新视角合成领域中进行新视角外推

    ViewExtrapolator:于在新视角合成领域中进行新视角外推

    南洋理工大学和中国科学院大学的研究人员推出一个名为ViewExtrapolator的新方法,它用于在新视角合成(novel view synthesis, NVS)领域中进行新视角外推(novel v...
    新技术# ViewExtrapolator
    1年前
    03170
    新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型

    新型故事视频生成框架DreamRunner:根据文本脚本生成长篇、多动作、多场景的视频,适用于CogVideoX模型

    故事讲述视频生成(SVG)是一项旨在从文本脚本创建长时间、多动作、多场景视频的任务。这种技术在媒体和娱乐领域的内容创作中具有巨大潜力,但同时也面临着诸多挑战,包括但不限于: 物体需要展示一系列精细、复...
    新技术# DreamRunner# 视频生成
    1年前
    03170
    基于FLUX模型的图像定制框架DreamO官方原生ComfyUI节点:DreamO Comfyui

    基于FLUX模型的图像定制框架DreamO官方原生ComfyUI节点:DreamO Comfyui

    之前介绍过的基于FLUX模型的图像定制框架DreamO,官方团队在近期推出了ComfyUI 原生实现插件,DreamO支持多种图像定制任务,同时实现多种条件(如身份、主体、风格、背景等)的无缝集成 该...
    百科# DreamO# DreamO Comfyui# FLUX模型
    7个月前
    03160
    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴今日宣布,夸克正式升级为无边界的“AI超级框”,基于阿里通义领先的推理及多模态大模型,为用户提供一站式、全能化的AI服务。 从对话式AI到“AI超级框” 与传统的对话式AI不同,夸克此次升级将...
    早报# AI超级框# 夸克# 阿里巴巴
    9个月前
    03160
    谷歌发布 Gemma 3:您可以在单个 GPU 或 TPU 上运行的最强大模型

    谷歌发布 Gemma 3:您可以在单个 GPU 或 TPU 上运行的最强大模型

    谷歌在今天宣布推出 Gemma 3,声称这是目前可以在单个 GPU 上运行的最强大的 AI 模型。这款全新升级的“开放”AI 模型不仅能够处理文本,还能解读图像和短视频,进一步拓展了其应用场景。 Ge...
    早报# Gemma 3# Gemmaverse# 大语言模型
    9个月前
    03160
    OpenAI推出Flex处理:更便宜、更慢的API新选择

    OpenAI推出Flex处理:更便宜、更慢的API新选择

    为了在激烈的市场竞争中更好地应对谷歌等竞争对手,OpenAI近日推出了名为“Flex处理模式”的新API服务。这一服务通过牺牲响应速度和资源稳定性,为用户提供更优惠的模型使用价格。 定价策略: o3模...
    早报# API# Flex# OpenAI
    8个月前
    03150
    谷歌从负责AI团队网页中删除“多样性”和“公平”等词语

    谷歌从负责AI团队网页中删除“多样性”和“公平”等词语

    谷歌近期对其负责AI和以人为中心技术(RAI-HCT)团队的网页进行了更新,删除了“多样性”和“公平”等词语的提及。这一变化引发了外界的关注,因为它涉及到该公司在AI伦理和社会影响方面的立场调整。 谷...
    早报# AI# DEI# 谷歌
    10个月前
    03150
    腾讯推出新型视频分词器Divot:统一视频的理解和生成

    腾讯推出新型视频分词器Divot:统一视频的理解和生成

    近年来,大语言模型(LLMs)在图像理解和生成方面取得了显著进展,尤其是在将图像编码为离散标记并结合LLMs进行多模态任务时。然而,将这一成功扩展到视频领域面临着更大的挑战,因为视频不仅包含空间信息...
    新技术# Divot# 视频分词器
    1年前
    03150
    百度发布GenFlow3.0:文库与网盘升级多模态AI办公系统

    百度发布GenFlow3.0:文库与网盘升级多模态AI办公系统

    2025年11月13日,百度世界2025大会在北京召开。会上,百度正式发布 GenFlow3.0,作为百度文库与百度网盘的底层智能体平台,该版本已完成全端上线,并同步推出两大核心智能体:Office ...
    早报# GenFlow3.0# 百度# 百度文库
    1个月前
    03140
    谷歌确认将在Windows 11的Chrome浏览器中集成Gemini,并预告重大AI升级

    谷歌确认将在Windows 11的Chrome浏览器中集成Gemini,并预告重大AI升级

    谷歌近日在反垄断诉讼中的一份幻灯片意外曝光了其在Windows平台上的AI战略蓝图。谷歌计划将 Gemini Live 集成到 Windows 11 和 Windows 10 的 Chrome 浏览器...
    百科# Gemini# Windows 11# 谷歌
    7个月前
    03140
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    PDF Craft

    新PDF Craft

    PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单