SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1234 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    Physion Labs推出Galileo-0:迈向可扩展的世界模型评判器

    新Physion Labs推出Galileo-0:迈向可扩展的世界模型评判器

    Physion Labs 正式推出了 Galileo-0,这是首个专为世界模型(World Models)设计的自动化评判器。它不再仅仅给生成视频打一个模糊的分数,而是通过结构化的时空推理,精准诊断视...
    世界模型# Galileo-0# Physion Labs
    22小时前
    0130
    SelVA:基于文本指令的视频选择性配音技术

    新SelVA:基于文本指令的视频选择性配音技术

    韩国科学技术院(KAIST)MAC 实验室与梨花女子大学 MMAI 实验室的研究人员共同提出了一项新任务:基于文本条件的选择性视频到音频生成(Text-Conditioned Selective Vi...
    视频模型# SelVA# 配音
    2天前
    040
    Netflix 推出 VOID:能理解物理交互的视频物体移除技术

    新Netflix 推出 VOID:能理解物理交互的视频物体移除技术

    Netflix 联合保加利亚索菲亚大学团队,发布了一项视频编辑技术——VOID (Video Object and Interaction Deletion)。 GitHub:https://gith...
    视频模型# Netflix# VOID# 物体移除
    2天前
    040
    Ai2 发布 MolmoWeb:首个开放权重、全视觉的网页智能体,打破 API 黑盒

    新Ai2 发布 MolmoWeb:首个开放权重、全视觉的网页智能体,打破 API 黑盒

    在浏览器智能体(Browser Agent)领域,工程师们长期面临一个两难选择:要么使用功能强大但完全封闭、无法审计的专有 API(如 OpenAI Operator、Anthropic Comput...
    多模态模型# MolmoWeb# 网页智能体
    2天前
    070
    Arcee 发布 Trinity-Large-Thinking:3990 亿参数“美国制造”开源模型,剑指企业自主 AI

    新Arcee 发布 Trinity-Large-Thinking:3990 亿参数“美国制造”开源模型,剑指企业自主 AI

    在开源 AI 领域长期由 Meta(Llama)和中国实验室(Qwen、MiniMax、智谱等)主导的背景下,一家总部位于旧金山的初创公司 Arcee AI 正式发布了 Trinity-Large-T...
    大语言模型# Arcee# Trinity-Large-Thinking
    2天前
    0190
    Holo Company 发布 Holo3:开源企业级计算机使用模型新标杆

    Holo Company 发布 Holo3:开源企业级计算机使用模型新标杆

    Holo Company 正式推出 Holo3,一款专为企业自动化设计的尖端计算机使用模型(Computer Use Model)。该模型在权威的 OSWorld-Verified 基准测试中取得了 ...
    多模态模型# Holo3
    3天前
    040
    京东发布 JoyAI-Image:集图像理解、文生图及指令引导编辑于一体的统一多模态基础模型

    京东发布 JoyAI-Image:集图像理解、文生图及指令引导编辑于一体的统一多模态基础模型

    京东今日正式发布 JoyAI-Image,这是一款集图像理解、文生图(T2I)及指令引导编辑于一体的统一多模态基础模型。不同于传统模型将理解与生成割裂处理,JoyAI-Image 的核心理念是构建“理...
    图像模型# JoyAI-Image# 京东
    4天前
    0390
    阿里发布全模态可控视频生成模型Wan2.7-Video:不仅是生成器,更是你的“AI 导演套件”

    阿里发布全模态可控视频生成模型Wan2.7-Video:不仅是生成器,更是你的“AI 导演套件”

    阿里巴巴今日正式发布 视频生成模型Wan2.7-Video 。这不仅是一个文生视频工具,更是一套全模态、全链路的智能视频创作系统。Wan2.7 打破了传统 AI 视频“抽卡式”生成的局限,真正实现了让...
    早报视频模型# Wan2.7-Video# 阿里巴巴
    4天前
    0210
    Marco-Nano-Base:阿里出品,8B 总参数仅激活 0.6B 的极致稀疏多语言模型

    Marco-Nano-Base:阿里出品,8B 总参数仅激活 0.6B 的极致稀疏多语言模型

    Marco-Nano-Base 是由 阿里巴巴国际数字商业集团 (AIDC) 最新推出的紧凑型混合专家(MoE)大语言模型。作为 Marco-MoE 家族的最新成员,它通过极致的稀疏化设计,在保持 8...
    大语言模型# Marco-Nano-Base
    4天前
    0100
    OmniWeaving:开源视频生成的“全能王”,首个具备推理与自由组合能力的统一模型

    OmniWeaving:开源视频生成的“全能王”,首个具备推理与自由组合能力的统一模型

    OmniWeaving 是由 腾讯混元、浙江大学 和 南洋理工大学的研究人员推出的基于HunyuanVideo-1.5的视频生成模型。它填补了开源社区与闭源顶尖系统(如 Seedance-2.0)之间...
    视频模型# HunyuanVideo-1.5# OmniWeaving# 腾讯
    4天前
    0190
    Qwopus3.5-27B-v3:颠覆“先想后做”,首创“先行动后优化”的代理编程模型

    Qwopus3.5-27B-v3:颠覆“先想后做”,首创“先行动后优化”的代理编程模型

    开发者 Jackrong 正式发布了 Qwopus3.5-27B-v3,这是一款基于 Qwen3.5-27B 深度优化的推理增强模型。与前代及市面上大多数追求“长思维链”的模型不同,Qwopus-v3...
    大语言模型# Qwopus3.5-27B-v3
    5天前
    0790
    京东发布 JoyMed:全球首个自适应推理医疗大模型,重新定义 AI 诊断效率与精度

    京东发布 JoyMed:全球首个自适应推理医疗大模型,重新定义 AI 诊断效率与精度

    京东推出 JoyMed,这是一款具有里程碑意义的医疗多模态基础模型。与当前主流医疗 AI 要么“盲目推理”浪费算力,要么“缺乏思考”导致误诊不同,JoyMed 首创了 自适应推理机制(Adaptive...
    大语言模型# JoyMed# 京东# 医疗大模型
    5天前
    0150
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    查看完整榜单