SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    模型

    共 1051 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    谷歌推出EmbeddingGemma:专为设备端设计的高性能开放嵌入模型

    谷歌推出EmbeddingGemma:专为设备端设计的高性能开放嵌入模型

    在构建轻量级、隐私优先的 AI 应用时,如何在资源受限的设备上实现高质量语义理解,是一大挑战。传统的嵌入模型往往依赖云端计算,带来延迟、隐私和离线可用性问题。 为此,谷歌推出 EmbeddingGem...
    大语言模型# EmbeddingGemma# 嵌入模型# 谷歌
    4个月前
    01710
    Instinct:由 Continue 打造的全球首个开放 Next Edit 模型

    Instinct:由 Continue 打造的全球首个开放 Next Edit 模型

    在代码编辑中,真正消耗时间的往往不是“写代码”,而是重构、调整、维护与迭代。传统自动补全工具只能在光标处插入文本,面对复杂的多行修改仍需手动操作,打断开发节奏。 为此,开发工具团队 Continue ...
    大语言模型# Continue# Instinct# Next Edit 模型
    4个月前
    01620
    月之暗面发布 Kimi K2 新版本(0905):编程能力再升级,支持 256K 上下文与高速 API

    月之暗面发布 Kimi K2 新版本(0905):编程能力再升级,支持 256K 上下文与高速 API

    月之暗面宣布推出其旗舰模型 Kimi K2 的最新版本(0905),重点针对真实编程任务进行优化,在代码生成能力、上下文处理、API 性能和平台兼容性等方面实现多项重要升级。 此次更新聚焦于提升模型在...
    大语言模型# Kimi K2# Kimi-K2-Instruct-0905# 月之暗面
    4个月前
    01760
    PosterGen:用多智能体系统自动生成高质量学术海报

    PosterGen:用多智能体系统自动生成高质量学术海报

    对研究人员而言,撰写论文只是第一步。在会议展示阶段,如何将复杂的研究内容浓缩成一张信息清晰、视觉美观、叙事连贯的学术海报,是一项耗时且需要设计经验的任务。 尽管已有自动化工具尝试解决这一问题,但大多数...
    图像模型# PosterGen# 学术海报
    4个月前
    03070
    字节跳动发布UI-TARS-2:一个面向真实GUI交互的原生代理模型

    字节跳动发布UI-TARS-2:一个面向真实GUI交互的原生代理模型

    在图形用户界面(GUI)日益复杂的背景下,如何让AI代理像人类一样流畅操作系统、完成多步骤任务,是自动化与智能体研究的重要方向。然而,当前自主GUI代理的发展仍面临诸多挑战:训练数据难以规模化获取、多...
    大语言模型# UI-TARS-2
    4个月前
    01410
    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    大语言模型知识获取研究新工具:特拉维夫大学与麦吉尔大学推出 LMEnt 套件

    语言模型正在越来越多地承担需要世界知识的任务:回答问题、生成事实性文本、辅助决策……但一个根本性问题仍未解决: 模型是如何从训练数据中“学会”知识的? 我们训练模型时喂的是文本,但它输出的却是“信念...
    大语言模型# LMEnt# 大语言模型
    4个月前
    01390
    InfoSeek:智源研究院提出可扩展的深度研究数据合成框架

    InfoSeek:智源研究院提出可扩展的深度研究数据合成框架

    在大模型迈向“自主思考”的过程中,一个关键瓶颈逐渐显现: 现有基准任务太简单,无法真正测试模型的复杂推理能力。 Natural Questions、HotpotQA 等主流数据集虽然推动了多跳推理的发...
    大语言模型# InfoSeek# 深度研究
    4个月前
    02200
    OpenVision 2:更高效、更对齐的生成式视觉编码器

    OpenVision 2:更高效、更对齐的生成式视觉编码器

    在多模态大模型(MLLM)快速发展的今天,一个核心问题日益凸显:预训练视觉编码器的训练方式是否真的适配下游任务? 传统方法依赖图像-文本对比学习(如 CLIP),但这类模型在接入 LLM 进行微调时...
    多模态模型# OpenVision 2# 视觉编码器
    4个月前
    01360
    Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

    Pusa Wan2.2 V1.0:将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构

    Pusa Wan2.2 V1.0 将开创性的 Pusa 范式扩展到先进的 Wan2.2-T2V-A14B 架构,该架构采用 MoE DiT 设计,包含独立的噪声和高噪声模型。这种架构提供了增强的质量控...
    视频模型# Pusa Wan2.2 V1.0# Wan2.2-T2V-A14B
    4个月前
    01800
    快手 Keye 团队发布Keye-VL-1.5 :支持 128K 上下文的视频理解大模型

    快手 Keye 团队发布Keye-VL-1.5 :支持 128K 上下文的视频理解大模型

    在多模态大模型的竞争中,视频理解正成为下一个关键战场。相比图像,视频包含更丰富的时空信息——动作的起止、事件的因果、场景的演变。要让AI真正“看懂”一段视频,不仅需要识别画面内容,还要理解时间逻辑与行...
    多模态模型# Keye-VL-1.5# 快手# 视频理解大模型
    4个月前
    0700
    ElevenLabs 发布音效生成模型SFX v2:音效生成更真实,支持无缝循环

    ElevenLabs 发布音效生成模型SFX v2:音效生成更真实,支持无缝循环

    ElevenLabs 今天推出了其音效生成模型 SFX v2,在音质、功能和使用体验上实现多项重要升级。现在,用户只需输入一段文字提示,即可生成高质量、可循环的环境音效,适用于有声书、播客、视频、冥想...
    语音模型# ElevenLabs# SFX v2# 音效生成模型
    4个月前
    01570
    MetaFold:用语言指导机器人叠衣服,还能通用于不同衣物

    MetaFold:用语言指导机器人叠衣服,还能通用于不同衣物

    让机器人叠衣服,听起来简单,做起来极难。 布料柔软、易变形,同一件T恤每次摆放的形态都不同。这种高度的可变性使得机器人难以像抓取刚性物体那样,靠预设动作完成操作。更别说还要应对不同款式——无袖、短袖...
    多模态模型# MetaFold
    4个月前
    0870
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    CachyOS

    CachyOS

    CachyOS是基于Arch Linux的Linux发行。它专注于速度和安全改进:缺省的Linux内核使用BORE调度器进行了深度优化,而桌面软件包使用了LTO和x86-64-v3优化项、安全标记、性能提升项进行编译。可用的桌面环境及窗口管理器包括KDE Plasma、GNOME、Xfce、i3、bspwm、LXQt、Openbox、Wayfire、Cutefish。CachyOS还带有图形化及命令行的安装程序,提供基于Firefox的名为Cachy-Browser的浏览器,浏览器做了安装增强和性能优化。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单