SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    VITA-1.5

    共 1 篇文章
    排序
    发布更新浏览点赞
    开源多模态视频语音大模型VITA-1.5: 基于Qwen2.5模型,实现接近实时的视觉和语音交互能力

    开源多模态视频语音大模型VITA-1.5: 基于Qwen2.5模型,实现接近实时的视觉和语音交互能力

    随着多模态大语言模型(MLLMs)的发展,如何有效地整合视觉、语言和语音成为了人工智能领域面临的一个重要挑战。VITA-1.5 是由南京大学(NJU)、腾讯优图实验室(Tencent Youtu La...
    语音模型# Qwen2.5模型# VITA-1.5
    1年前
    03390
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Protenix

    Protenix

    Protenix 是面向高精度生物分子结构预测构建的开源体系,也是字节跳动 Seed 团队在计算生物学领域,为推动开放、可复现、可扩展研究工具迈出的关键一步。Protenix-v1 是首个在严格对等条件下性能超越 AlphaFold 3 的全开源生物分子结构预测模型,支持蛋白质、核酸、配体等多类型分子的通用结构预测,不仅开放模型权重,同时完整开源训练数据 pipeline、MSA 处理流程与配套工具,让研究与工业界均可基于这套体系进行二次开发、标准化评估与规模化应用。
    InstaSD

    InstaSD

    InstaSD 是一个云平台,旨在让创意团队轻松管理并部署ComfyUI工作流,主要用于生成图像和视频。它的目标是让用户无需编码技能就能使用,特别适合非技术用户。
    stagewise

    stagewise

    Stagewise 是一个浏览器工具栏,能够将您的前端用户界面连接到代码编辑器中的AI代理。这意味着您可以直接在网页上选择元素,AI代理会根据您的操作提供实时的代码修改建议,真正做到“指哪改哪”。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    查看完整榜单