SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    腾讯

    共 30 篇文章
    排序
    发布更新浏览点赞
    腾讯开源SongGeneration 2:歌词准确率超越 Suno v5,首个真正达到“商业级”的开源音乐大模型

    新腾讯开源SongGeneration 2:歌词准确率超越 Suno v5,首个真正达到“商业级”的开源音乐大模型

    腾讯 AI 实验室重磅发布 LeVo 2 (SongGeneration 2) —— 一个旨在打破开源 AI 音乐天花板的基础模型。经过大规模、严格的专家盲测评估,LeVo 2 在音乐性、歌词准确性和...
    语音模型# SongGeneration 2# 腾讯
    2天前
    0460
    腾讯开源 Penguin-VL:抛弃 CLIP,用大语言模型初始化视觉编码器,重塑多模态效率极限

    新腾讯开源 Penguin-VL:抛弃 CLIP,用大语言模型初始化视觉编码器,重塑多模态效率极限

    “当所有人都在堆砌数据和参数时,腾讯选择了一条更本质的路:重新设计视觉编码器,让‘看’和‘想’在同一个空间里对话。” 在视觉语言模型(VLM)领域,主流范式长期依赖通过大规模对比学习(如 CLIP、S...
    多模态模型# Penguin-VL# Penguin-VL-2B# Penguin-VL-8B
    3天前
    0130
    HY-World 1.5:腾讯混元实时交互式 3D 建模框架,24FPS + 几何一致性双突

    HY-World 1.5:腾讯混元实时交互式 3D 建模框架,24FPS + 几何一致性双突

    腾讯混元团队推出的HY-World 1.5,凭借核心模块WorldPlay流式视频扩散模型,成功打破了现有3D世界生成模型“实时交互”与“长期几何一致性”不可兼得的技术瓶颈,实现了24 FPS的实时流...
    3D模型# HY-World 1.5# 腾讯
    3个月前
    0890
    腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先

    腾讯发布混元 2.0 大模型:406B MoE 架构,256K 上下文,推理效率国内领先

    腾讯正式发布自研大模型 混元 2.0(Tencent HY 2.0),包含 HY 2.0 Think(推理优化版)与 HY 2.0 Instruct(指令对齐版)两个版本。该模型采用 混合专家(MoE...
    大语言模型# 混元 2.0 大模型# 腾讯
    3个月前
    0400
    腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行

    腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行

    在视频生成模型多追求大参数堆料的当下,腾讯混元项目组推出的HunyuanVideo-1.5走出了一条“小而精”的差异化路线。这款仅搭载83亿参数的轻量级视频生成模型,不仅实现了开源领域顶尖的视觉质量与...
    视频模型# HunyuanVideo-1.5# 腾讯
    3个月前
    01180
    SongPrep:腾讯提出自动化歌曲预处理方案,破解AIGC歌曲生成的数据难题

    SongPrep:腾讯提出自动化歌曲预处理方案,破解AIGC歌曲生成的数据难题

    在AIGC的众多分支中,歌曲生成因兼具“音乐旋律”“歌词文本”“结构韵律”的多维度创作需求,一直是技术难点。尽管互联网上有海量歌曲资源,但要将这些原始音频转化为可训练AIGC模型的“结构化数据”,传统...
    语音模型# SongPrep# 腾讯# 音乐模型
    6个月前
    01230
    腾讯推出 Think in Games (TiG) 框架:通过强化学习结合大语言模型来提升模型在游戏环境中的决策和推理能力

    腾讯推出 Think in Games (TiG) 框架:通过强化学习结合大语言模型来提升模型在游戏环境中的决策和推理能力

    腾讯推出 Think in Games (TiG) 框架,通过强化学习(Reinforcement Learning, RL)结合大语言模型(LLMs)来提升模型在游戏环境中的决策和推理能力。TiG ...
    新技术# Think in Games# 腾讯
    6个月前
    02270
    腾讯发布混元世界模型 - Voyager:单图生成 3D 场景,实现长距离沉浸式探索

    腾讯发布混元世界模型 - Voyager:单图生成 3D 场景,实现长距离沉浸式探索

    腾讯今天正式推出混元世界模型 - Voyager(HunyuanWorld-Voyager),这是一款创新的视频扩散框架。其核心能力在于:基于单张输入图像即可生成具备世界一致性的 3D 点云,支持用户...
    视频模型# HunyuanWorld-Voyager# 混元世界模型 - Voyager# 腾讯
    6个月前
    0740
    腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B:33语种互译,小模型也能大作为

    腾讯混元开源轻量级翻译模型 Hunyuan-MT-7B:33语种互译,小模型也能大作为

    腾讯混元宣布将其国际翻译模型 Hunyuan-MT-7B 正式开源,供全球开发者免费下载与本地部署。同时开源的还有业界首个翻译集成模型 Hunyuan-MT-Chimera-7B(奇美拉),支持多译文...
    大语言模型# Hunyuan-MT-7B# 翻译模型# 腾讯
    6个月前
    01960
    腾讯开源混元视频音效生成模型HunyuanVideo-Foley:端到端TV2A模型,为创作者打造高保真音视频体验

    腾讯开源混元视频音效生成模型HunyuanVideo-Foley:端到端TV2A模型,为创作者打造高保真音视频体验

    腾讯今天正式开源 HunyuanVideo-Foley —— 一个端到端的文本-视频-音频(Text-Video-to-Audio, TV2A)生成模型,专注于为视频内容自动生成高保真、语义对齐的音效...
    视频模型# HunyuanVideo-Foley# 混元视频音效生成模型# 腾讯
    7个月前
    0950
    腾讯发布混元Large-Vision:支持原生分辨率输入的旗舰级多模态理解模型

    腾讯发布混元Large-Vision:支持原生分辨率输入的旗舰级多模态理解模型

    腾讯正式推出 混元Large-Vision —— 一款面向复杂任务的旗舰级多模态大模型。该模型在文档理解、数学推理、视频分析和三维空间感知等高难度场景中表现突出,同时具备卓越的多语言支持能力,在LMA...
    多模态模型# Hunyuan-Large-Vision# 混元Large-Vision# 腾讯
    7个月前
    05680
    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    如何让一段文字或一张图片,自动生成一个可以自由探索、具备空间一致性且支持后续编辑的三维场景?这是计算机视觉与图形学长期追求的目标。 当前主流方法面临两难: 基于视频或多视角图像生成的方法,虽然能产出视...
    3D模型# 3D世界生成模型# HunyuanWorld 1.0# 腾讯
    8个月前
    01520
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    QClaw

    新QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    OpenClaw startups

    新OpenClaw startups

    OpenClaw startups页面展示了使用OpenClaw构建的创业公司,过去30天内,这些公司创造了374,207美元的营收,共有154家创业公司上榜。
    WorkBuddy

    新WorkBuddy

    WorkBuddy 是 AI 原生的桌面智能体工作台,以自然语言驱动办公自动化,一句指令即可完成数据处理、内容创作与深度分析,直接验收可交付结果,重塑职场效率标准。
    AutoClaw

    新AutoClaw

    智谱 AI 正式推出 AutoClaw —— 一款基于 OpenClaw深度定制的本地版 AI 智能体平台。它不仅内置了智谱最新内测模型 Pony-Alpha-2,更集成了强大的 AutoGLM Browser-Use 能力,实现了从“对话”到“复杂任务执行”的无缝闭环。
    查看完整榜单