SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    腾讯混元

    共 7 篇文章
    排序
    发布更新浏览点赞
    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft,为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发,生成...
    新技术# Hunyuan-GameCraft# 腾讯混元
    3周前
    0590
    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出基于扩散模型的条件控制方法 HunyuanPortrait ,用于高度可控且逼真的肖像动画生成。该方法通过隐式表示来控制肖像动画,能够利用单张肖像图像作为外观参考和视频片段作为驱动模...
    视频模型# HunyuanPortrait# 腾讯混元
    2个月前
    0570
    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    近年来,音频驱动人物动画(Audio-driven Avatar Animation)取得了显著进展,但仍有几个关键挑战尚未完全解决: 如何在保持角色一致性的前提下生成高度动态的视频; 实现角色与音频...
    视频模型# HunyuanVideo-Avatar# 腾讯混元# 视频生成模型
    2个月前
    01010
    微软AI研究团队WizardLM被爆已加入腾讯混元项目组,腾讯加速布局AI领域

    微软AI研究团队WizardLM被爆已加入腾讯混元项目组,腾讯加速布局AI领域

    近日,位于北京的微软AI研究小组 WizardLM 被曝已加入腾讯。这一消息由 WizardLM 团队的核心成员在社交媒体上证实。腾讯正通过吸纳顶尖AI人才进一步强化其AI研发能力。 周二,Wizar...
    早报# WizardLM# 微软# 腾讯混元
    2个月前
    0850
    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    腾讯混元团队与InstantX团队近日联合推出了一种全新的角色定制方法——InstantCharacter。这一方法无需调优,仅通过单张图像即可实现高保真、文本可控且角色一致的图像生成,支持多种下游任...
    图像模型# FLUX模型# InstantCharacter# InstantX
    3个月前
    03090
    降低生成步数!腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

    降低生成步数!腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

    腾讯发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元...
    插件# Hunyuan-DiT# 混元 DiT# 腾讯混元
    1年前
    01,2480
    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT,它特别擅长理解中文和英文的文本提示,并据此生成图像,Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话,生成并优化图像...
    新技术# Hunyuan-DiT# 提示词# 文生图模型
    1年前
    06370
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Proxy

    Proxy

    Proxy是一款非常实用的 AI代理工具,虽然它并不完美,但在处理日常琐事方面表现出色。它的核心优势在于简单易用、无需复杂设置,并且能够主动解决问题。对于忙碌的用户来说,Proxy 是一个值得信赖的数字助手,可以显著提高效率。
    通义万象

    通义万象

    通义万象是阿里云旗下的图像及视频生成平台,凭借其强大的多模态生成能力,正在引领生成式 AI 的发展。除了传统的文生图能力,通义万象现已支持文生视频、图生视频等多种功能,并在插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化应用中表现出色。
    Vibe Kanban

    新Vibe Kanban

    Vibe Kanban 不只是一个任务管理面板,它是人与 AI 协作的新界面。它帮助开发者更好地组织、调度和评估 AI 编码代理的工作成果,从而释放人类工程师的最大价值。
    DiffRhythm(谛韵)

    DiffRhythm(谛韵)

    DiffRhythm(中文名“谛韵”)是由西北工业大学音频、语音与语言处理研究组(ASLP Lab)和香港中文大学(深圳)深圳大数据研究院联合开发的新型端到端全长度歌曲生成模型。基于潜扩散(Latent Diffusion)技术,DiffRhythm 能够快速生成包含人声和伴奏的完整歌曲,解决了现有音乐生成方法的诸多局限性。
    查看完整榜单