SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    腾讯混元

    共 12 篇文章
    排序
    发布更新浏览点赞
    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元项目组正式发布并开源HunyuanImage-3.0——当前开源社区规模最大、性能最强的文生图模型。该模型总参数量突破800亿,推理时每token仅激活130亿参数(兼顾性能与效率),基于原生...
    图像模型# HunyuanImage-3.0# 腾讯混元
    2个月前
    05290
    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元项目组近日发布 Hunyuan3D-Omni ——一个面向 3D 资产生成的统一框架,解决传统单图生成 3D 模型时存在的几何失真、姿态不可控等问题。 地址:https://3d.hunyua...
    3D模型# Hunyuan3D-Omni# 腾讯混元
    2个月前
    01130
    腾讯混元联合高校提出 Direct-Align:用“一步恢复”实现扩散模型的高效偏好对齐

    腾讯混元联合高校提出 Direct-Align:用“一步恢复”实现扩散模型的高效偏好对齐

    在文生图模型日益成熟的今天,提升生成质量已不再是唯一目标——如何让图像真正符合人类的审美偏好,成为更高阶的挑战。 现有方法通常依赖强化学习或可微奖励机制,将模型输出与人类偏好对齐。但这些方法普遍存在两...
    图像模型# Direct-Align# flux.1-dev-SRPO# 腾讯混元
    3个月前
    01560
    腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

    腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

    继此前开源大尺寸模型后,腾讯混元团队近日推出四款全新小尺寸开源模型,参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计,可在消费级显卡、笔记本电脑、手机、智能座舱及...
    大语言模型# 腾讯混元
    4个月前
    03660
    腾讯混元提出 X-Omni:用强化学习突破离散自回归图像生成瓶颈

    腾讯混元提出 X-Omni:用强化学习突破离散自回归图像生成瓶颈

    在当前多模态生成模型的发展中,研究者始终在探索一个统一的建模范式:能否用类似语言模型“预测下一个词”的方式,来生成图像?这种被称为“下一令牌预测(next-token prediction)”的自回归...
    图像模型# X-Omni# 腾讯混元
    4个月前
    02750
    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft,为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发,生成...
    新技术# Hunyuan-GameCraft# 腾讯混元
    6个月前
    02930
    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出数字人头像生成模型 HunyuanPortrait :用于高度可控且逼真的肖像动画生成

    腾讯混元项目组推出基于扩散模型的条件控制方法 HunyuanPortrait ,用于高度可控且逼真的肖像动画生成。该方法通过隐式表示来控制肖像动画,能够利用单张肖像图像作为外观参考和视频片段作为驱动模...
    视频模型# HunyuanPortrait# 腾讯混元
    6个月前
    01740
    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    腾讯混元推出HunyuanVideo-Avatar:音频驱动、情感可控、支持多角色的虚拟人视频生成模型

    近年来,音频驱动人物动画(Audio-driven Avatar Animation)取得了显著进展,但仍有几个关键挑战尚未完全解决: 如何在保持角色一致性的前提下生成高度动态的视频; 实现角色与音频...
    视频模型# HunyuanVideo-Avatar# 腾讯混元# 视频生成模型
    6个月前
    02840
    微软AI研究团队WizardLM被爆已加入腾讯混元项目组,腾讯加速布局AI领域

    微软AI研究团队WizardLM被爆已加入腾讯混元项目组,腾讯加速布局AI领域

    近日,位于北京的微软AI研究小组 WizardLM 被曝已加入腾讯。这一消息由 WizardLM 团队的核心成员在社交媒体上证实。腾讯正通过吸纳顶尖AI人才进一步强化其AI研发能力。 周二,Wizar...
    早报# WizardLM# 微软# 腾讯混元
    7个月前
    01940
    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    基于Flux模型的创新角色生成框架InstantCharacter:单张图像生成高质量角色图像

    腾讯混元团队与InstantX团队近日联合推出了一种全新的角色定制方法——InstantCharacter。这一方法无需调优,仅通过单张图像即可实现高保真、文本可控且角色一致的图像生成,支持多种下游任...
    图像模型# FLUX模型# InstantCharacter# InstantX
    8个月前
    04790
    降低生成步数!腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

    降低生成步数!腾讯发布混元文生图开源大模型的蒸馏模型和ComfyUI节点及工作流

    腾讯发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元...
    插件# Hunyuan-DiT# 混元 DiT# 腾讯混元
    2年前
    01,3370
    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT,它特别擅长理解中文和英文的文本提示,并据此生成图像,Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话,生成并优化图像...
    新技术# Hunyuan-DiT# 提示词# 文生图模型
    2年前
    07240
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    查看完整榜单