SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    字节跳动

    共 79 篇文章
    排序
    发布更新浏览点赞
    字节跳动 USO 模型 ComfyUI 原生工作流指南:实现风格与主体统一的 AI 生成

    字节跳动 USO 模型 ComfyUI 原生工作流指南:实现风格与主体统一的 AI 生成

    在 AI 图像生成中,两个核心挑战长期并存: 主体一致性:如何让同一个角色在不同场景中保持身份不变? 风格迁移:如何将参考图的艺术风格准确迁移到新内容上? 传统方案往往需要多个模型、复杂调参,或依赖 ...
    工作流# USO 模型# 字节跳动
    3个月前
    07790
    字节跳动推出 UltraMemV2:在低内存访问下,追平8专家MoE性能

    字节跳动推出 UltraMemV2:在低内存访问下,追平8专家MoE性能

    在大模型稀疏化架构的演进中,效率与性能的权衡始终是核心挑战。 MoE(Mixture of Experts)通过仅激活部分专家实现高效推理,但其频繁的跨专家参数访问带来了高昂的内存开销。为解决这一问题...
    新技术# UltraMemV2# 字节跳动
    4个月前
    0800
    字节跳动推出 USO:统一风格与主体生成模型,开源全方案赋能创作

    字节跳动推出 USO:统一风格与主体生成模型,开源全方案赋能创作

    字节跳动智能创作实验室UXO项目组近期发布了UXO家族的新成员——USO(统一风格-主体优化定制模型)。这款模型打破了现有技术中“风格驱动”与“主体驱动”生成相互孤立的困境,能在单一框架下自由组合任意...
    图像模型# USO# 字节跳动# 统一风格与主体生成模型
    4个月前
    04380
    字节跳动发布OmniHuman-1.5:模拟人类双重认知,生成语义连贯的高逼真角色动画

    字节跳动发布OmniHuman-1.5:模拟人类双重认知,生成语义连贯的高逼真角色动画

    字节跳动近期推出新型视频角色生成框架 OmniHuman-1.5,核心突破在于模拟人类“系统1(快速直觉反应)+系统2(缓慢深思规划)”的双重认知过程,实现从“单一图像+语音轨道”到“物理逼真、语义连...
    视频模型# OmniHuman-1.5# 字节跳动
    4个月前
    0700
    字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0:同时支持文生图、图生视频及文生图生成

    字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0:同时支持文生图、图生视频及文生图生成

    字节跳动 Waver 项目组近期正式推出 Waver 1.0 一体化视频生成模型,凭借多模态生成能力、高分辨率支持及卓越的运动建模效果,在视频生成领域实现重要突破,为工业级视频创作需求提供了全新解决方...
    视频模型# Waver 1.0# 字节跳动# 视频生成
    4个月前
    05650
    字节跳动 Seed 团队发布 Seed-OSS 系列开源模型:36B 参数,512K 长上下文,可灵活调整思考长度

    字节跳动 Seed 团队发布 Seed-OSS 系列开源模型:36B 参数,512K 长上下文,可灵活调整思考长度

    字节跳动Seed团队正式推出Seed-OSS系列开放权重模型,该系列均为36B参数规模,聚焦长上下文处理、推理能力与代理任务优化,以Apache-2.0许可证开源,为开发者与研究社区提供高实用性工具...
    大语言模型# Seed-OSS# 字节跳动
    4个月前
    02600
    字节跳动推出具备长期记忆的多模态智能体 M3-Agent

    字节跳动推出具备长期记忆的多模态智能体 M3-Agent

    字节跳动 Seed 团队推出新型多模态智能体框架M3-Agent ,首次实现了以实体为中心、支持长期记忆积累的自主推理能力。 项目主页:https://m3-agent.github.io GitHu...
    多模态模型# M3-Agent# 多模态智能体# 字节跳动
    4个月前
    02270
    字节跳动开源 VeOmni:一个面向全模态大模型的 PyTorch 原生训练框架

    字节跳动开源 VeOmni:一个面向全模态大模型的 PyTorch 原生训练框架

    在大模型从“能说”向“能看、能听、能理解”演进的当下,多模态统一模型(Omni-Modal LLMs)正成为技术前沿。然而,训练一个同时处理文本、图像、语音和视频的全能模型,仍面临工程复杂、扩展困难...
    多模态模型# VeOmni# 多模态统一模型# 字节跳动
    4个月前
    01800
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    4个月前
    04690
    字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover

    字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover

    字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover,Seed-Prover 通过结合 LLM 的推理能力和形式化语言(如 Lean)的验证能力,实现了对数学...
    大语言模型# Seed-Prover# 字节跳动# 自动化定理证明
    4个月前
    0950
    字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速

    字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速

    字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版,它采用离散状态扩散机制,专注于代码生成任务,在推理速度上实现了显著突破:最高可达 2,146 token...
    大语言模型# Seed Diffusion# 字节跳动
    5个月前
    01400
    字节跳动发布 Seed LiveInterpret 2.0:首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

    字节跳动发布 Seed LiveInterpret 2.0:首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

    在跨语言实时沟通的长期挑战中,机器能否真正替代人类同声传译?字节跳动 Seed 团队给出了迄今为止最接近“是”的答案。 今日,字节跳动正式发布 Seed LiveInterpret 2.0 —— 一款...
    语音模型# Seed LiveInterpret 2.0# 同声传译模型# 字节跳动
    5个月前
    02870
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    EdgeOne Pages

    EdgeOne Pages

    EdgeOne Pages 是基于 Tencent EdgeOne 基础设施打造的全栈开发部署平台,提供从前端页面到动态 API 的无服务器部署体验,适用于构建营销网站、AI 应用等现代 Web 项目。通过边缘网络全球加速,确保应用获得快速、稳定的访问体验。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Ebook2Audiobook

    Ebook2Audiobook

    Ebook2Audiobook是一款将非DRM保护的电子书转换为高质量有声书的工具,并保留章节和元数据。通过结合Calibre、Coqui XTTSv2和Fairseq等开源项目,确保每本有声书听起来自然流畅。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Moonvalley

    Moonvalley

    洛杉矶初创公司 Moonvalley 发布了一款名为“Marey”的 AI 视频生成模型。Marey 使用“自有或完全许可”的源数据进行训练,并提供精细的相机和运动控制等定制选项。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    查看完整榜单