字节跳动

排序

发布更新浏览点赞

字节跳动 USO 模型 ComfyUI 原生工作流指南：实现风格与主体统一的 AI 生成

在 AI 图像生成中，两个核心挑战长期并存：主体一致性：如何让同一个角色在不同场景中保持身份不变？风格迁移：如何将参考图的艺术风格准确迁移到新内容上？传统方案往往需要多个模型、复杂调参，或依赖 ...

工作流 # USO 模型 # 字节跳动

3个月前

07790

字节跳动推出 UltraMemV2：在低内存访问下，追平8专家MoE性能

在大模型稀疏化架构的演进中，效率与性能的权衡始终是核心挑战。 MoE（Mixture of Experts）通过仅激活部分专家实现高效推理，但其频繁的跨专家参数访问带来了高昂的内存开销。为解决这一问题...

新技术 # UltraMemV2 # 字节跳动

4个月前

0800

字节跳动推出 USO：统一风格与主体生成模型，开源全方案赋能创作

字节跳动智能创作实验室UXO项目组近期发布了UXO家族的新成员——USO（统一风格-主体优化定制模型）。这款模型打破了现有技术中“风格驱动”与“主体驱动”生成相互孤立的困境，能在单一框架下自由组合任意...

图像模型 # USO # 字节跳动 # 统一风格与主体生成模型

4个月前

04380

字节跳动发布OmniHuman-1.5：模拟人类双重认知，生成语义连贯的高逼真角色动画

字节跳动近期推出新型视频角色生成框架 OmniHuman-1.5，核心突破在于模拟人类“系统1（快速直觉反应）+系统2（缓慢深思规划）”的双重认知过程，实现从“单一图像+语音轨道”到“物理逼真、语义连...

视频模型 # OmniHuman-1.5 # 字节跳动

4个月前

0700

字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0：同时支持文生图、图生视频及文生图生成

字节跳动 Waver 项目组近期正式推出 Waver 1.0 一体化视频生成模型，凭借多模态生成能力、高分辨率支持及卓越的运动建模效果，在视频生成领域实现重要突破，为工业级视频创作需求提供了全新解决方...

视频模型 # Waver 1.0 # 字节跳动 # 视频生成

4个月前

05650

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

字节跳动Seed团队正式推出Seed-OSS系列开放权重模型，该系列均为36B参数规模，聚焦长上下文处理、推理能力与代理任务优化，以Apache-2.0许可证开源，为开发者与研究社区提供高实用性工具...

大语言模型 # Seed-OSS # 字节跳动

4个月前

02600

字节跳动推出具备长期记忆的多模态智能体 M3-Agent

字节跳动 Seed 团队推出新型多模态智能体框架M3-Agent ，首次实现了以实体为中心、支持长期记忆积累的自主推理能力。项目主页：https://m3-agent.github.io GitHu...

多模态模型 # M3-Agent # 多模态智能体 # 字节跳动

4个月前

02270

字节跳动开源 VeOmni：一个面向全模态大模型的 PyTorch 原生训练框架

在大模型从“能说”向“能看、能听、能理解”演进的当下，多模态统一模型（Omni-Modal LLMs）正成为技术前沿。然而，训练一个同时处理文本、图像、语音和视频的全能模型，仍面临工程复杂、扩展困难...

多模态模型 # VeOmni # 多模态统一模型 # 字节跳动

4个月前

01800

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

在信息过载的时代，获取“更多”并不等于“更有效”。真正制约效率的，往往不是找不到某个具体答案，而是面对海量目标时的系统性整理能力——比如，为一个行业筛选出上百家公司数据，或从成千上万条招聘信息中精准匹...

新技术 # WideSearch # 字节跳动 # 智能体评估基准

4个月前

04690

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover，Seed-Prover 通过结合 LLM 的推理能力和形式化语言（如 Lean）的验证能力，实现了对数学...

大语言模型 # Seed-Prover # 字节跳动 # 自动化定理证明

4个月前

0950

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版，它采用离散状态扩散机制，专注于代码生成任务，在推理速度上实现了显著突破：最高可达 2,146 token...

大语言模型 # Seed Diffusion # 字节跳动

5个月前

01400

字节跳动发布 Seed LiveInterpret 2.0：首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

在跨语言实时沟通的长期挑战中，机器能否真正替代人类同声传译？字节跳动 Seed 团队给出了迄今为止最接近“是”的答案。今日，字节跳动正式发布 Seed LiveInterpret 2.0 —— 一款...

语音模型 # Seed LiveInterpret 2.0 # 同声传译模型 # 字节跳动

5个月前

02870

加载更多

字节跳动 USO 模型 ComfyUI 原生工作流指南：实现风格与主体统一的 AI 生成

字节跳动推出 UltraMemV2：在低内存访问下，追平8专家MoE性能

字节跳动推出 USO：统一风格与主体生成模型，开源全方案赋能创作

字节跳动发布OmniHuman-1.5：模拟人类双重认知，生成语义连贯的高逼真角色动画

字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0：同时支持文生图、图生视频及文生图生成

字节跳动 Seed 团队发布 Seed-OSS 系列开源模型：36B 参数，512K 长上下文，可灵活调整思考长度

字节跳动推出具备长期记忆的多模态智能体 M3-Agent

字节跳动开源 VeOmni：一个面向全模态大模型的 PyTorch 原生训练框架

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动发布 Seed LiveInterpret 2.0：首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

EdgeOne Pages

Grok

Ebook2Audiobook

朱雀大模型检测

Moonvalley

秒哒

字节跳动

网址

EdgeOne Pages

Grok

Ebook2Audiobook

朱雀大模型检测

Moonvalley

秒哒