字节跳动

排序

发布更新浏览点赞

字节跳动开源 VeOmni：一个面向全模态大模型的 PyTorch 原生训练框架

在大模型从“能说”向“能看、能听、能理解”演进的当下，多模态统一模型（Omni-Modal LLMs）正成为技术前沿。然而，训练一个同时处理文本、图像、语音和视频的全能模型，仍面临工程复杂、扩展困难...

8个月前

02110

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

在信息过载的时代，获取“更多”并不等于“更有效”。真正制约效率的，往往不是找不到某个具体答案，而是面对海量目标时的系统性整理能力——比如，为一个行业筛选出上百家公司数据，或从成千上万条招聘信息中精准匹...

新技术 # WideSearch # 字节跳动 # 智能体评估基准

8个月前

04960

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover，Seed-Prover 通过结合 LLM 的推理能力和形式化语言（如 Lean）的验证能力，实现了对数学...

大语言模型 # Seed-Prover # 字节跳动 # 自动化定理证明

8个月前

01040

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版，它采用离散状态扩散机制，专注于代码生成任务，在推理速度上实现了显著突破：最高可达 2,146 token...

大语言模型 # Seed Diffusion # 字节跳动

8个月前

01490

字节跳动发布 Seed LiveInterpret 2.0：首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

在跨语言实时沟通的长期挑战中，机器能否真正替代人类同声传译？字节跳动 Seed 团队给出了迄今为止最接近“是”的答案。今日，字节跳动正式发布 Seed LiveInterpret 2.0 —— 一款...

语音模型 # Seed LiveInterpret 2.0 # 同声传译模型 # 字节跳动

8个月前

03370

字节跳动Seed团队发布新一代机器人操作大模型Seed GR-3

字节跳动Seed团队近日推出一款面向复杂操作任务的大规模机器人模型——Seed GR-3（Generalist Robot Model-3）。该模型具备良好的泛化能力，支持长序列任务执行与多模态指令理...

多模态模型 # Seed GR-3 # 字节跳动

8个月前

01950

字节跳动开源 Seed-X：70亿参数的多语言翻译模型，性能媲美 GPT-4 和 Gemini

字节跳动推出Seed-X，这是一个开源的多语言翻译模型系列，包括指令模型、强化学习模型和奖励模型，参数规模为 70亿（7B），却在翻译能力上展现出媲美甚至超越超大规模闭源模型（如 Gemini-2.5...

大语言模型 # SEED-X # 多语言翻译模型 # 字节跳动

9个月前

01200

字节跳动 & 复旦大学联合提出智能海报生成新框架 DreamPoster

在 AI 生成图像（AIGC）领域，海报设计一直是极具挑战性的任务之一。它不仅要求模型理解文本描述，还需要兼顾视觉美感、排版逻辑和品牌一致性。近日，字节跳动与复旦大学的研究团队联合提出了一种新的文本...

图像模型 # DreamPoster # 字节跳动 # 海报设计

9个月前

04470

字节跳动 & 南大联合推出 CriticLean 框架：让 AI 更准确地翻译数学为代码

将自然语言数学语句自动转化为形式化代码（如 Lean 4）是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题，但其准确性仍面临瓶颈，尤其是在需要深入理解语义的复杂场景中。为此，字节跳...

大语言模型 # CriticLean # 字节跳动

9个月前

01960

字节跳动智能创作团队推出ComfyUI批量处理扩展插件ComfyUI-Lumi-Batcher

在ComfyUI进行图像、视频创作过程中，你是否也遇到过这些令人抓狂的场景？ 😭 模型选择困难症晚期：反复替换模型手动跑图，3 小时都试不出最佳风格 😭 参数调试逼疯设计师：手动调整尺寸/权重/采样步...

插件 # ComfyUI-Lumi-Batcher # 字节跳动 # 批量处理

9个月前

04190

字节跳动Pico团队推出新型框架EX-4D：从单目视频生成高质量的极端视角 4D 视频

字节跳动Pico团队推出新型框架EX-4D，旨在从单目视频生成高质量的极端视角 4D 视频。该框架通过深度防水网格（Depth Watertight Mesh, DW-Mesh）表示法，有效处理边界遮...

新技术 # EX-4D # 字节跳动

9个月前

03440

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频，实现对全身动作（尤其是复杂手部动作）的高精度复现，几乎看不出瑕疵，尤其在手部细节...

新技术 # X-UniMotion # 字节跳动

9个月前

04050

加载更多

字节跳动开源 VeOmni：一个面向全模态大模型的 PyTorch 原生训练框架

字节跳动Seed团队发布WideSearch：首个面向大规模信息收集的智能体评估基准

字节跳动Seed项目组推出基于大语言模型（LLM）的自动化定理证明系统 Seed-Prover

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动发布 Seed LiveInterpret 2.0：首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

字节跳动Seed团队发布新一代机器人操作大模型Seed GR-3

字节跳动开源 Seed-X：70亿参数的多语言翻译模型，性能媲美 GPT-4 和 Gemini

字节跳动 & 复旦大学联合提出智能海报生成新框架 DreamPoster

字节跳动 & 南大联合推出 CriticLean 框架：让 AI 更准确地翻译数学为代码

字节跳动智能创作团队推出ComfyUI批量处理扩展插件ComfyUI-Lumi-Batcher

字节跳动Pico团队推出新型框架EX-4D：从单目视频生成高质量的极端视角 4D 视频

字节跳动推出 X-UniMotion：首个能精准复刻手部动作的视频生成模型

S.H.I.T

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

Alaya Code

字节跳动

网址

S.H.I.T

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

Alaya Code