字节跳动

排序

发布更新浏览点赞

ComfyUI-LatentSyncWrapper：基于字节跳动唇音同步框架LatentSync的非官方ComfyUI节点

ComfyUI-LatentSyncWrapper是专门为ComfyUI设计的非官方节点，基于字节跳动的LatentSync框架，实现视频中嘴唇动作与音频输入的同步。借助这一工具，用户可以在Comfy...

1年前

01,7000

字节跳动推出PuLID：用于个性化文本到图像的生成

字节跳动推出PuLID，它用于个性化文本到图像（Text-to-Image，简称T2I）的生成。PuLID的全称是“Pure and Lightning ID customization”，即纯粹和闪...

新技术 # PuLID # 个性化图像生成 # 字节跳动

2年前

01,3800

字节跳动推出新型蒸馏模型Hyper-SD：基于SD1.5和SDXL1.0基础模型提炼

字节跳动在推出文生图模型SDXL-Lightning后，又推出了新的蒸馏模型Hyper-SD，它有效地结合了ODE轨迹保留和重构的优点，同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light...

图像模型 # Hyper-SD # 字节跳动 # 蒸馏模型

1年前

01,1940

字节跳动 USO 模型 ComfyUI 原生工作流指南：实现风格与主体统一的 AI 生成

在 AI 图像生成中，两个核心挑战长期并存：主体一致性：如何让同一个角色在不同场景中保持身份不变？风格迁移：如何将参考图的艺术风格准确迁移到新内容上？传统方案往往需要多个模型、复杂调参，或依赖 ...

工作流 # USO 模型 # 字节跳动

7个月前

01,0560

字节跳动Seedream 4.0 正式接入 ComfyUI：一模型打通生成与编辑全流程

ComfyUI官方宣布字节跳动的Seedream 4.0 已集成至 ComfyUI，通过官方 API 节点即可直接调用，无需额外部署，开箱即用。这一次更新不只是“多一个模型选项”，而是带来了一种全新...

工作流 # ComfyUI # Seedream 4.0 # 字节跳动

7个月前

01,0540

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

字节跳动发布了一款名为 BAGEL 的开源多模态基础模型，该模型拥有 70 亿活跃参数（总规模为 140 亿），在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...

图像模型 # BAGEL # GPT-4o # 多模态模型

10个月前

09150

字节跳动推出新型视频生成技术CamTrol：为现有的视频扩散模型增添摄像机运动操控功能

中国科学技术大学和字节跳动的研究人员推出新型视频生成技术CamTrol，这是一种无需训练的、强大的解决方案，可以为现有的视频扩散模型增添摄像机运动操控功能。简单来说，就是可以在不经过额外训练的情况下...

新技术 # CamTrol # 字节跳动 # 视频生成

2年前

08810

字节跳动推出AI音乐生成产品-海绵音乐

对于AI音乐，前面已经给大家介绍了Suno和Udio，字节跳动也在这一赛道发力，在昨天推出了AI音乐生成产品-海绵音乐，从目前生成效果来看，虽然还不如Suno和Udio，但对于中文歌曲生成效果还不错...

工具 # AI音乐 # 字节跳动 # 海绵音乐

2年前

07320

字节释出Phantom-Wan-14B！从参考图像中提取关键主体元素生成一致性视频

字节跳动于4月份正式开源了其统一视频生成框架 Phantom，这是一个专注于“主体一致性（Subject-to-Video, S2V）”的视频生成框架。它能够从参考图像中提取关键主体元素，并结合文本描...

工作流 # Phantom-Wan-14B # 字节跳动 # 视频编辑

10个月前

06880

字节跳动推出数据集COCONut，专门针对图像分割任务

字节跳动推出数据集COCONut，它是对现有的COCO数据集的现代化升级，专门针对图像分割任务。图像分割是计算机视觉中的一个核心问题，它的目标是将图像中的每个像素正确地分类到不同的实例或类别中，此数据...

新技术 # COCONut # 图像分割 # 字节跳动

2年前

06870

字节跳动推出基于Flux的通用框架UNO：支持虚拟试穿、风格化生成、产品设计等功能

字节跳动近日推出了UNO，这是一个强大的通用框架，能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力，还能将多样化的任务统一在一个模型之下，为图像生成领域带来了新的突破。项目主页...

图像模型 # FLUX # UNO # 字节跳动

12个月前

06800

字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0：同时支持文生图、图生视频及文生图生成

字节跳动 Waver 项目组近期正式推出 Waver 1.0 一体化视频生成模型，凭借多模态生成能力、高分辨率支持及卓越的运动建模效果，在视频生成领域实现重要突破，为工业级视频创作需求提供了全新解决方...

视频模型 # Waver 1.0 # 字节跳动 # 视频生成

7个月前

06470

加载更多

ComfyUI-LatentSyncWrapper：基于字节跳动唇音同步框架LatentSync的非官方ComfyUI节点

字节跳动推出PuLID：用于个性化文本到图像的生成

字节跳动推出新型蒸馏模型Hyper-SD：基于SD1.5和SDXL1.0基础模型提炼

字节跳动 USO 模型 ComfyUI 原生工作流指南：实现风格与主体统一的 AI 生成

字节跳动Seedream 4.0 正式接入 ComfyUI：一模型打通生成与编辑全流程

开源版GPT-4o！字节跳动开源新一代多模态模型 BAGEL：多模态理解、图像生成、图像编辑，还能“思考”

字节跳动推出新型视频生成技术CamTrol：为现有的视频扩散模型增添摄像机运动操控功能

字节跳动推出AI音乐生成产品-海绵音乐

字节释出Phantom-Wan-14B！从参考图像中提取关键主体元素生成一致性视频

字节跳动推出数据集COCONut，专门针对图像分割任务

字节跳动推出基于Flux的通用框架UNO：支持虚拟试穿、风格化生成、产品设计等功能

字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0：同时支持文生图、图生视频及文生图生成

S.H.I.T

ITELLOU

waoo

OpenMAIC

OpResume

抓虾吧

字节跳动

网址

S.H.I.T

ITELLOU

waoo

OpenMAIC

OpResume

抓虾吧