ComfyUI-LatentSyncWrapper:基于字节跳动唇音同步框架LatentSync的非官方ComfyUI节点ComfyUI-LatentSyncWrapper是专门为ComfyUI设计的非官方节点,基于字节跳动的LatentSync框架,实现视频中嘴唇动作与音频输入的同步。借助这一工具,用户可以在Comfy...插件# LatentSync# LatentSync 1.5# 唇音同步1年前01,7000
字节跳动推出PuLID:用于个性化文本到图像的生成字节跳动推出PuLID,它用于个性化文本到图像(Text-to-Image,简称T2I)的生成。PuLID的全称是“Pure and Lightning ID customization”,即纯粹和闪...新技术# PuLID# 个性化图像生成# 字节跳动2年前01,3800
字节跳动推出新型蒸馏模型Hyper-SD:基于SD1.5和SDXL1.0基础模型提炼字节跳动在推出文生图模型SDXL-Lightning后,又推出了新的蒸馏模型Hyper-SD,它有效地结合了ODE轨迹保留和重构的优点,同时在步骤压缩过程中保持了接近无损的性能。与SDXL-Light...图像模型# Hyper-SD# 字节跳动# 蒸馏模型1年前01,1940
字节跳动 USO 模型 ComfyUI 原生工作流指南:实现风格与主体统一的 AI 生成在 AI 图像生成中,两个核心挑战长期并存: 主体一致性:如何让同一个角色在不同场景中保持身份不变? 风格迁移:如何将参考图的艺术风格准确迁移到新内容上? 传统方案往往需要多个模型、复杂调参,或依赖 ...工作流# USO 模型# 字节跳动7个月前01,0560
字节跳动Seedream 4.0 正式接入 ComfyUI:一模型打通生成与编辑全流程ComfyUI官方宣布字节跳动的Seedream 4.0 已集成至 ComfyUI,通过官方 API 节点即可直接调用,无需额外部署,开箱即用。 这一次更新不只是“多一个模型选项”,而是带来了一种全新...工作流# ComfyUI# Seedream 4.0# 字节跳动7个月前01,0540
开源版GPT-4o!字节跳动开源新一代多模态模型 BAGEL:多模态理解、图像生成、图像编辑,还能“思考”字节跳动发布了一款名为 BAGEL 的开源多模态基础模型,该模型拥有 70 亿活跃参数(总规模为 140 亿),在大规模交错多模态数据上进行训练。BAGEL 不仅在标准多模态理解排行榜中超越了当前主流...图像模型# BAGEL# GPT-4o# 多模态模型10个月前09150
字节跳动推出新型视频生成技术CamTrol:为现有的视频扩散模型增添摄像机运动操控功能中国科学技术大学和字节跳动的研究人员推出新型视频生成技术CamTrol,这是一种无需训练的、强大的解决方案,可以为现有的视频扩散模型增添摄像机运动操控功能。简单来说,就是可以在不经过额外训练的情况下...新技术# CamTrol# 字节跳动# 视频生成2年前08810
字节跳动推出AI音乐生成产品-海绵音乐对于AI音乐,前面已经给大家介绍了Suno和Udio,字节跳动也在这一赛道发力,在昨天推出了AI音乐生成产品-海绵音乐,从目前生成效果来看,虽然还不如Suno和Udio,但对于中文歌曲生成效果还不错...工具# AI音乐# 字节跳动# 海绵音乐2年前07320
字节释出Phantom-Wan-14B!从参考图像中提取关键主体元素生成一致性视频字节跳动于4月份正式开源了其统一视频生成框架 Phantom,这是一个专注于“主体一致性(Subject-to-Video, S2V)”的视频生成框架。它能够从参考图像中提取关键主体元素,并结合文本描...工作流# Phantom-Wan-14B# 字节跳动# 视频编辑10个月前06880
字节跳动推出数据集COCONut,专门针对图像分割任务字节跳动推出数据集COCONut,它是对现有的COCO数据集的现代化升级,专门针对图像分割任务。图像分割是计算机视觉中的一个核心问题,它的目标是将图像中的每个像素正确地分类到不同的实例或类别中,此数据...新技术# COCONut# 图像分割# 字节跳动2年前06870
字节跳动推出基于Flux的通用框架UNO:支持虚拟试穿、风格化生成、产品设计等功能字节跳动近日推出了UNO,这是一个强大的通用框架,能够从单一主体到多主体进行定制化演进。UNO不仅展示了出色的泛化能力,还能将多样化的任务统一在一个模型之下,为图像生成领域带来了新的突破。 项目主页...图像模型# FLUX# UNO# 字节跳动12个月前06800
字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0:同时支持文生图、图生视频及文生图生成字节跳动 Waver 项目组近期正式推出 Waver 1.0 一体化视频生成模型,凭借多模态生成能力、高分辨率支持及卓越的运动建模效果,在视频生成领域实现重要突破,为工业级视频创作需求提供了全新解决方...视频模型# Waver 1.0# 字节跳动# 视频生成7个月前06470