SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    字节跳动

    共 80 篇文章
    排序
    发布更新浏览点赞
    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    SDXL-Lightning是由字节跳动发布的一款速度极快的文生图模型,它采用新型扩散模型蒸馏方法,优化扩散模型,能在短时间内高效生成分辨率为1024像素的高品质图像。 模型地址:https://hu...
    新技术# SDXL-Lightning# SDXL1.0# 字节跳动
    2年前
    06160
    字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0:同时支持文生图、图生视频及文生图生成

    字节跳动 Waver 项目组推出一体化视频生成模型Waver 1.0:同时支持文生图、图生视频及文生图生成

    字节跳动 Waver 项目组近期正式推出 Waver 1.0 一体化视频生成模型,凭借多模态生成能力、高分辨率支持及卓越的运动建模效果,在视频生成领域实现重要突破,为工业级视频创作需求提供了全新解决方...
    视频模型# Waver 1.0# 字节跳动# 视频生成
    5个月前
    06080
    字节跳动推出新颖视频合成方法Boximator:可控制画面范围及运动方向

    字节跳动推出新颖视频合成方法Boximator:可控制画面范围及运动方向

    字节跳动发布了一种新颖视频合成方法Boximator,主要用于生成具有丰富和精细运动控制的高质量视频。Boximator引入了两种约束类型:硬边框(hard box)和软边框(soft box),允许...
    新技术# Boximator# 字节跳动# 视频合成
    2年前
    06020
    字节释出Phantom-Wan-14B!从参考图像中提取关键主体元素生成一致性视频

    字节释出Phantom-Wan-14B!从参考图像中提取关键主体元素生成一致性视频

    字节跳动于4月份正式开源了其统一视频生成框架 Phantom,这是一个专注于“主体一致性(Subject-to-Video, S2V)”的视频生成框架。它能够从参考图像中提取关键主体元素,并结合文本描...
    工作流# Phantom-Wan-14B# 字节跳动# 视频编辑
    8个月前
    05750
    字节推出TextToon:在实时环境中将真人的头像转换成卡通化的形象

    字节推出TextToon:在实时环境中将真人的头像转换成卡通化的形象

    罗切斯特大学和字节跳动的研究人员推出TextToon,它能够在实时环境中将真人的头像转换成卡通化的形象。就像魔法一样,这项技术可以把你从视频中的头像变成你想要的任何卡通风格,比如美国漫画风格、皮克斯动...
    新技术# TextToon# 字节跳动
    1年前
    05740
    字节跳动推出 USO:统一风格与主体生成模型,开源全方案赋能创作

    字节跳动推出 USO:统一风格与主体生成模型,开源全方案赋能创作

    字节跳动智能创作实验室UXO项目组近期发布了UXO家族的新成员——USO(统一风格-主体优化定制模型)。这款模型打破了现有技术中“风格驱动”与“主体驱动”生成相互孤立的困境,能在单一框架下自由组合任意...
    图像模型# USO# 字节跳动# 统一风格与主体生成模型
    5个月前
    05180
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    6个月前
    04790
    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动推出VAPO框架:让大语言模型在复杂推理任务中更高效

    字节跳动Seed研究团队发布了一项名为 VAPO 的强化学习训练框架。这一框架专为提升大语言模型(LLM)在复杂、冗长任务中的推理能力而设计,特别是在数学推理和长链推理(Long Chain-of-T...
    新技术# VAPO# 大语言模型# 字节跳动
    10个月前
    04750
    字节跳动与浙大联合发布轻量高效TTS模型MegaTTS3

    字节跳动与浙大联合发布轻量高效TTS模型MegaTTS3

    字节跳动和浙江大学的研究人员推出的一款轻量级TTS模型:MegaTTS3,0.45B,高质量语音克隆,支持中英文以及中英文混合,支持口音强度控制,后面会支持更细粒度的发音和时长调整。 GitHub:h...
    语音模型# MegaTTS3# TTS模型# 字节跳动
    10个月前
    04670
    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...
    视频模型# Goku# 字节跳动# 视频生成
    12个月前
    04670
    字节跳动推出专注于提升多模态理解与推理能力的视觉-语言基础模型Seed1.5-VL

    字节跳动推出专注于提升多模态理解与推理能力的视觉-语言基础模型Seed1.5-VL

    字节跳动正式推出 Seed1.5-VL,这是一款专注于提升多模态理解与推理能力的视觉-语言基础模型。Seed1.5-VL 不仅在视觉和视频理解任务中表现出色,还在智能体相关任务及复杂推理挑战中展现了卓...
    多模态模型# Seed1.5-VL# 字节跳动# 视觉-语言基础模型
    9个月前
    04160
    字节跳动发布通用图像编辑模型SeedEdit:已经在豆包PC端及即梦网页端开启测试

    字节跳动发布通用图像编辑模型SeedEdit:已经在豆包PC端及即梦网页端开启测试

    11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自...
    工具# SeedEdit# 即梦# 字节跳动
    1年前
    04110
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单