模型 | 第65页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

字节跳动推出Seed-Coder：轻量级开源代码大模型，性能媲美更大规模模型

字节跳动近日发布了全新的开源代码大语言模型（LLM）系列——Seed-Coder，标志着其在开源大语言模型生态系统中的首次重要贡献。这一系列模型以轻量化和高性能为核心特点，包括基础模型、指令模型和推理...

11个月前

04270

专为乐高设计的大模型LegoGPT：通过简单的文本输入生成独特的乐高设计

卡内基梅隆大学的研究团队推出了一款名为 LegoGPT 的AI模型，它能够通过简单的文本输入生成独特的乐高设计。这一工具不仅展示了AI在创意领域的潜力，还为乐高爱好者提供了一个全新的设计方式。项目主...

多模态模型 # LegoGPT # 乐高

11个月前

02050

腾讯混元团队开源多模态定制化视频生成工具Hunyuan Custom：融合文本、图像、音频、视频等多模态输入生视频的能力

在内容创作领域，视频生成技术正不断进化，但如何让生成的视频既保持主体一致性，又能实现多样化的场景和动作变化，一直是创作者面临的难题。今天，腾讯混元团队正式推出并开源了一款全新的多模态定制化视频生成工具...

视频模型 # Hunyuan Custom # 多模态定制 # 腾讯

11个月前

04840

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

字节跳动和北京大学深圳研究生院的研究人员推出一个基于DiT模型的图像定制框架DreamO ，旨在支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成。它通过引入特征路由约束和...

图像模型 # DreamO # 图像定制框架

11个月前

03680

阿里通义实验室推出强化学习框架ZEROSEARCH：通过模拟搜索引擎来提升大语言模型的信息检索能力

阿里通义实验室推出一种创新的强化学习框架ZEROSEARCH，通过模拟搜索引擎来提升大语言模型（LLMs）的信息检索能力，而无需与真实搜索引擎进行交互。该框架通过轻量级的监督微调（SFT），将 LLM...

大语言模型 # ZEROSEARCH # 强化学习框架

11个月前

02560

3D 原语组装生成框架PrimitiveAnything：通过自回归变换器将复杂的 3D 形状分解为简单几何原语的组合

腾讯和清华大学的研究人员推出一种新型3D 原语组装生成框架PrimitiveAnything，旨在通过自回归变换器将复杂的 3D 形状分解为简单几何原语的组合。该框架通过学习人类如何将复杂形状分解为基...

3D模型 # 3D # PrimitiveAnything

11个月前

03860

新型自回归视频扩散模型CausVid：解决传统双向扩散模型在交互式应用中的高延迟问题

麻省理工学院和Adobe的研究人员推出新型自回归视频扩散模型CausVid，旨在解决传统双向扩散模型在交互式应用中的高延迟问题。通过将双向扩散模型蒸馏为快速自回归生成器，CausVid 能够实现低延迟...

视频模型 # CausVid # 自回归视频扩散模型

11个月前

04570

腾讯推出新型图生视频框架FlexiAct：实现灵活的视频动作克隆

腾讯和清华大学的研究人员推出新型图生视频框架FlexiAct，实现灵活的动作控制，能够在异构场景（即具有不同空间结构、骨骼结构或视角的场景）中将参考视频中的动作迁移到任意目标图像上，同时保持动作动态和...

视频模型 # FlexiAct # 图生视频

11个月前

03920

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

来自浙江大学、哈佛大学和南洋理工大学的研究人员提出了一种名为 Insert Anything 的创新框架，通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中。这一方法无需为每个任务...

图像模型 # Insert Anything # 图像编辑

11个月前

01680

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

在漫画生产行业中，基于参考图像的线稿上色是一项既复杂又关键的任务。一页漫画通常包含多样的人物、物体和背景，这不仅要求上色过程具备高准确性、上下文一致性，还需要灵活控制以满足不同场景需求。然而，传统的扩...

图像模型 # Cobra # 上色模型 # 漫画线稿

11个月前

01990

Lightricks 推出全新开源视频生成模型 LTXV-13B

Lightricks之前推出的都是小尺寸模型，而在今天它宣布推出其最新且最先进的开源视频生成模型——LTXV-13B，这一模型不仅在质量、速度和可访问性方面实现了显著提升，还为创作者提供了强大的工具...

视频模型 # Lightricks # LTXV-13B # 视频生成模型

11个月前

04430

音乐生成基础模型ACE-Step：通过创新的整体架构设计，快速生成高质量音乐

ACE Studio和阶跃星辰（StepFun）联合推出了一款全新的开源音乐生成基础模型ACE-Step，该模型通过创新的整体架构设计，突破了现有方法的局限性，实现了卓越的性能表现。 GitHub：h...

语音模型 # ACE-Step # 音乐模型

11个月前

05090

加载更多

模型

字节跳动推出Seed-Coder：轻量级开源代码大模型，性能媲美更大规模模型

专为乐高设计的大模型LegoGPT：通过简单的文本输入生成独特的乐高设计

腾讯混元团队开源多模态定制化视频生成工具Hunyuan Custom：融合文本、图像、音频、视频等多模态输入生视频的能力

基于FLUX模型的图像定制框架DreamO：支持多种图像定制任务，同时实现多种条件（如身份、主体、风格、背景等）的无缝集成

阿里通义实验室推出强化学习框架ZEROSEARCH：通过模拟搜索引擎来提升大语言模型的信息检索能力

3D 原语组装生成框架PrimitiveAnything：通过自回归变换器将复杂的 3D 形状分解为简单几何原语的组合

新型自回归视频扩散模型CausVid：解决传统双向扩散模型在交互式应用中的高延迟问题

腾讯推出新型图生视频框架FlexiAct：实现灵活的视频动作克隆

基于Flux模型的图像编辑框架Insert Anything：通过用户指定的灵活控制，将参考图像中的对象无缝整合到目标场景中

专为漫画线稿上色设计的Cobra框架：能将黑白线稿转化为生动的插图

Lightricks 推出全新开源视频生成模型 LTXV-13B

音乐生成基础模型ACE-Step：通过创新的整体架构设计，快速生成高质量音乐

TapNow

S.H.I.T

ITELLOU

waoo

RunningHub

AITradeGame

模型

网址

TapNow

S.H.I.T

ITELLOU

waoo

RunningHub

AITradeGame