Markdown 是一种轻量级的标记语言,旨在提供一种易于阅读和书写的纯文本格式。它的...
1周前 46

图森未来今日正式发布了其首款“图生视频”大模型——Ruyi,目前Ruyi-Mini-7B版本已经...
1周前 58

qapyq 是一款专为生成式 AI 模型的数据集整理、微调(finetune)和 LoRA 设计的图...
1周前 48

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中...
1周前 50

校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能...
1周前 54

多模态音乐生成旨在从多种输入模态(如文本、视频和图像)中生成音乐。尽管现有方...
1周前 54

对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由...
1周前 46

视觉扩散模型(Diffusion Models)在图像和视频生成领域取得了显著进展,但由于缺...
1周前 44

近年来,文本到视频生成技术取得了显著进展,但现有的视频字幕生成方法仍然存在一...
1周前 48

尽管视频感知能力已经迅速集成到大型多模态模型(LMMs)中,但其驱动视频理解的基...
1周前 44

理解、导航和探索三维物理现实世界一直是人工智能(AI)领域的一个核心挑战。传统...
1周前 48

UltraReal Fine-Tune 是基于 FLUX.1-dev 模型的一个微调版本,旨在通过训练者自己...
1周前 46
没有账号?注册  忘记密码?