多模态生成模型

共 3 篇文章

排序

发布更新浏览点赞

Echo-4o ：通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型的性能

Echo-4o ：通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型的性能

上海人工智能实验室、中山大学、香港中文大学和北京大学的研究人员推出 Echo-4o 系统，通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型（如文本到图像生成、多参考图像生成等任务）的性能...

新技术 # Echo-4o # GPT-4o # 多模态生成模型

8个月前

03280

开源版GPT‑4o？新型多模态生成模型 Liquid，用一个模型搞定视觉与语言任务

开源版GPT‑4o？新型多模态生成模型 Liquid，用一个模型搞定视觉与语言任务

在OpenAI旗下GPT‑4o凭借原生生成及编辑图像功能，火爆网络后，大家都在期待有相对应的开源模型推出。而将视觉和语言任务高效整合一直是研究的热点。华中科技大学、字节跳动和香港大学的研究人员推出了新...

图像模型 # GPT‑4o # OpenAI # 多模态生成模型

12个月前

02700

新型多模态生成模型UniDisc：基于离散扩散过程的统一生成模型，能够同时理解和生成文本和图像

新型多模态生成模型UniDisc：基于离散扩散过程的统一生成模型，能够同时理解和生成文本和图像

卡内基梅隆大学的研究人员推出新型多模态生成模型 UniDisc（Unified Multimodal Discrete Diffusion），UniDisc 是一个基于离散扩散过程的统一生成模型，能够...

图像模型 # UniDisc # 多模态生成模型

1年前

04670