新型视觉模型训练方法SynCLR:完全从生成模型中学习,不需要任何真实数据来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR,它完全从生成模型中学习,而不需要任何真实数据。 GitHub 论文 SynCLR的核心思想是利用大语言模型(LLMs)生成大量的图像...新技术# SynCLR# 大模型# 大语言模型2年前06200
Media2Face:集成多种媒体输入(音频、图像和文本)生成同步的面部动画和头部姿势来自上海科技大学、影眸科技、香港大学和叠境数字科技的研究人员提出一个基于扩散的生成模型Media2Face,它能够根据语音信号和多模态条件(如文本、图像)生成同步的面部动画和头部姿势。 项目主页 Me...新技术# Media2Face2年前05840
文本到图像合成框架PIXART-δ:0.5秒内生成1024×1024像素的图像来自华为诺亚方舟实验室、大连理工大学、香港大学、香港科技大学的研究人员推出了文本到图像合成框架PIXART-δ,这是去年发布的PIXART-α模型的一个升级版本。PIXART-α以其高效的训练过程和生...新技术# AI绘画# PIXART-α# PIXART-δ2年前07020
基于SAM的新型视觉模型Open-Vocabulary SAM:交互式的图像分割和识别来自南洋理工大学、上海AI实验室的研究人员推出了一款基于SAM的新型视觉模型Open-Vocabulary SAM,它结合了Segment Anything Model(SAM)和CLIP模型的优势...新技术# Open-Vocabulary SAM# SAM# 图像分割2年前08120
双语文本到图像生成模型Taiyi-Diffusion-XL,支持中文提示词IDEA 研究院是由沈向洋创立,他们在2021年11月22日宣布启动“封神榜”大模型开源体系。“封神榜”是由 IDEA-CCNL 的工程师、研究人员、实习生团队共同维护的一项长期开源计划。项目基于Ap...新技术# SDXL# Taiyi-Diffusion-XL# 中文提示词2年前07760
3D场景编辑框架TIP-Editor来自腾讯人工智能实验室、中山大学的研究人员推出3D场景编辑框架TIP-Editor,它允许用户不仅通过文本提示,还通过图像提示来精确地编辑现有的基于3D高斯散射(GS)的辐射场。TIP-Editor的...新技术# 3D场景编辑# TIP-Editor2年前05260
开源人像生成器InstantID:只需一张人脸照片,快速生成不同风格的人物照片开源人像生成器InstantID今天在推特引发了热议,InstantID只需要一张人脸照片,就能快速生成多种风格的人物照片,无需复杂的训练或微调过程。InstantID还能与流行的图像扩散模型(如 S...新技术# controlnet# InstantID# LCM2年前08930
AI绘画革命!如何为Stable Diffusion模型选择合适的电脑配置?以 ChatGPT 为代表的 AI 聊天机器人、以 Stable Diffusion 为代表的 AI 绘画,从2022年下半年开始爆火,尤其是完全开源的Stable Diffusion模型,让大家可以...硬件# CPU# Stable Diffusion# 主板2年前01,6600
英伟达GeForce RTX 4090 D对于AI绘画来说,其实最具“性价比”的显卡就是英伟达RTX 4090,作为英伟达民用顶级显卡,目前可运行绝大多数已开源的AI应用,以至于美国政府都对RTX 4090采取了限制措施,那就是无法出口到中国...硬件# RTX 4090# RTX 4090 D# 英伟达2年前08160
英伟达GeForce RTX 4060 Ti 16GB英伟达在去年7月正式发售万众瞩目RTX 4060 Ti 16GB,这张显卡最大的优点就是16GB显存,这对于AI用户来说这张显卡可以说是入门首选,一起来看看这张显卡的规格吧! RTX 4060 Ti ...硬件# RTX 4060 Ti 16GB# 英伟达2年前07040
英伟达GeForce RTX 4070 Ti SUPER近期,英伟达推出了GeForce RTX 40 SUPER系列第二款显卡,此款显卡对于AI用户来说是个不错的选择,原因就是它拥有与RTX 4080更为接近的规格配置,显存容量和带宽比起原来的RTX 4...硬件# RTX 4070 Ti SUPER# 英伟达2年前01,0130
FreeNoise:通过噪声调度实现无需调参的长视频生成来自腾讯人工智能实验室、南洋理工大学、香港科技大学的研究人员提出了一种利用预训练的视频扩散模型生成高质量长视频的方法FreeNoise,它能够使模型在生成更长时间视频时保持内容的一致性,无需对模型进行...新技术# AI视频# FreeNoise# 噪声2年前06920