nano-banana正式版!谷歌发布全新图像模型Gemini 2.5 Flash Image,更精准的 AI 图像编辑谷歌正在为其 Gemini 聊天机器人引入一项重要升级:全新的 AI 图像模型 Gemini 2.5 Flash Image。该模型不仅提升了图像生成质量,更在编辑精度、角色一致性与多图融合方面实现了...图像模型# AI 图像编辑# Gemini 2.5 Flash Image# nano-banana5个月前05080
视觉语言模型SmolDocling:以高效的方式实现端到端的多模态文档转换在数字化时代,文档处理和理解是许多行业和研究领域的核心需求。从学术论文到商业报告,从技术手册到专利文件,文档的高效转换和理解对于信息提取、知识管理和自动化流程至关重要。然而,传统的文档处理方法往往依赖...多模态模型# SmolDocling# 文档转换# 视觉语言模型11个月前05080
Amateur Photography:基于Flux Dev的Instagram写实风格LoRAAmateur Photography [Flux Dev]是一款基于FLUX.1-dev的Instagram写实风格LoRA模型,目前已经推出到v5-final版,此模型更适合生成欧美人物。 模型地...Flux衍生# Amateur Photography# Flux Dev# Instagram写实风12个月前05070
B站推出IndexTTS2:自回归 TTS 模型的持续时间控制与情感表达新突破在大规模文本转语音(TTS)模型的发展中,自回归与非自回归系统各有优劣。自回归模型虽然在语音自然度方面表现优异,但其逐标记生成机制难以实现对语音持续时间的精确控制。这一缺陷在视频配音等需要严格音画同步...语音模型# B站# IndexTTS25个月前05030
小米推出音频推理模型R1-AQA:强化学习助力机器“听懂”声音背后的逻辑在大模型时代,人们对机器的期望已经不再局限于简单的语音识别或声音分类,而是希望机器能够具备复杂的推理能力。例如,通过汽车座舱的录音判断车辆是否存在潜在故障,从交响乐中推测作曲家的情绪,或者在地铁站的嘈...语音模型# R1-AQA# 小米# 音频推理模型11个月前05030
SameFace Fix:专注于修复Flux模型在生成图像时人物脸型同质化SameFace Fix是一个基于Flux模型的Lora,专注于修复Flux模型在生成图像时人物脸型同质化的问题。此Lora专为多样化女性外观而设计,文件大小仅4MB,需要注意的是应用此Lora时强度...Flux衍生# FLUX模型# SameFace Fix12个月前05020
Moondream 团队推出 Moondream 3 预览版本:轻量架构下的高性能视觉推理模型Moondream 团队正式推出 Moondream 3 的预览版本——一款基于 9B 参数稀疏混合专家(MoE)架构的新模型,实际激活参数仅为 2B。它在保持极快推理速度和低运行成本的同时,实现了接...多模态模型# Moondream 3# 视觉推理模型4个月前05010
Momo XL:基于SDXL的动漫风格模型Momo XL 是一个基于 Stable Diffusion XL (SDXL) 的动漫风格模型,经过微调后,能够生成具有详细和生动美学的优质动漫风格图像。这款模型专为艺术家和动漫爱好者设计,提供了多...图像模型# Momo XL# SDXL# 动漫风格12个月前04980
基于 GenAI 的视觉内容创作控制框架ZenCtrl:利用单张主体图像生成多视角、多样化场景的高分辨率图像,无需额外微调ZenCtrl 是一款基于 GenAI 的视觉内容创作控制框架,专注于利用单张主体图像生成多视角、多样化场景的高分辨率图像,无需额外微调。它通过精细的控制能力和模块化设计,为创作者提供了一个强大且灵活...图像模型# OminiControl# ZenCtrl# 图像控制框架9个月前04950
Lumiere Alpha:基于 FLUX.1 [dev] 模型打造的微调模型,专注于提高生成图像的现实感Lumiere Alpha 是由 AIXON Lab 基于 FLUX.1 [dev] 模型打造的一款微调模型。该模型专注于提高生成图像的现实感,同时保持提示的连贯性和原始 FLUX.1-Dev 模型的...Flux衍生# FLUX.1-dev# Lumiere Alpha# 微调模型12个月前04950
Qwen3Guard发布:阿里通义实验室推出首款安全护栏模型阿里通义实验室 Qwen 项目组正式推出 Qwen3Guard —— Qwen 家族中首款专为内容安全设计的护栏模型(Safety Guardrail Model)。 该模型基于强大的 Qwen3 架...大语言模型# Qwen3Guard# 安全护栏模型4个月前04940
Jib Mix Flux:微调Flux Dev模型,提升了NSFW能力Jib Mix Flux是基于开发者的SDXL 数据集,训练的微调Flux Dev模型,此模型合并了Lora,修正了人体结构审查和过度模糊的背景。目前已经推出了V4版本,拥有更好的细节和更出色的艺术风...Flux衍生# Flux Dev模型# Jib Mix Flux12个月前04940