首页
早报
模型
ComfyUI
工具
新技术
百科
教程
硬件
科普
知识库
导航
文生视频
共 1 篇
排序
发布
更新
浏览
点赞
没有了
网址
网址
文章
软件
模型
网址
日榜
周榜
月榜
纳米AI搜索
纳米AI搜索,简称纳米搜索,是360集团于2024年11月推出的基于大语言模型等多模态学习技术的搜索及内容创作工具,已发布Android、iOS和鸿蒙原生版本,并提供网页版、PC客户端。该产品支持文字、语音、拍照、视频等多种搜索方式。
朱雀大模型检测
腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
通义万象
通义万象是阿里云旗下的图像及视频生成平台,凭借其强大的多模态生成能力,正在引领生成式 AI 的发展。除了传统的文生图能力,通义万象现已支持文生视频、图生视频等多种功能,并在插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化应用中表现出色。
Open ASR 排行榜
Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
DiffRhythm(谛韵)
DiffRhythm(中文名“谛韵”)是由西北工业大学音频、语音与语言处理研究组(ASLP Lab)和香港中文大学(深圳)深圳大数据研究院联合开发的新型端到端全长度歌曲生成模型。基于潜扩散(Latent Diffusion)技术,DiffRhythm 能够快速生成包含人声和伴奏的完整歌曲,解决了现有音乐生成方法的诸多局限性。
AI21 Labs
AI21 Labs发布了名为Jamba的模型,该模型通过融合Transformer和Mamba架构的优点,在精度和速度之间达到了完美的平衡。Jamba专为解决分布式计算和无缝部署等严峻挑战而设计,旨在将尖端研究转化为实际成果。
查看完整榜单