
Open ASR 排行榜
Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
Hugging Face 推出的 3D Arena 是生成式 3D 领域的一项重要进展。它首次实现了大规模、结构化的人类偏好数据收集,并通过 ELO 排名系统提供可靠、可解释的模型评估结果。
Hugging Face 正式发布了 3D Arena ——一个用于评估图像到 3D 生成模型的开放平台。该平台通过成对比较的方式收集用户偏好,从视觉吸引力、结构连贯性和实际应用价值等维度,提供更加贴近人类感知的模型评估结果。

这项工作填补了当前自动化评估指标在反映真实用户体验方面的不足,标志着生成式 3D 领域在以人为中心的评估方法上迈出了重要一步。
随着生成式 3D 技术的发展,越来越多的模型能够从单张图片生成高质量的三维内容。然而,如何科学地评估这些模型的质量仍然是一个挑战。

为此,Hugging Face 推出了 3D Arena,借助大规模人类偏好数据,构建了一个更贴近真实需求的评估体系。
| 功能 | 描述 |
|---|---|
| 人类偏好收集 | 用户通过成对比较两个 3D 模型,选择更逼真或美观的一个 |
| ELO 排名系统 | 使用类似国际象棋的 ELO 系统进行模型评分,提供稳定可靠的排名 |
| iso3d 数据集 | 提供包含 100 个标准化图像提示的数据集,用于统一评估基准 |
| 质量控制机制 | 通过统计欺诈检测和用户身份认证,确保投票数据的真实性 |
| 特点 | 说明 |
|---|---|
| 匿名对比机制 | 用户在不知情的情况下比较两个模型输出,避免品牌偏见 |
| 多格式支持 | 支持网格、点云、高斯粒子等多种 3D 格式,确保公平评估 |
| 自然偏好捕获 | 不引导用户判断标准,真实反映用户在自由评估时的偏好倾向 |
| 低参与门槛 | 基于 Hugging Face OAuth 登录,方便用户快速参与评估 |







