Exa's People Search Benchmarks

6天前发布 5 00

Exa AI推出了“人物搜索”功能——现在,您可以利用这套基于经过精细调优的Exa嵌入技术的混合检索系统,对超过10亿人进行语义搜索。

所在地:
美国
收录时间:
2025-12-22
Exa's People Search BenchmarksExa's People Search Benchmarks

Exa AI 近日推出 人物搜索(People Search) 功能,并同步开源首个面向网络人物搜索的公共评估基准。该系统基于其微调的嵌入模型与混合检索架构,可对超过 10 亿人进行语义级检索,适用于招聘、销售、市场研究等场景。

Exa's People Search Benchmarks

更重要的是,Exa 并未止步于产品发布,而是试图为行业建立可复现、可比较的评估标准——这在当前缺乏统一基准的 AI 搜索领域尤为关键。

人物搜索的三大典型场景

通过对 exa.ai 上万条历史查询的聚类分析,Exa 归纳出三类主流需求:

  1. 精确角色查找

    例如:“Figma 的产品副总裁”
    目标明确,需返回特定组织中的特定职位。

  2. 基于技能与地域的发现式搜索

    例如:“芝加哥 SaaS 领域的销售运营总监”
    强调角色、行业、地理位置的多维匹配。

  3. 特定个人定位

    例如:“Acme Corp 的 Jane Smith”
    姓名为主键,辅以公司信息消歧。

基准测试围绕前两类设计,分别评估精准命中能力相关人才发现能力

数据集构建:兼顾真实性与可验证性

为避免模型依赖预训练记忆,Exa 专门筛选知名度较低但资料可公开验证的人物样本,确保测试的是检索能力,而非“是否在训练数据中见过”。

▶ 精确查找数据集(约 700 条)

从四类公司中抽取高管与创始人:

  • 获风投的初创公司(公开创始人页)
  • 小市值上市公司(<20 亿美元,SEC 文件)
  • 中市值(20–100 亿)、大市值(>100 亿)上市公司(C-level/VP)

每条样本包含合成查询、真实姓名、角色、公司及市值层级,例如:

{
  "query": "副总裁运营 [隐去的制造公司]",
  "name": "[隐去姓名]",
  "role": "副总裁运营",
  "company": "[隐去的制造公司]",
  "market_cap_tier": "mid_cap"
}

▶ 角色发现数据集(约 700 条)

使用 Claude Opus 4.5 生成结构化分类法,覆盖:

  • 行业:金融科技、医疗、物流等;
  • 角色与职级:IC(个人贡献者)、经理、总监;
  • 地理层级:国家、州、城市(如“波士顿”对应生物技术);
  • 筛选条件:工作年限、技能关键词。

示例:

{
  "query": "圣地亚哥的中级入职专员",
  "role_function": "客户成功",
  "role_seniority": "ic",
  "geo_name": "圣地亚哥",
  "geo_type": "city"
}

评估方法:兼顾客观指标与语义匹配

  • 精确查找:采用标准检索指标(Recall@k、NDCG),以人物公开资料页为真实标签(ground truth)
  • 角色发现:因无唯一正确答案,采用 LLM 作为评判器——对每个返回结果的页面内容进行语义验证,计算匹配率。

    例如:搜索“旧金山资深软件工程师”,若 10 个结果中有 9 个符合,则得分为 90%。

所有对比测试均尝试为各竞品 API 配置最优参数,确保公平性。

技术实现:混合检索 + 高频更新

  • 混合检索架构:结合微调的 Exa 嵌入向量 与传统关键词信号,提升语义匹配精度;
  • 数据规模:索引超 10 亿人
  • 更新频率:数据管道每周处理 5000 万+ 次更新,保障信息时效性。

开源与行业意义

Exa 同步开源:

  • 人物搜索数据集(1,400 条结构化查询);
  • 评估工具代码,支持在自有系统上复现结果。

此举旨在解决当前 AI 搜索领域的核心问题:缺乏垂直领域的标准化评估。人物搜索作为招聘、销售、金融等行业的刚需场景,是构建评估生态的理想切入点。

“我们的长期目标是推动更广泛的检索研究,” Exa 表示,“这与我们‘构建完美搜索’的使命一致。”

数据统计

相关导航

暂无评论

none
暂无评论...