
在 AI 行业从模型竞赛转向数据质量竞争的背景下,高质量训练数据已成为稀缺资源。继 Scale AI、Surge、Mercor 等公司之后,新玩家 Datacurve 正以差异化策略切入这一赛道。

这家 Y Combinator 孵化的初创公司近日宣布完成 1500 万美元 A 轮融资,由 Chemistry Capital 的 Mark Goldberg 领投,DeepMind、Vercel、Anthropic 和 OpenAI 的员工跟投。此前,其种子轮已获 270 万美元,投资人包括前 Coinbase CTO Balaji Srinivasan。
聚焦高价值领域:软件工程数据
与传统数据标注公司不同,Datacurve 专注于 软件开发领域的高质量后训练数据——例如用于训练代码生成、调试或系统设计 AI 的复杂交互数据。
为获取这类稀缺数据,公司采用 “赏金猎人”机制:邀请经验丰富的软件工程师完成特定任务(如编写特定场景的测试用例、重构遗留代码、模拟调试流程等),并支付报酬。截至目前,平台已发放 超 100 万美元赏金。
联合创始人 Serena Ge 表示,尽管报酬可观,但吸引顶尖工程师的核心并非金钱:“软件工程师的时薪远高于数据任务收入。我们真正打造的是消费级体验——让参与过程有趣、高效、有成就感。”
为什么现在需要新数据范式?
早期 AI 模型依赖静态、标注式数据集(如图像分类、文本对齐),而当前先进系统(尤其是 AI 代理)依赖 强化学习(RL)环境 和 复杂交互轨迹,这些数据无法通过简单标注获得,必须由领域专家在真实或模拟场景中生成。
“数据需求正从‘量’转向‘质’和‘策略性’,”Ge 解释,“我们需要能理解上下文、具备专业判断力的人才,而不仅是标注员。”
可扩展的模式:不止于软件
虽然目前聚焦软件工程,但 Datacurve 的“高能力人才众包”模式具备跨行业潜力。Ge 表示,金融建模、营销策略生成、临床决策支持等领域同样需要专家级数据输入。
“我们正在构建一种后训练数据收集的基础设施,能吸引并留住各领域的顶尖从业者,”她说。
数据统计
相关导航


Google AI Studio
Claude Relay Service

2233.ai

超算互联网平台

AI21 Studio

UniAPI






