越来越多的硅谷公司正在基于免费的中国AI模型进行构建

科普4个月前更新小马良

89 0

AI初创企业的估值屡创新高，但许多企业是建立在廉价、可免费下载的中国 AI模型基础之上的。

今年早些时候，在审视美国AI领域的状况时，Misha Laskin 感到担忧。

Laskin 是一位理论物理学家和机器学习工程师，曾帮助创建了谷歌一些最强大的AI模型。他看到美国AI公司越来越拥抱免费、可定制且日益强大的“开放”AI模型。

但这些模型大多数是在中国制造的，并且这些系统正在迅速赶超其美国竞争对手。

“这些模型并未落后前沿技术太远。事实上，它们惊人地接近前沿。现在出现的那些，”Laskin 停顿了一下说，“嗯，它们明显非常接近前沿。”

Laskin 创立了一家名为 Reflection AI 的初创公司，最近估值达到 80 亿美元，旨在提供一种开源的美国替代方案，以取代这些在硅谷获得关注且能力日益增强的中国模型。

“你开始看到一些迹象，表明开放模型公司实际上正在推动中国智能的前沿，而且总体上也在推动智能的前沿，”Laskin 说。

在过去的一年里，越来越多的美国热门AI初创公司转向使用开放的中国AI模型。这些模型正日益成为昂贵的美国系统的竞争对手，有时甚至取代它们，成为美国AI产品的基础。

NBC News 采访了超过 15 位AI初创公司创始人、机器学习工程师、行业专家和投资者。他们表示，虽然美国公司的模型继续引领AI能力的前沿步伐，但在过去一年中，许多中国系统访问成本更低、更具可定制性，并且对于许多用途来说能力已经足够。

这种日益增长的拥抱趋势可能会给美国AI行业带来问题。投资者已经在 OpenAI 和 Anthropic 上押注了数百亿美元，赌的是领先的美国AI公司将主导全球AI市场。但美国公司越来越多地使用免费的中国模型，引发了人们对这些模型究竟有多独特——以及美国追求封闭模型的做法是否可能完全是被误导的——的疑问。

专注于AI的搜索公司 Exa 估值 7 亿美元，并得到 Lightspeed Venture Partners 和英伟达等硅谷中坚力量的支持。其机器学习主管 Michael Fine 表示，在许多情况下，在 Exa 自己的硬件上运行中国模型已被证明比使用 OpenAI 的 GPT-5 或谷歌的 Gemini 等更大的模型明显更快且更便宜。

“经常发生的情况是，我们使用封闭模型让某个功能得以运行，但随后意识到它太贵或太慢，于是我们会问，‘我们有什么手段可以让这变得更快更便宜？’”

“这通常意味着用同等的开放模型替换封闭模型，然后在我们自己的基础设施上运行它，”Fine 说。

中国的模型，如 DeepSeek（深度求索）的 R1 和阿里巴巴的 Qwen（通义千问），是免费使用的，被认为是“开源”或“开放权重”的，因为任何人都可以下载、复制、修改和操作它们。它们不同于 Anthropic 的 Claude 或 OpenAI 最流行的 GPT 模型等领先的美国系统，后者是“封闭”或专有的，并通过科技巨头控制的数据中心和管道进行访问。

多年来，来自 OpenAI 和 Anthropic 的美国闭源模型在性能上远超美国和中国的开源替代品。即使是资源充足的内部尝试使用开源模型也面临困难：彭博社试图利用在其收集的大量财经新闻和文档上训练的开源模型来创建一个内部工具 BloombergGPT，结果却发现它在金融知识方面落后于 OpenAI 的封闭模型。

然而在过去的一年里，DeepSeek 和阿里巴巴等中国公司取得了巨大的技术进步。根据独立AI基准测试公司 Artificial Analysis 追踪的指标，它们的开源产品现在在许多领域非常接近甚至匹配领先的美国封闭模型的性能。

“差距真的在缩小，”Fireworks AI 的首席执行官、AI模型主要训练框架 PyTorch 的共同创作者 Lin Qiao 在谈到美国闭源模型和中国开源模型之间的能力差异时说。

由于性能的这种提升，像 OpenRouter 这样允许用户在不同模型之间进行选择的平台，正看到人们倾向于使用中国开源模型。

Dayflow（一款生产力应用）的创始人 Jerry Liu 估计，Dayflow 约有 40% 的用户现在选择使用开源模型。

Dayflow 围绕几个核心任务构建，如扫描屏幕截图和总结用户活动。该应用程序允许用户从多种AI模型中进行选择来完成这些任务，包括谷歌的 Gemini 和阿里巴巴的 Qwen 等较小的开源选项。

对于描述用户屏幕等任务，Liu 表示 Qwen 的表现非常稳定。“对于我的用例来说，Qwen 和 GPT-5 一样好，”Liu 说。

而且与 GPT-5 或 Gemini 不同，较小版本的 Qwen 可以以相对较低的成本甚至免费运行。Liu 说，为用户的封闭模型使用付费可能会使 Dayflow 每个人花费高达 1,000 美元，这使得更便宜的开源模型对 Dayflow 的生存至关重要。

Dayflow 的开源模型还在每个用户的个人电脑上执行所有处理，Liu 说这对那些因隐私原因不想将数据发送到云端的人很有吸引力。Liu 的个人偏好是使用开源模型将东西保存在他的设备上：“我会使用一个把我的整个屏幕传送到某个随便什么人的云端的产品吗？绝对不会。”

除了性能提升、更强的隐私保护和更低的成本外，开源模型还通过生态系统优势获得了一席之地。开源采用率的提高和开发者创建的开源资源正在鼓励更多开发者使用这些模型。

一家初创公司如何使用AI模型

Kilo Code 是AI模型的顶级初创企业消费者之一——其最常用的AI模型中有三分之一来自中国。

中国拥抱开源

美国的许多AI开发发生在私营部门，由 OpenAI 和 Anthropic 等行业巨头及其追求的封闭模型方法主导，而中国政府则更积极地参与规划国家的AI愿景。

在 11 月 1 日的一次经济讲话中，中国国家主席习近平呼吁加强“开源技术合作”。今年 3 月，中国最高经济规划机构表示有意支持开源模型生态系统。

中国实验室通常公开发布其模型，而像 OpenAI 这样的美国公司在封闭模型上取得了早期成功，并一直坚持闭源方法。

许多中国公司推出产品的速度也比美国同行快：阿里巴巴今年大约每 20 天发布一个新模型，而 Anthropic 的发布平均间隔为 47 天。

艾伦AI研究所（Allen Institute for AI）的高级研究科学家、开放模型AI生态系统专家 Nathan Lambert 告诉 NBC News，中国模型最近的进步并非侥幸。

“中国人在AI领域是真正的创新者，”Lambert 说。

“力量平衡在过去 12 个月中一直在迅速转移，”Lambert 补充道。他在他的 Substack 上广泛撰写关于中国AI发展的文章，并被认为是中国开源生态系统的专家。

美国的AI优势

硅谷的一些人迅速指出，美国模型在AI能力的尖端领域仍保持着显著优势，而且这些封闭的美国模型提供了现成的便利性和易用性，这是笨重的开放模型无法比拟的。

硅谷风险投资公司 Menlo Ventures 的合伙人 Tim Tully 表示，封闭模型仍然明显更有能力，而且通常更有用：“工具更好，生产力更好，大家建立和使用的代理框架，用 Anthropic 和 OpenAI 效果更好。它们只是运行得更好。所以闭源环境中的生态系统本身就很强。”

此外，许多公司可能会因为基于中国基础使用产品的风险——无论是真实的还是想象的——而回避使用中国模型。

“有一种感知风险，即买家对购买基于中国开放权重模型（无论是来自私营部门还是公共部门）的产品犹豫不决，”Tully 说。Menlo Ventures 是全球领先的封闭模型公司之一 Anthropic 的投资者。

9 月下旬，美国AI标准与创新中心（U.S. Center for AI Standards and Innovation）发布了一份报告，概述了 DeepSeek 流行模型带来的风险，发现与美国闭源模型相比，其安全协议被削弱，且亲中输出增加。

白宫最近的一份备忘录也指责 Qwen 的开发者阿里巴巴支持中国军队，为企业拥抱这些AI系统增添了政治障碍。

作为回应，阿里巴巴告诉《金融时报》，这些断言是“完全的胡说八道”，而且“显然是试图操纵公众舆论并诽谤阿里巴巴”。

许多观察人士还指出，过去一年发布的几个中国模型似乎大量借鉴了美国模型。一些观察人士认为，DeepSeek 的快速进步只能是来自于复制像 OpenAI 和 Anthropic 这样的美国公司的许多艰难的基础性工作。

这种动态引发了关于中国开放模型是否会继续向美国封闭模型性能靠拢，更不用说超越的问题。在过去的一年里，专家们指责中国模型可能仍然是高度有能力的“快速追随者”，依赖于美国的AI进步。

与此同时，中国公司也在探索闭源模型。10 月，阿里巴巴仅发布了其新 Qwen 系统中最大版本的闭源版本，选择不分享开源版本。

谁控制未来？

美国AI公司和联邦政府已经注意到了中国模型最近的崛起，专家们甚至将美国缺乏强大的开源模型称为对民主的“生存”威胁。

虽然 Meta 备受瞩目的 Llama 系列开源模型历来引领着美国的开源工作，但首席执行官马克·扎克伯格已表示 Meta 不打算将其所有的“超级智能”AI模型开源。近年来 Llama 模型的性能也停滞不前，这是开源用户转向表现更好的中国开源模型的原因之一。

然而，随着美国创新者试图提升美国开放模型的竞争力，美国的开源工作可能正在逐渐苏醒。

7 月，白宫发布了一份《AI行动计划》，呼吁联邦政府“鼓励开源和开放权重的AI”。

8 月，ChatGPT 的制造者 OpenAI 发布了其五年来的首个开源模型。在宣布该模型发布时，OpenAI 引用了美国开源模型的重要性，写道“广泛访问这些在美国创建的有能力的开放权重模型有助于扩展民主的AI”。

11 月下旬，总部位于西雅图的艾伦研究所发布了其名为 Olmo 3 的最新开源模型，旨在帮助用户“快速构建值得信赖的功能，无论是用于研究、教育还是应用，”其发布公告称。

艾伦研究所的 Lambert 还发起了“ATOM 项目”——即“美国真正开放模型”（American Truly Open Models）的首字母缩写。正如 ATOM 项目的宣言所宣称的：“美国已经失去了在开放模型方面的领先地位——无论是在性能还是采用率上——并且正步入进一步落后的轨道。”

“如果我们想成为AI时代的卓越国家，我们不能将生态系统中如此关键的一部分拱手让给任何国家，”Lambert 通过电子邮件告诉 NBC News。（来源）

科普 # AI模型 # 中国 # 硅谷

文章版权归作者所有，未经允许请勿转载。

苹果推出Foundation Models框架，让开发者离线使用AI模型

早报 # AI模型 # Foundation Models # 苹果

10个月前

01940

Stability AI开发者平台上线全新API 服务

科普 # Stability AI

2年前

07190

Notion 为何选择彻底重构？为智能体 AI 拆掉旧架构

科普 # Notion

6个月前

0930

AI 智能体正开始蚕食 SaaS

科普 # AI 智能体 # SaaS

4个月前

0520

暂无评论

暂无评论...