Mino

5天前更新 12 00

Mino不是一个传统爬虫工具,而是一个网页智能体平台,能将任意网站转化为可编程、可扩展、可维护的自动化工作流。

所在地:
美国
收录时间:
2025-12-23
其他站点:

互联网上 95% 的网站没有开放 API——从本地诊所预约系统、政府表格、沙龙排班页面,到供应商门户和非营利组织网站。这些“长尾”网页虽结构混乱,却是真实业务发生的地方。

TinyFish 推出的 Mino,正是为解决这一痛点而生。它不是一个传统爬虫工具,而是一个网页智能体平台,能将任意网站转化为可编程、可扩展、可维护的自动化工作流

Mino

目前 Mino 已进入公开测试版,在为 Google Hotels、DoorDash、ClassPass 等平台每月处理 3000–3500 万次智能体操作后,正式向开发者开放。

核心能力:从自然语言到确定性自动化

开发者只需提供:

  • 一个 URL
  • 一段 自然语言任务描述(如“列出过去7天所有关于‘XYZ产品’的帖子标题”)

Mino 即可返回结构化 JSON 数据

其背后流程分为两步:

  1. 智能体学习阶段:大模型分析页面结构、交互逻辑,生成可执行工作流;
  2. 确定性执行阶段:将工作流编译为无需 LLM 干预的浏览器自动化脚本,确保高可靠性和可重复性。

这一“学习 → 编译 → 执行”范式,解决了传统 LLM 智能体“幻觉”和不可靠的痛点。

关键技术特性

  • ✅ 抗变化鲁棒性:自动适应页面布局更新、动态加载、CSS 类名变更
  • ✅ 复杂流程支持:处理登录、多步骤表单、JavaScript 交互、预约流程
  • ✅ 反反爬集成:内置应对 Cloudflare、DataDome 等验证机制的策略
  • ✅ 隐私与隔离:使用隐形浏览器配置文件,避免身份泄露
  • ✅ 代理支持:可路由请求通过自定义代理池
  • ✅ 并行执行:跨多个网站或任务并行运行,提升吞吐量
  • ✅ 结构化输出:返回干净 JSON,无需后处理解析

可靠性与性能

根据 TinyFish 内部基准测试:

  • 任务成功率:85% – 95%(取决于目标网站复杂度)
  • 执行时间:几秒至几分钟
  • 沙箱限制:测试版默认限制 10 个并发任务,防止滥用
  • 企业级 SLA:宣称 99.99% 可用性,覆盖范围比传统自动化工具广 4 倍,成本约 降低 50%

开放给开发者的方式

Mino 提供三种集成路径:

  1. REST API:程序化提交任务并获取结果
  2. 可视化平台:通过 Web 界面调试和部署工作流
  3. MCP 服务器(Mino Control Plane):用于私有化部署或高安全场景

这意味着无论是快速原型验证,还是嵌入企业级数据管道,Mino 都能适配。

背后的公司:TinyFish

TinyFish 是一家总部位于帕洛阿尔托的初创公司,定位为企业级网页智能体公司(not just a scraper)。
近期完成 4700 万美元融资(投资方包括 ICONIQ、USVP),其使命是“在整个网络上运行,而不仅是索引一小部分”。

早期用户反馈指出:Mino 的真正价值,在于将炫技式的浏览器智能体演示,转化为能在后台稳定运行数千个生产级工作流的基础设施

典型应用场景

  • 市场情报:监控本地商家价格、库存或服务更新
  • 政府服务自动化:自动填写公共补贴、许可申请表单
  • 供应链集成:从无 API 的供应商门户抓取订单状态
  • 非营利组织协作:聚合收容所、社区中心的公开信息
  • 内部流程数字化:自动化员工需手动操作的 legacy 网站

数据统计

相关导航

暂无评论

none
暂无评论...