跳转到主要内容
FIRE-1 是一款 AI 代理,可增强 Firecrawl 的抓取能力。它能够控制浏览器 actions,并在复杂的网站结构中智能导航,从而实现超越传统抓取方式的全面数据提取。

FIRE-1 能做什么:

  • 规划并执行 actions,以发现并获取数据
  • 与按钮、链接、输入框及动态元素交互
  • 获取需要分页、多步流程等场景下的多页数据

如何启用 FIRE-1

启用 FIRE-1 很简单。只需在你的 /scrape 端点请求中包含一个 agent 对象即可:
"agent": {
  "model": "FIRE-1",
  "prompt": "在此输入你的详细导航指令。"
}
注意: 在抓取请求中,prompt 字段为必填项,用于精确指示 FIRE-1 如何与网页交互。对于 /extract,将使用请求正文中 prompt 参数提供的内容,因此你可以省略上面的 agent.prompt 字段。

使用 /scrape 端点的示例

下面是一个使用 FIRE-1 搭配 /scrape 端点,从 Y Combinator 的 Consumer 领域获取公司列表的快速示例:
from firecrawl import FirecrawlApp

app = FirecrawlApp(api_key="fc-YOUR_API_KEY")

# 抓取网站:
scrape_result = app.scrape_url('firecrawl.dev',
  formats=['markdown', 'html'],
  agent={
    'model': 'FIRE-1',
    'prompt': '点击“下一页”按钮浏览商品列表,直到按钮变为不可用。抓取每一页。'
  }
)

print(scrape_result)
在此场景中,FIRE-1 会智能点击 W22 按钮和 Consumer 领域按钮,并抓取这些公司。

搭配 /extract 端点使用 FIRE-1

同样,你可以在 /v1/extract 端点中使用 FIRE-1(代理),以处理需要跨页导航或与页面元素交互的复杂抽取任务。 示例:
from firecrawl import FirecrawlApp

app = FirecrawlApp(api_key="fc-YOUR_API_KEY")

# 从网站提取数据:
extract_result = app.extract(['firecrawl.dev'],
  prompt="提取此论坛帖子中的所有用户评论。",
  schema={
    "type": "object",
    "properties": {
      "comments": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "author": {"type": "string"},
            "comment_text": {"type": "string"}
          },
          "required": ["author", "comment_text"]
        }
      }
    },
    "required": ["comments"]
  },
  agent={
    "model": "FIRE-1"
  }
)

print(extract_result)
FIRE-1 已上线,当前处于预览阶段。

计费

端点基础费用代理费用(预览)备注
/scrape每页 150 点数每页 0–900 代理点数视任务复杂度而定。
/extract查看代币计算器约为非代理提取的 8 倍采用基于代币的定价。
  • 为什么 FIRE-1 更贵?
    FIRE-1 通过高级浏览器自动化与 AI 规划来与复杂网页交互,相比标准提取需要更多计算资源。
**注意:**FIRE-1 目前处于预览阶段。定价与限制可能会变更。关于 /extract 成本的最新信息,请参阅我们的代币计算器

速率限制

  • /scrape:每分钟 10 次请求
  • /extract:每分钟 10 次请求