La forma más fácil de pasar de una sola URL a un mapa de todo el sitio web. Esto es especialmente útil para:
- Cuando necesitas pedir al usuario final que elija qué enlaces extraer
- Necesitas conocer rápidamente los enlaces de un sitio web
- Necesitas extraer páginas de un sitio web relacionadas con un tema específico (usa el parámetro
search
)
- Solo necesitas extraer páginas específicas de un sitio web
Se usa para mapear una URL y obtener las URL del sitio web. Devuelve la mayoría de los enlaces presentes en el sitio.
# pip install firecrawl-py
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-TU-API-KEY")
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-TU-API-KEY")
res = firecrawl.map(url="https://firecrawl.dev", limit=50, sitemap="include")
print(res)
Los SDK devolverán el objeto de datos directamente. cURL devolverá el payload exactamente como se muestra a continuación.
{
"success": true,
"links": [
{
"url": "https://docs.firecrawl.dev/features/scrape",
"title": "Scrape | Firecrawl",
"description": "Convierte cualquier URL en datos limpios"
},
{
"url": "https://www.firecrawl.dev/blog/5_easy_ways_to_access_glm_4_5",
"title": "5 maneras sencillas de acceder a GLM-4.5",
"description": "Descubre cómo acceder a los modelos GLM-4.5 localmente, mediante aplicaciones de chat, a través de la API oficial y usando la API de los marketplaces de LLM para una integración sin fricciones..."
},
{
"url": "https://www.firecrawl.dev/playground",
"title": "Playground - Firecrawl",
"description": "Previsualiza la respuesta de la API y obtén fragmentos de código para la API"
},
{
"url": "https://www.firecrawl.dev/?testId=2a7e0542-077b-4eff-bec7-0130395570d6",
"title": "Firecrawl - La API de datos web para IA",
"description": "La API de rastreo, scraping y búsqueda web para IA. Diseñada para escalar. Firecrawl pone todo internet al alcance de agentes y desarrolladores de IA. Limpio, estructurado y ..."
},
{
"url": "https://www.firecrawl.dev/?testId=af391f07-ca0e-40d3-8ff2-b1ecf2e3fcde",
"title": "Firecrawl - La API de datos web para IA",
"description": "La API de rastreo, scraping y búsqueda web para IA. Diseñada para escalar. Firecrawl pone todo internet al alcance de agentes y desarrolladores de IA. Limpio, estructurado y ..."
},
...
]
}
El título y la descripción no siempre están presentes, ya que dependen del sitio web.
Map con el parámetro search
te permite buscar URLs específicas dentro de un sitio web.
curl -X POST https://api.firecrawl.dev/v2/map \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer TU_API_KEY' \
-d '{
"url": "https://firecrawl.dev",
"search": "docs"
}'
La respuesta será una lista ordenada, de la más relevante a la menos relevante.
{
"status": "success",
"links": [
{
"url": "https://docs.firecrawl.dev",
"title": "Firecrawl Docs",
"description": "Documentación de Firecrawl",
},
{
"url": "https://docs.firecrawl.dev/sdks/python",
"title": "SDK de Firecrawl para Python",
"description": "Documentación del SDK de Firecrawl para Python"
},
...
]
}
Especifica el país y los idiomas preferidos para obtener contenido relevante según tu ubicación y preferencias de idioma, de forma similar al punto de conexión /scrape.
Cuando especificas la configuración de ubicación, Firecrawl usará, si está disponible, un proxy adecuado y emulará la configuración de idioma y zona horaria correspondientes. De forma predeterminada, la ubicación se establece en “US” si no se especifica.
Para usar la configuración de ubicación e idioma, incluye el objeto location
en el cuerpo de la solicitud con las siguientes propiedades:
country
: código de país ISO 3166-1 alfa-2 (p. ej., ‘US’, ‘AU’, ‘DE’, ‘JP’). Valor predeterminado: ‘US’.
languages
: un arreglo de idiomas y configuraciones regionales preferidos para la solicitud, en orden de prioridad. Por defecto, el idioma de la ubicación especificada.
from firecrawl import Firecrawl
firecrawl = Firecrawl(api_key="fc-TU-API-KEY")
res = firecrawl.map('https://example.com',
location={
'country': 'US',
'languages': ['en']
}
)
print(res)
Para más detalles sobre las ubicaciones compatibles, consulta la documentación de proxies.
Este punto de conexión prioriza la velocidad, por lo que es posible que no capture todos los enlaces del sitio. Estamos trabajando en mejoras. Agradecemos mucho tus comentarios y sugerencias.